这是本节的多页打印视图。点击此处打印.

概述

计算机组成原理的基本概念，可能会在选择题中考察，看到题目能够选出答案即可。

1: 计算机系统层次结构
2: 计算机性能指标

# 计算机系统概述

## 计算机系统层次结构

- 计算机系统的基本组成
- 计算机硬件的基本结构
- 计算机软件和硬件的关系
- 计算机系统的工作原理

## 计算机性能指标

1 - 计算机系统层次结构

了解基本概念，可能在选择题中考察。

计算机系统的基本组成

硬件系统和软件系统共同构成了一个完整的计算机系统。硬件指的是有形的物理设备，是计算机系统中实际物理装置的总称。软件指的是在硬件上运行的程序和相关的数据及文档。

硬件和软件关系：硬件是计算机的物理部分，它提供了运行软件所需的基础设施，而软件则是指令集，指导硬件如何工作以执行特定的任务。

计算机硬件

冯诺依曼结构

冯·诺依曼提出的 “存储程序” 的思想奠定了当代计算机的基本结构，以此概念为基础的各类计算机通称为冯·诺依曼机，其特点如下：

计算机硬件系统由运算器、存储器、控制器、输入设备和输出设备 5 大部件 组成。
指令和数据 以同等地位存储在存储器中，形式上没有区别，但计算机应能区分它们。
指令和数据均用 二进制代码 表示，指令包含操作码和地址码，操作码指出操作的类型，地址码指出操作数的地址。
以运算器为中心，其他部件配合其工作。

其中五大部件的具体功能如下：

运算器（ALU）：负责算术运算（加减乘除）和逻辑运算（与或非）。
控制器（CU）：从存储器中读取指令，解码并控制其他部件协同工作。
存储器（Memory）：存储程序指令和运算数据（如内存、硬盘）。
输入设备（Input）：接收外部数据（如键盘、鼠标）。
输出设备（Output）：将结果反馈给用户（如显示器、打印机）。

计算机软件

系统软件和应用软件

系统软件 (System Software)
- 定义：系统软件是直接运行在硬件上的软件，为其他软件提供一个运行和执行的平台。
- 功能：
  - 管理和控制计算机硬件，使其能够与应用软件进行交互。
  - 提供应用软件开发的基础服务和接口。
应用软件（Application Software）
- 定义：应用软件是构建在系统软件之上，为用户提供特定功能或执行特定任务的软件。
- 功能：
  - 解决用户的具体问题或满足特定需求。
  - 提供与用户的直接交互界面。

三个级别的语言

机器语言 (Machine Language):
- 定义：这是计算机硬件直接理解和执行的语言，它是用二进制代码表示的（通常是 0 和 1）。
- 特点：
  - 与特定计算机架构紧密相关。
  - 非常低级：每条机器代码对应硬件的一个操作。
  - 对于人类来说，阅读和编写是困难的。
汇编语言 (Assembly Language):
- 定义：这是一种低级编程语言，它使用符号和助记符（而非二进制代码）来代表机器语言的指令。
- 特点：
  - 与特定计算机架构紧密相关。
  - 比机器语言更容易理解和编写。
  - 需要一个汇编器来将汇编代码转换为机器代码。
高级语言 (High-Level Language):
- 定义：这是为了更方便地编写和理解计算机程序而设计的语言。它们与特定的计算机架构相对独立。
- 特点：
  - 抽象度高，语法通常更接近自然语言或数学符号。
  - 可以在不同的硬件平台上运行，只需适当地编译或解释。
  - 需要一个编译器或解释器来将高级语言代码转换为机器代码（或执行）。

计算机系统的工作原理

从源程序到可执行程序

预处理（Preprocessing）：预处理器会执行诸如宏替换、文件包含、条件编译等任务，仅限于某些语言，比如 C 和 C++。
编译（Compilation）：编译器将源代码或预处理后的源代码转换为中间代码或目标代码，标代码通常是特定平台的汇编语言代码或机器代码。
汇编（Assembly）：汇编器将汇编语言代码转换为机器代码。
链接（Linking）：链接器将一个或多个目标文件与所需的库文件链接在一起，生成一个可执行文件。这个步骤确保所有函数或方法的调用都能找到它们在内存中的正确位置。
加载和执行（Execution）：当你运行可执行文件时，操作系统的加载器会将它加载到内存中。CPU 开始按照程序的指令执行任务。

# 预处理
gcc -E hello.c -o hello.i
# 编译
gcc -c hello.c -o hello.o
# 汇编
gcc -S hello.c
# 链接
gcc hello.o -o hello
# 加载和执行
./hello

2 - 计算机性能指标

需掌握计算机的各种性能指标，为后续内容的基础，常常在选择题中考察。

CPU 指标

时钟周期

时钟周期（Clock Cycle）是计算机中 CPU 执行指令的基本时间单位，由系统时钟产生的一个“高低电平”变化（通常称为脉冲）所定义。

计算机内部有一个晶体振荡器，通常采用石英晶体，利用其压电效应产生规律的脉冲信号。石英晶体在施加电压时会发生机械振动，而机械振动反过来又会产生电压。通过在电路中合理配置电容和电感元件，晶体振荡器能够在特定频率上持续振荡，形成稳定的机器脉冲源。

原始的脉冲信号是一个连续的模拟信号，在计算机系统中，这个模拟信号通常不会直接使用。为了适配数字电路的需要，晶体振荡器产生的模拟信号会经过整形和分频电路处理，转换为方波形式的数字脉冲信号，用于同步计算机中各个硬件组件的操作。时钟脉冲信号的宽度，即连续两个脉冲之间的时间间隔，称为时钟周期。

注意

计算机中所有的设备都使用相同的时钟周期么？

不一定。某些组件（如 CPU 和内存等）需要同步工作，但不同的设备可能使用不同的时钟周期。

因此计算机内部的设备之间的同步方式可以分为同步和异步两种。同步设备使用相同的时钟信号，而异步设备则使用不同的时钟信号或不使用时钟信号。

主频

主频（CPU Frequency），是指中央处理器（CPU）的时钟频率（Clock Frequency），表示 CPU 每秒可以执行多少个基本时钟周期。时钟周期和主频互为倒数：

$$\text{\small Frequency} = \frac{1}{\text{\small Clock Cycle}}$$

其单位通常是 MHz（兆赫）或 GHz（千兆赫）。它决定了时钟振荡的快慢：

1 Hz：每秒 $1$ 次时钟振荡
1 MHz = $10^{6}$ 次/秒
1 GHz = $10^9$ 次/秒

比如，一个 3.0 GHz 的 CPU，主频是 3,000,000,000 Hz，意味着它每秒经历 30 亿个时钟周期。

指令执行指标

CPI

CPI（Cycle Per Instruction）：也称 指令周期，即一条指令所需要的平均时钟周期。

下图展示了指令周期、机器周期和时钟周期三者的关联：

三者具有层级关系：时钟周期 < 机器周期 < 指令周期。

时钟周期是硬件层面的最小时间单位。
机器周期是由多个时钟周期组成，用于完成一个基本操作（如取指令、存储数据）。
指令周期是由多个机器周期组成，用于完成一条指令的执行。

IPC

IPC（Instruction Per Cycle）：也称 每周期指令，即每个时钟周期执行的平均指令数，是 CPI 的倒数。

$$\text{\small IPC} = \frac{1}{\text{\small CPI}}$$

IPS

IPS（Instruction Per Second）：也称 每秒指令数，即每秒平均能够执行多少条指令。

$$\text{\small IPS} = \frac{\text{\small 主频}}{\text{\small CPI}}$$

MIPS

MIPS（Million Instructions Per Second）：也称 每秒百万指令数，即每秒能够执行多少个百万的指令。

$$1 \text{\small MIPS} = 10^{6} \text{\small IPS}$$

浮点运算指标

FLOPS

FLOPS（Floating-point Operations Per Second，每秒浮点运算次数）是衡量计算机浮点运算性能的指标，它表示处理器每秒能执行的浮点运算次数，通常用来评估 GPU 或 AI 芯片的性能。

MFLOPS（Million FLOPS）: 百万（$10^{6}$）次每秒
GFLOPS（Giga FLOPS）: 十亿次（$10^9$）每秒
TFLOPS（Tera FLOPS）: 万亿（$10^{12}$）次每秒
PFLOPS（Peta FLOPS）: 千万亿（$10^{15}$）次每秒
EFLOPS（Exa FLOPS）: 百亿亿（$10^{18}$）次每秒
ZFLOPS（Zetta FLOPS）: 万亿亿（$10^{21}$）次每秒

每次指标提升都是 $\times 10^3$，比如 $\text{\small GFLOPS} = 10^3 \text{\small MFLOPS}$。

计算机指标

字长

字长（Word Length）指的是计算机在内部一次操作中所能处理的二进制数字位数。例如，一个 32 位的 CPU 一次可以处理 32 位的数据。

数据通路带宽（Data Bus Width）

数据通路带宽是 CPU 和内存之间传输数据的宽度，通常以位为单位表示。比如，64 位的数据总线意味着每个时钟周期内，可以传输 64 位的数据。

主存容量

主存储器能够存储信息的最大容量，通常用字节来衡量。

MAR 的位数反应了可寻址范围的最大值（不一定是存储器的实际容量)，与地址总线的位数一致。

这里主要看清题目中的 按字节寻址 和 按字寻址，内存空间 / 寻址单位 = 可寻址范围，通过可寻址范围计算 MAR 的位数。

比如主存地址空间大小为 128KB = $2^{17}$B，字长 16 位（2B），按字寻址，则 MAR 位数为 16。

吞吐量

吞吐量（Throughput）表示在单位时间内，系统可以完成的任务数量。在计算机网络中，它可能表示数据的传输速率；在计算中，它可能表示每秒执行的操作数。