这是本节的多页打印视图。点击此处打印.

进程管理

重点内容，在选择题和大题中都会考察。主要分为进程、CPU 调度、同步和互斥以及死锁四个部分，需熟练掌握。

1: 进程和线程
2: 处理机调度
3: 同步和互斥
4: 经典同步问题
5: 死锁

# 进程管理

## 进程和线程

- 进程、线程概念
- 进程、线程状态和转换
- 线程的实现
- 进程、线程的组织和控制
- 进程间通信

## CPU调度和上下文切换

- 概念和目标
- 调度实现方式
- 调度算法
- 上下文及其切换机制

## 同步与互斥

- 概念
- 软件和硬件实现方法
- 锁
- 信号量
- 条件变量
- 经典同步问题

## 死锁

- 概念
- 死锁预防
- 死锁避免
- 死锁检测和解除

1 - 进程和线程

进程和线程

🔥 高优先级

真题练习

进程的相关概念 是历年操作系统选择题必考，关键在于几点：进程和线程、进程状态转换、进程内存空间的架构。

在多道程序环境下，允许多个程序并发执行，为此操作系统引入了进程 (Process) 的概念，以便更好地描述和控制程序的并发执行，实现操作系统的并发性。

进程

进程是系统资源分配的基本单位。进程拥有独立的系统资源，包括内存空间、文件描述符、CPU 时间片等，这些资源的分配由操作系统负责。

进程和程序

程序是 静态的，进程是 动态的，进程可以理解成运行的程序，两者的具体区别如下：

程序
- 程序是一组指令的静态集合，它存储在磁盘等持久性存储介质中。
- 程序是被动的，它本身并不执行任何操作。
- 一个程序可以多次运行，每次运行都会创建一个新的进程。
进程
- 进程是程序在内存中执行的实例。
- 当一个程序被加载到内存中并开始执行时，操作系统会创建一个进程。
- 进程是动态的，它代表了程序的执行过程。

进程控制块

操作系统通过 进程控制块（PCB，Process Control Block）对进程进行管理，进程控制块中包含一系列 进程的元信息，这些元信息帮助操作系统对进程进行管理：

进程描述信息	进程控制和管理信息	资源分配清单	处理机相关信息
进程标识符（PID）	进程状态	代码段指针	通用寄存器值
用户标识符（UID）	进程优先级	数据段指针	地址寄存器值
	代码运行入口地址	堆栈段指针	控制寄存器值
	程序的外存地址	文件描述符	标志寄存器值
	等待时间
	CPU 占用时间

上表给出了 PCB 的关键内容，其中进程描述信息用于唯一标识和管理进程，以及实现用户级别的权限控制；进程控制和管理信息用于管理进程的生命周期、调度和执行；资源控制清单记录进程使用的资源，以便进行有效的资源管理和分配；处理机相关信息保存与处理器相关的状态信息，以实现上下文切换。

进程控制块 在操作系统进程管理的多个阶段都发挥重要作用：

进程创建和终止：在进程创建时，操作系统为它新建一个PCB（进程控制块）。该结构在进程存在期间常驻内存，可以随时存取，并在进程结束时删除。
进程调度：当操作系统进行进程调度时，会根据PCB中存储的信息（如优先级、进程状态）来决定哪个进程应该获得CPU的控制权。

父子进程

在操作系统中，进程是程序执行的基本单位。父子进程 是指通过 进程创建机制 生成的一种层级关系：

父进程：创建新进程的进程。
子进程：由 父进程 创建的进程。

子进程 通常由 父进程 通过 fork 系统调用 建立。子进程是父进程的副本，继承父进程的代码段、数据段、堆栈等资源，但拥有自己的独立地址空间和执行状态。两者可以通过进程间通信（IPC）机制（如管道、信号、共享内存）进行数据交换或同步。

fork 系统调用的声明为 pid_t fork(void)，其返回值为一个整数，可以用于判定该程序是 父进程 还是 子进程：

在 父进程 中，返回值为 子进程 的 pid（pid > 0）。
在 子进程 中，返回值为 0。

fork 调用后，父进程 和 子进程 从 fork 调用后的下一条指令开始继续执行。子进程 获得 父进程 的代码、数据和堆栈的副本，但两者地址空间独立。

除了 fork 系统调用外，还有一个 exec 系统调用，两种具有不同的功能，需要能够区分：

fork：创建 子进程，复制资源，不改变程序，父子进程 继续执行原代码。
exec：在当前进程中加载并执行一个新的程序。替换当前进程的 代码段、数据段 和堆栈，保留部分资源如 进程 PID，不涉及到并发。

此外，父进程 可以通过 wait 系统调用等待 子进程 执行结束，并获取 子进程 的退出状态，防止进程成为 僵尸进程。

注意

僵尸进程（Zombie Process）是指一个已经终止（完成了其执行）的 子进程，但其 父进程 尚未通过 wait 或 waitpid 系统调用回收其退出状态。僵尸进程 虽然不再运行，但仍在 进程表 中保留一个条目，占用系统资源，直到 父进程 回收或 父进程 终止。

孤儿进程（Orphan Process）是指 父进程 在 子进程 终止前退出，导致 子进程 失去 父进程 的进程。孤儿进程 与 僵尸进程 不同，它仍在运行，只是失去了原来的 父进程。

下表给出了两者的对比：

项目	僵尸进程（Zombie Process）	孤儿进程（Orphan Process）
状态	已经终止（执行完毕）	仍然在运行
父进程是否存在	存在，但未调用 `wait()`/`waitpid()` 回收子进程状态	父进程已终止
占用资源	占用进程表项（PID 仍存在），不占用内存等资源	占用资源，正常运行中

线程

线程是系统调度的基本单位。多核处理器可以将系统中的不同线程调度到不同的 CPU 逻辑核心上，所以在同一个时刻，系统中的线程可能会在不同的逻辑核心上并行运行。

每个进程启动的时候，都包含一个线程（主线程），可以在主线程外创建更多的线程。

如上图所示，一个进程中的所有线程都共享 虚拟地址空间 和系统资源，但是每个线程都维护自己的堆栈、寄存器和一些额外信息。

在一个进程中没有创建线程时，则该进程为 单线程进程，否则该进程中包含多个线程。

单线程进程 只有一个线程，独占进程的虚拟地址空间和系统资源，如文件描述符和内存。线程维护自己的堆栈和寄存器，无需同步，但无法利用多核CPU，且阻塞会影响整个进程，适合简单任务，但并发性和响应性较差。

多线程进程 包含多个线程，共享虚拟地址空间和系统资源，如代码段和堆，便于高效通信。每个线程有独立的堆栈、寄存器和线程ID，需通过锁等机制同步以避免资源竞争。

进程的状态

进程状态 是指在操作系统中，一个进程在执行过程中的不同阶段。它反映了进程当前正在做什么，以及是否可以被 CPU 执行。

状态种类

不同的操作系统对 进程状态 的划分可能不同，但常见的包括以下几种：

创建状态（New）：当进程被创建但还未分配资源或执行时，它处于 创建状态。
就绪状态（Ready）：在 就绪状态 中，进程已准备好执行，但由于操作系统调度算法或其他原因，尚未获得 CPU 时间片。
运行状态（Running）：在 运行状态 中，进程正在执行指令并占用 CPU。
阻塞状态（Blocked）：当进程在等待某些事件发生时，如等待 I/O 操作完成或等待其他资源时，它会进入 阻塞状态。在 阻塞状态 下，进程暂停执行，直到等待的事件发生。
终止状态（Terminated）：当进程执行完毕或被操作系统终止时，它进入 终止状态。

状态转化

就绪态 → 运行态
- 调度：当操作系统的调度器选择一个就绪状态的进程分配给处理器时，该进程就会从就绪状态转换到运行状态。
运行态 → 就绪态
- 时间片用完：如果系统使用时间共享调度，当进程的时间片用完，它会被中断并放回就绪队列。
- 优先级更高的进程就绪：在优先级调度算法中，如果一个优先级更高的进程变为就绪状态，当前运行的进程可能会被挂起。
- 自愿放弃 CPU：进程可能主动放弃CPU，比如它发出了一个系统调用请求其他资源。
运行态 → 阻塞态
- I/O 请求：进程进行I/O操作，由于I/O设备比CPU慢得多，进程会被挂起直到I/O完成。
- 等待资源：进程等待不可用的资源，如信号量、互斥锁等。
- 等待事件：如等待其他进程的信号、消息或者某个条件的发生。
阻塞态 → 就绪态
- I/O 完成：当 I/O 操作完成，相应的进程会被移至就绪队列。
- 资源获得：进程所等待的资源变得可用，如获得了互斥锁。
- 事件发生：进程所等待的事件发生了，如接收到了另一个进程发出的信号。

进程内存空间

用户空间（User Space）：包含进程执行的用户程序代码和数据。在 用户空间 中，进程可以执行各种任务，如运行应用程序、访问文件系统等。用户空间 对于应用程序是可见的，但对于操作系统中的核心功能是不可见的。
1. 代码区（Text Segment）：也称为“可执行代码区”，存储了进程的可执行代码，包括程序的指令和只读数据。这个区域通常是只读的，因为程序的指令在运行时不应被修改。
2. 数据区（Data Segment），数据区分为两个子区域：
  - 初始化数据区（Initialized Data Segment）：存储全局和静态变量以及初始化的数据。这些变量在程序运行前就已经分配了内存并初始化。
  - 未初始化数据区（Uninitialized Data Segment），也称为 BSS（Block Started by Symbol）段，存储全局和静态变量，但这些变量没有显式的初始化值。操作系统会在程序启动时自动将这个区域初始化为零。
3. 堆区（Heap）：堆区是动态分配内存的地方，用于存储程序运行时需要的变量和数据结构。在堆中分配的内存需要手动释放，以避免内存泄漏。
4. 栈区（Stack）：栈区用于存储函数调用和局部变量。每个函数调用都会在栈上创建一个栈帧，栈帧包含了函数的参数、局部变量以及函数返回地址。栈是一种后进先出（LIFO）的数据结构，它的大小通常有限，由操作系统或编程语言定义。
5. 内存映射区域（Memory Mapped Region）：这是一些操作系统或运行时库的扩展，用于存储动态链接库（DLL）和共享库的信息以及其他系统数据结构。
内核空间（Kernel Space）：内核空间 包含了操作系统的核心代码和数据结构，如页表、调度程序和系统调用接口等。内核空间 具有更高的特权级别，可以执行特权指令并且访问系统的各种资源，内核空间 对于用户程序是不可见的。

函数调用时内存结构

EBP (base pointer) 指向函数栈（栈帧）的底部（高地址），函数执行过程中在栈帧中分配局部变量，栈帧由高地址向低地址增长，ESP（stack pointer）一直指向栈顶。

每个函数的栈帧中包含如下内容：

上一个函数的 EBP
该函数的局部变量
如果函数内有 call 指令的话，还需要保存额外信息：
- 下一个函数的参数：依次存储从第 n 个到第 1 个，从高地址到低地址
- 返回地址：当前 PC 指向的位置，即 call 指令的下一条指令的地址

在函数的调用过程中，调用函数叫做 caller，被调用函数叫做 callee。当我们从 caller 中调用 callee 时，callee 的 EBP 指向的物理地址的上下存储单元分别包含 caller 的返回地址以及 caller 所在栈帧的 EBP，当我们在 callee 中执行 ret 指令时，计算机可以跳转到 caller 中 call 指令的下一条并开始执行，同时 caller 的栈帧也会被恢复。

进程间通信

💡 低优先级

真题练习

偶尔在选择题考察，了解基本 IPC 方式，选择题看到能辨识即可。

进程间通信（Inter-Process Communication，IPC）是指在同一计算机系统中，两个或多个进程之间交换数据或信号的机制。常见的 进程间通信 方式主要包含 共享内存、管道、消息队列、信号、套接字 和 信号量。

管道

管道是一种最基本的 进程间通信 方式，主要用于具有亲缘关系的进程之间的数据传递。它分为 无名管道 和 有名管道，其中 无名管道 只能在 父子进程 或 兄弟进程 之间使用，而 有名管道（FIFO）通过文件系统中的特殊文件实现，不要求通信双方存在亲缘关系。

管道以 字节流 的形式传输数据，具备先进先出的特性，但 只支持单向通信，并且效率相对较低，适用于简单的任务传递。

# 在 linux shell 中使用 | 操作符创建一个管道通信
# cat 进程的标准输出（stdout）会从管道输入到 grep 进程的标准输入（stdin）
cat file.txt | grep word

共享内存

共享内存 是效率最高的一种 进程间通信 方式，允许多个进程将同一段 物理内存 映射到各自的 虚拟地址空间 中，从而直接读写该区域的数据。

由于不需要内核频繁介入，通信效率极高，非常适合大规模数据的快速传输。然而，由于多个进程可同时访问内存区域，必须通过额外的同步机制如 信号量 或 互斥锁 来确保数据一致性，否则容易出现竞争条件和数据错误。

消息队列

消息队列 是一种基于内核的数据结构，允许多个进程以消息为单位进行通信，具有良好的结构化和独立性。进程通过系统调用将消息发送到队列中或从中接收消息，可以实现同步与异步的通信模式。

相比管道，消息队列 的通信更加灵活，支持优先级管理，适用于需要有序、分类传输数据的场景。但由于涉及内核操作，性能开销相对 共享内存 较大。

用户级线程和内核级线程

💡 低优先级

真题练习

偶尔在选择题考察，了解几种线程模型和映射关系，选择题看到能辨识即可。

用户级线程（ULT，User Level Thread）
- 用户级线程 是由应用程序通过线程库来实现的，操作系统内核并不直接感知到这些线程的存在。
- 线程的创建、调度和管理都由应用程序在 用户空间 完成。
内核级线程（KLT，Kernel Level Thread）
- 内核级线程 是由操作系统内核直接支持的线程。
- 线程的创建、调度和管理都由 操作系统内核 完成。

线程模型

操作系统中的 线程实现方式 称为 线程模型，不同的 线程模型 在 用户级线程（ULT）和 内核级线程（KLT）的设计上各有不同。

系统中的 线程模型 可以分为如下三种：

纯用户态：所有的线程操作都在用户空间中进行，内核对线程的存在一无所知。
纯系统态：线程由操作系统内核直接支持和管理，内核负责线程的创建、调度和管理。
混合方案：应用程序可以在用户空间管理多个用户级线程，这些线程映射到较少数目的内核级线程。

混合方案中的映射关系

如果使用 混合方案 的 线程模型 的话，用户级线程 和 内核级线程 的映射方式也可以分为如下几种：

一对一：每一个用户级线程都对应一个内核级线程。
多对一：多个用户级线程映射到同一个内核级线程上。
多对多：多个用户级线程映射到多个内核级线程上。

2 - 处理机调度

🔥 高优先级

真题练习

选择题必考内容，重点掌握 调度指标的计算 和 各种调度算法的实现细节，调度的实现和进程上下文切换相比之下考察比较少。

调度指标

在操作系统里，调度（Scheduling）是把 CPU 时间合理分配给多个进程（或线程）的核心机制。调度的好坏直接决定系统的响应速度、吞吐能力以及资源利用效率。为了衡量调度策略的优劣，我们通常用一组 调度指标 来量化：

系统层面的宏观指标——关注整个计算机系统的运行状态，如 CPU 的利用率、系统整体的吞吐量等。这类指标帮助我们了解系统在整体负载下是否“忙碌”或出现瓶颈。
进程层面的微观指标——关注单个进程在调度器眼中的表现，包括它何时进入调度队列、等待多久才被分配 CPU、实际执行多长时间以及最终何时完成等。这类指标可以帮助我们比较不同调度算法（FCFS、SJF、RR、优先级调度等）对单个作业的影响。

系统层面

系统层面主要关注 CPU 利用率和吞吐量这两个指标：

系统指标	含义
CPU 利用率	CPU 活跃时间与总观察时间的比率。通常表示为百分比
系统吞吐量	操作系统单位时间内系统完成的工作量或进程数

进程层面

从进程视角而言，进程从被创建到执行结束会有一系列时间周期作为指标：

进程调度指标	英文	含义
到达时间	AT, Arrival Time	进程在何时到达调度器，即何时被提交
等待时间	WT, Waiting Time	进程等待了多长时间才开始执行
要求服务时间	BT, Burst Time	进程从开始执行到结束需要多少时间
完成时间	CT, Completion Time	进程何时执行完成
周转时间	TAT, Turnaround Time	进程从提交到完成的时间，TAT = CT - AT = WT + BT

系统调度过程

为了有效地管理和调度进程，操作系统通常采用多级调度机制。这些调度机制分为三个层次：高级调度、中级调度和初级调度。

高级调度（长程调度，Long-term Scheduling）:
- 功能：高级调度 主要决定哪些进程应当被加载到内存中成为一个可运行的进程。
- 主要目标：保持内存中适当数量的进程。不要过多也不要过少。
- 当进程首次进入系统时，它们首先被放置在磁盘的一个区域，称为作业池。高级调度器从作业池中选择进程，根据某种策略将其加载到内存中，从而使其成为一个可运行的进程。
中级调度（中程调度，Mid-term Scheduling）:
- 功能：中级调度 涉及到进程的暂停和重启。当系统的进程数超过内存容量时，中级调度器可能会将一些进程从内存移出到磁盘上（这称为交换或页面置换），从而为新的或等待的进程腾出空间。
- 主要目标：为高级调度和初级调度器优化内存使用。
- 中级调度器在必要时将进程从内存交换到磁盘，并在适当的时机将其交换回内存。
初级调度（短程调度，Short-term Scheduling）:
- 功能：初级调度 决定哪个进程应当被赋予 CPU 时间片，即决定下一个运行在处理器上的进程。
- 主要目标：确保 CPU 的高效利用。
- 它的决策频率非常高，因为在多任务环境中，每个时间片的长度可能只有几十毫秒。因此，初级调度器必须是非常快速的。

调度的实现

调度器

调度器/调度程序（scheduler）:

调度器是操作系统中负责决定下一个要执行的进程或线程的部分。
基于特定的调度算法（如轮转、优先级调度、短作业优先等），它决定哪个进程或线程应当获得 CPU 时间。
调度器通常分为长程、中程和短程调度器，如前文所述。

调度时机

调度的时机可能包括以下情况：

进程进入或退出系统
进程从运行状态变为阻塞状态
或者一个时间片结束。

调度方式

抢占式调度（Preemptive）：在这种调度方式下，当一个进程正在执行时，操作系统可以中断该进程的执行并将 CPU 分配给另一个进程。这常常发生在一个更高优先级的进程变为就绪状态时。
非抢占式调度（Non-Preemptive）：在这种方式下，一旦 CPU 分配给一个进程，它会继续运行直到完成或者转为非运行状态（例如，等待 I/O 操作）。

闲逛进程

闲逛进程（Idle Process）是操作系统中的一个特殊进程，当系统没有任何其他可运行的进程时，调度器会将 CPU 的控制权交给这个进程。闲逛进程的主要目的是确保在没有任务可执行的情况下，CPU 不会空转，从而防止 CPU 进入不受控制的状态。

在 Linux 操作系统中，闲逛进程的进程 ID 通常是 0，被称为 swapper 或 idle task。它是系统启动时创建的第一个进程，始终在内核态运行，确保当没有其他可调度任务时，CPU 有事情可做。

在 Windows 系统中，闲逛进程被称为 System Idle Process，同样用于在系统空闲时占据 CPU 时间，以维持系统的运行稳定。如下图所示：

system idle process

两种线程的调度

内核级线程：由操作系统内核直接支持的线程。操作系统知道这些线程的存在，并可以直接进行调度。
用户级线程：完全在用户空间中实现的线程，不需要内核的介入。
对于 内核级线程，操作系统可以直接调度它们，并可以利用多核或多处理器的优势。
对于 用户级线程，因为内核不知道它们的存在，所以内核无法直接调度它们。线程之间的上下文切换可能比 内核级线程 更快，但在多处理器系统中，它们可能无法充分利用所有的处理器。

调度算法

根据是否抢占可以对调度算法进行如下分类：

非抢占型调度算法：先来先服务、最短任务优先、最高响应比优先
抢占型调度算法：时间片轮转、多级反馈队列

先来先服务

先来先服务（First-Come, First-Served，FCFS）按照进程到达的顺序 分配依次执行。先到达的进程先执行，后续进程等待直到前一个进程执行才能进一步执行。

最短作业优先

最短作业优先（Shortest Job First，SJF）算法在从就绪队列中选择进程时，会 选择运行时间最短 的进程进行执行。

在题目中进程的运行时间一般都是给定的，所以 SJF 算法比较容易实现。但是在真实的系统中进程的运行时间是不确定的，所以在使用该算法时操作系统需要对进程的运行时间进行预估。

最高响应比优先

最高响应比优先（Highest Response Ratio Next，HRRN）算法从就绪队列中选择 响应比 最高的进程进行执行。

其中 响应比（Response Ratio）的计算公式如下：

$$\text{Response Ratio} = \frac{W + B}{B}$$

其中 $W$（Waiting Time）为进程的等待时间，$B$（Burst Time）为进程的要求服务时间（从执行开始到结束所需时间）。

这种计算策略可以有效地避免饥饿现象，即一个进程等待了很长时间但仍没有得到执行。一个进程的等待时间越长，其 响应比 就会更大，进而优先得到执行机会。一个进程的执行时间很长，其 响应比 就会越小，会优先调度其他进程。

时刻 0：只有 P1 到达，执行 P1。
时刻 5：P1 执行完成。P2 的 响应比 为 (4 + 3) / 3 ≈ 2.33，P3 的 响应比 为 (3 + 8) / 8 = 1.375，P4 的 响应比 为 (2 + 6) / 6 ≈ 1.33，此时 P2 的 响应比 最大，执行 P2。
时刻 8：P2 执行完成。P3 的 响应比 为 (6 + 8) / 8 = 1.75，P4 的 响应比 为 (5 + 6) / 6 ≈ 1.83。此时 P4 的 响应比 更大，执行 P4。
时刻 14：P4 执行完成，只剩下 P3 了，最后执行 P3。

所以进程的执行顺序为 P1、P2、P4、P3，每个进程的时间指标如下表所示：

进程号	到达时间	要求服务时间	完成时间	周转时间	等待时间
P1	0	5	5	5	0
P2	1	3	8	7	4
P4	3	6	14	11	5
P3	2	8	22	20	12

优先级调度

优先级调度是一种基于进程优先级的调度算法，广泛应用于操作系统中。根据是否允许中断当前正在执行的进程，优先级调度可分为 非抢占式优先级调度 和 抢占式优先级调度 两种形式。

非抢占式优先级调度

在 非抢占式优先级调度 中，调度器总是从就绪队列（等待队列）中选择优先级最高的进程执行。一旦某个进程开始执行，它将持续运行直到完成（或主动释放 CPU，例如进入等待 I/O 状态）。在此期间，即使有更高优先级的进程到达并加入就绪队列，当前进程也不会被中断，而是继续执行直到结束。

抢占式优先级调度

抢占式优先级调度旨在确保系统中任何时刻运行的进程始终是优先级最高的。当一个更高优先级的进程到达时，调度器会立即暂停当前运行的低优先级进程（将其挂起并加入就绪队列），然后将 CPU 分配给新到达的高优先级进程。

下图给出了两种优先级调度方式的实例对比，其中绿色的进程表示执行态，黄色表示就绪态：

时间片轮转

时间片轮转（Round Robin，RR）这是一种基于 时间片 的算法，每个进程被分配一个固定的时间片，当时间片用完时，进程被放回队列尾部，下一个进程开始执行。这样可以实现公平的 CPU 时间分配。

上图中给出了每个进程的到达时间和要求服务时间，调度器按照轮询的方式依次遍历进程，每个进程只有执行时间片内的时间，之后便进入等待状态。

多级反馈队列

多级反馈队列（Multilevel Feedback Queue）这是一种混合算法，将进程分为 多个队列，每个队列有不同的优先级和时间片大小。

高优先级队列优先调度，时间片较短，适合交互型进程；低优先级队列时间片较长，适合计算密集型任务。新进程通常进入最高优先级队列，若在时间片内未完成，则移到下一级队列；若因 I/O 等待阻塞，完成后可能返回较高优先级队列。

多级反馈队列根据进程行为调整其优先级。例如，占用 CPU 过多的进程会被降级，而频繁等待 I/O 的进程可能被提升。这种设计兼顾了快速响应、公平性和资源利用率。

上下文切换

进程的上下文是进程执行的环境。在操作系统中，它指的是一个进程在特定时间点上的系统状态，包括多种信息，这些信息使得进程在被中断后可以再次恢复并继续执行。当操作系统从一个进程切换到另一个进程时，它会保存当前进程的上下文并恢复下一个进程的上下文。这个过程被称为 上下文切换。

进程上下文内容

寄存器值：这包括通用寄存器、程序计数器、栈指针、状态寄存器等。它们保存了进程的当前执行位置和状态。
程序计数器：表示进程的下一个指令的位置。
虚拟内存信息：这包括进程的页表、页目录等信息，描述了进程的地址空间布局。
I/O 状态信息：包括打开的文件描述符、网络连接、I/O 指针等。
CPU 调度信息：例如进程优先级、计划器状态等。
资源使用情况：这可能包括该进程所使用的各种资源的跟踪信息，如内存、文件句柄等。

上下文切换流程

保存当前进程的状态：操作系统保存当前正在运行的进程的上下文。这意味着它会将当前的寄存器值、程序计数器等保存到进程的进程控制块（PCB）中。
选择下一个要执行的进程：调度器决定下一个要运行的进程。
恢复下一个进程的状态：操作系统从新进程的 PCB 中恢复其上下文信息，包括寄存器值、程序计数器等。
开始执行新进程。

3 - 同步和互斥

🔥 高优先级

同步和互斥是解答题同步问题设计的基础，也是每年必考点，重要性这里就不多赘述了，这一节的每个知识点的细节都要深入掌握。

临界区和互斥

在并发编程中，临界区（Critical Section）是指一个程序中仅允许 一个线程 或进程访问的代码片段。这些代码通常会访问 共享资源，比如内存、文件、数据库等。当多个线程或进程试图同时访问这些共享资源时，可能会导致数据不一致或其他并发问题。因此，需要一种机制来确保在任何时候，保证在 一个时刻只有一个线程或进程 能够访问 临界区 的代码。

这种机制就叫做互斥：

互斥（Mutual Exclusion）是计算机科学中一种用于防止多个进程或线程同时访问共享资源或 临界区 的机制。其主要目标是避免资源竞争和数据不一致的问题。互斥保证在任何时刻，最多只有 一个线程或进程 可以访问特定的共享资源，从而确保数据的完整性。

临界资源

临界资源 就是 共享资源，共享资源可以被多个 线程/进程 同时访问。
比如一个进程的 全局变量 可以被该进程内的多个线程同时访问，这个全局变量对于多个线程就是 临界资源。
再比如数据库中的某个数据可以被多个进程同时访问，这个数据对于这些进程来说就是 临界资源。

提示

有 进程间的互斥，也有 线程间的互斥。在实际考察过程中，更多考察的是 线程间的互斥。

下文中介绍互斥相关概念时统一使用线程一词替代进程/线程，请读者区分。

为何需要互斥

在处理器调度一节我们知道，为了避免 进程饥饿，现代操作系统常使用 时间片轮转 的方式来避免一个进程连续执行过长时间。

这意味着进程可能在执行完当前的机器指令后就被操作系统中断，由 运行态 进入 就绪态，然后等待下一次调度继续执行后续指令。
这种随时可能被中断的特性决定了若没有 临界区的互斥，多线程并发执行时 结果可能会出现不一致性。

如上图所示，一条高级语言语句常对应着多条汇编语句，而进程执行完汇编语句后可能立刻会被中断。
所以高级语言语句的执行并不具备 原子性，也许在进程在执行到一半的情况下就被迫终止了。

临界区 涉及到对于 临界资源 的访问，如果多个线程同时执行 临界区 代码访问 临界资源 时，实际执行的指令序列就具有不可预测性，结果也因此常常出现 不一致的情况。

为了解决以上问题，多线程在访问 临界资源 时必须是互斥的。也就是说，当一个线程在访问 临界资源 的过程中，不允许其他线程再访问临界资源。其他线程必须等待到当前访问者访问完，才能进入 临界区。

需要注意的是，互斥并不表示线程在执行临界区代码的过程中不会被操作系统中断。

互斥是一种逻辑上的概念，它保证了多个线程不能同时进入临界区。线程 A 可能在执行临界区代码的过程中被中断，但是与之互斥的线程 B 同样不能在线程 A 被中断之时进入临界区。

互斥

实现互斥的方法主要包含如下几种：

方法	说明
软件互斥	依赖算法和程序设计来确保临界资源的独占
硬件互斥	使用 CPU 指令集中的原子指令来实现临界资源的独占
锁	操作系统提供的 API，软件直接调用即可实现资源独占
信号量	操作系统提供的 API，可以用信号量来实现锁的功能

互斥锁

互斥锁（Mutex，Mutal Exclusion）是操作系统提供的 同步原语，用以实现多线程对于 临界资源 的互斥。
互斥锁提供了一种机制，确保在任何时刻只有 一个线程 能够持有该锁，从而确保 共享资源 的安全访问。

互斥锁通过以下特点实现 线程互斥：

任何时候，只有 一个线程 可以持有 互斥锁。其它试图获取该锁的线程将被阻塞，直到持有锁的线程释放该锁。
只有锁的持有者才能释放它。这确保了非持有者不能误释放锁。

操作

互斥锁提供加锁和解锁这两个操作实现互斥：

加锁（Lock 或 Acquire）：当线程试图获取互斥锁时，如果锁已被其他线程持有，则该线程将被阻塞，直到锁被释放。
解锁（Unlock 或 Release）：持有互斥锁的线程在完成其对共享资源的访问后，应该释放锁以使其他线程可以获取锁。

通过这两个操作，线程即可对 临界区 进行“上锁”：

mutex mtx;

void thread() {
    non critial section;
    lock(&mtx);
    critial section;
    unlock(&mtx);
    non critial section;
}

线程在进入 临界区之前 使用 lock(&mtx) 进行加锁，在退出 临界区之后 使用 unlock(&mtx) 进行解锁。
互斥的底层实现由操作系统完成，线程通过调用 mutex 的系统 API 即可实现互斥。

实现原理

MUTEX 的底层实现原理比较复杂，但是我们可以从逻辑上来理解其实现原理：

当线程尝试获取一个已经被持有的锁时，它会被挂起，并且不会消耗 CPU 资源。只有当锁被释放并且该线程被选择为下一个获取锁的线程时，它才会恢复执行。这样的机制确保了 临界区 的 互斥访问，同时也尽量减少了不必要的 CPU 浪费。

第一个加锁的线程可以直接获取锁，后续加锁的线程会经历阻塞和唤醒这两个步骤：

阻塞：
- 当线程尝试获取一个已经被其他线程持有的 互斥锁 时，该线程会进入一个 等待状态，也称为 阻塞状态。
- 操作系统维护了一个与该 互斥锁 关联的 等待队列。尝试获取锁但未成功的线程会被放入这个队列中。
- 被阻塞的线程会从“运行”状态转为“等待”或“睡眠”状态。这意味着该线程将不再获得 CPU 时间，直到它被唤醒。
唤醒：
- 当持有 互斥锁 的线程释放该锁时，操作系统会检查与该锁关联的 等待队列。
- 通常，队列中的下一个线程（取决于调度策略，可能是队列的第一个线程或其他）会被选中并被唤醒，允许它获取锁。
- 被唤醒的线程转换为“就绪”状态，并在适当的时候由调度器重新分配 CPU 时间，从而继续执行。

其大致过程如下图所示：

软件互斥

软件互斥依赖 算法和程序设计 来确保资源的独占访问。常用的软件互斥算法不依赖特定的硬件支持，主要通过逻辑控制和变量来实现。

Peterson 算法

Peterson’s 算法基于 两个线程 之间的竞争条件来实现互斥。它使用 两个布尔变量 和 一个整数变量，分别表示两个线程的意愿和当前正在运行的线程。通过这些变量的协作，可以确保只有一个线程能够进入临界区。

Peterson’s 算法通常用于理论教学和理解互斥原理，但在实际多线程编程中并不常用，因为它只适用于两个线程之间的互斥。

// 初始化
bool flag[2] = {false, false};  // 两个线程的意愿
int turn = 0;                   // 当前运行的线程（0 或 1）

// 线程 1 希望进入临界区
void thread0() {
    flag[0] = true;
    turn = 1; // 通知线程 2 你可以运行了
    while (flag[1] && turn == 1) {
    // 等待线程 2 退出临界区或让出 CPU
    }
    // 进入临界区
    // ...
    // 退出临界区
    flag[0] = false;
}

// 线程 2 希望进入临界区
void thread1() {
    flag[1] = true;
    turn = 0; // 通知线程 1 你可以运行了
    while (flag[0] && turn == 0) {
    // 等待线程 1 退出临界区或让出 CPU
    }
    // 进入临界区
    // ...
    // 退出临界区
    flag[1] = false;
}

硬件互斥

上文中我们提到了 软件互斥，即用复杂的软件逻辑实现了类似加锁和解锁的操作。硬件互斥 与之类似，不过我们是使用 CPU 指令集中的 原子指令 来实现同等的功能。

使用 原子指令 实现的锁一般叫做自旋锁，因为加锁的过程需要不断地执行 原子指令，可能会大量占用 CPU。

原子性

原子性 是指一个操作是不可分割的，要么完全执行，要么完全不执行。在多线程或多进程环境中，原子性确保操作不会被其他并发操作中断。

原子指令（Atomic Instructions），是计算机体系结构中的一种特殊指令，它们被设计为在单个处理器指令周期内执行完毕，不会被中断或其他线程干扰。

注意

所有机器指令都是原子性的么？

一些简单的机器指令，例如将数据从一个寄存器移动到另一个寄存器，通常是原子的。这些指令通常在单个 CPU 周期内完成，不会被中断。

但是现代 CPU 指令集越来越复杂，许多复杂的机器指令，例如涉及多个内存访问或需要多个步骤的指令，可能不是原子的。例如，某些指令可能需要多个 CPU 周期才能完成，或者可能涉及对多个内存位置的访问。在这些情况下，指令的执行可能会被中断，从而导致数据竞争或其他并发问题。

TAS 指令

Test-and-Set（TAS）指令：TAS 指令原子性地设置一个内存位置的值为 1，并返回该位置的先前值。
为了辅助各位读者理解，下述代码使用一个函数描述其内部逻辑。

// TAS 原子指令相当于以下函数被原子性地执行
int test_and_set(bool *lock) {
    bool old = *lock;
    *lock = true;
    return old;
}

在使用 TAS 指令实现 自旋锁 时，锁可以用一个整数变量表示，0 表示锁是空闲的，1 表示锁已经被占用。
加锁操作可以不断使用 TAS 指令来尝试将锁的值从 0 设置为 1，如果返回的先前值为 0，则表示 锁定成功，否则表示 锁定失败。
解锁操作将锁的值设置为 0。

mutex = 0;

thread() {
    while (test_and_set(&mutex) == 1); // 基于 TAS 实现自旋锁，如果 mutex 为 1 被占用，则循环等待。
    critial section; // 临界代码
    mutex = 0; // 解锁
}

TAS 实现 自旋锁 的具体工作原理如下：

当一个线程执行 TAS 指令时，它会读取一个共享变量 mutex 的值。
如果该值为 0（或 false），则线程将该值设置为 1（或 true），并继续执行 临界区 代码。
如果该值为 1（或 true），则线程将无法获取锁，需要等待锁被释放。
当线程完成 临界区 代码的执行后，它会将共享变量的值重置为 0（或 false），以 释放锁。

CAS 指令

Compare-and-Swap（CAS）指令：CAS 指令原子性地比较内存中的一个值与预期值，如果相等，则将内存中的值替换为新值。

// CAS 原子指令相当于以下函数被原子性地执行
bool compare_and_set(bool *lock, bool expected, bool new_value) {
    if (*lock == expected) {
        *lock = new_value;
        return true;  // 操作成功
    } else {
        return false; // 操作失败
    }
}

在使用 CAS 指令实现 自旋锁 时，锁可以用一个整数变量表示，0 表示锁是空闲的，1 表示锁已经被占用。
加锁操作可以使用 CAS 指令来将锁的值从 0 修改为 1，如果 CAS 操作成功，则表示 锁定成功。
解锁操作可以使用 CAS 来将锁的值从 1 修改为 0。

mutex = 0;

thread() {
    while (compare_and_set(&mutex, 0, 1) == false); // 基于 CAS 实现自旋锁，则循环等待直到操作成功
    critial section; // 临界代码
    mutex = 0; // 解锁
}

上述用 CAS 实现 自旋锁 的思路其实和 TAS 一致，锁都是用一个整数变量表示，原子指令会一直自旋直到 mutex=0 时，然后原子性地将其设置为 1，表示当前线程占有了锁。

同步

同步是指多个线程为了协同完成某项任务，必须按照一定的顺序执行操作。它主要解决线程之间在执行过程中如何协调的问题，确保它们以预期的时序进行交互与合作。

补充

互斥和同步的关系？

互斥是同步的一种特例，它用于保证多个线程在访问共享资源时不会发生冲突，即在同一时刻最多只有一个线程可以访问该资源。

同步的范畴更广，不仅包括互斥控制，还包括线程之间的顺序协调、条件等待、信号传递等机制。

简单来说：

互斥：解决“同一时刻只能有一个线程访问共享资源”的问题；
同步：解决“线程之间需要按照某种顺序协同执行”的问题。

原则

在实现线程或进程同步时，需要遵循以下基本原则：

空闲让进：如果没有其他线程处于临界区，则允许当前线程进入；
忙则等待：若已有线程在临界区，则其他线程必须等待；
有限等待：每个等待进入临界区的线程都有机会在有限时间内进入，避免 “死等”；
让权等待：不能进入临界区的线程应主动放弃 CPU（如进入等待队列），避免 “忙等”。

上述的进程同步原则涉及到 “死等” 和 “忙等” 这两个概念：

死等状态：指一个 线程/进程 长期得不到资源或 临界区 的访问权，即使条件已经满足，也可能因为调度策略、优先级问题或实现缺陷，永远无法被唤醒或执行。
忙等状态：指 线程/进程 未能进入 临界区，但却反复占用 CPU 执行检查操作，不断轮询某个变量或状态，以判断自己是否可以进入 临界区。

用更加通俗的话说，忙等的本质就是“空转”，死等的本质是“永远等不到”。

条件变量

条件变量（Condition Variable）是一种 同步原语，用于在多线程之间进行 有条件的协作。它允许线程在某个条件未满足时进入等待状态，并在等待期间自动释放已持有的锁，从而让其他线程有机会获取该锁并修改共享数据，使条件得以满足。

条件变量的主要作用：

实现条件同步：当线程必须等待某个特定条件才能继续执行时，条件变量提供了一种高效的等待机制。
避免忙等（busy-waiting）：相比让线程不断轮询检查条件是否满足（浪费 CPU 资源），条件变量使线程在条件未满足时进入休眠，只有在条件被触发时才被唤醒。

操作

条件变量提供三种操作：

wait()：这个操作做两件事。首先，它会释放与条件变量关联的锁，从而使其他线程可以获取锁并更改共享数据的状态。其次，它会使调用它的线程休眠，直到另一个线程来唤醒它。
signal()：这个操作用于唤醒等待在条件变量上的某个线程。如果多个线程在等待，通常只有一个线程被唤醒（但这取决于具体实现）。唤醒的线程将重新获取锁并从其调用 wait() 的地方继续执行。
broadcast() 或 notify_all()：这个操作唤醒所有等待在条件变量上的线程。当共享数据的状态变化可能影响多个等待的线程时，这很有用。

信号量

信号量（Semephore）是一个 同步原语，相比锁，信号量可以解决一些更加复杂的同步问题。

在逻辑上我们将 信号量 理解为一个整数计数值，用于表示可用资源的数量。

信号量提供两个原子操作：

P（proberen，荷兰语的“尝试”之意）
V（verhogen，荷兰语的“增加”之意）。

操作	作用	关键步骤
P（wait）	申请资源	- 信号量>0 → 减1，继续 - 信号量=0 → 阻塞
V（signal）	释放资源	- 信号量+1 - 若原值为0 → 唤醒一个阻塞线程

P 操作

P 操作又称 wait，其执行过程如下：

检查信号量的当前值
- 若 信号量 > 0，则将其值 减 1，线程继续执行后续代码。
- 若 信号量 = 0，则线程被阻塞，直至有线程执行 V 操作把信号量值提升为正数。

简而言之，P 操作是“尝试把信号量减一”。只有在减一后不会使信号量变为负数时，尝试才算成功，线程得以继续；否则线程进入阻塞状态。

V 操作

V 操作又称 signal，其执行过程如下：

把信号量值加 1。
如果原来的信号量值为 0（即此时至少有一个线程因 P 操作被阻塞），则从阻塞队列中挑选一个线程唤醒。
- 若原来的信号量值 > 0，说明没有线程在等待，因而不需要唤醒任何线程。

被唤醒的线程随后重新执行它的 P 操作，此时信号量的值会再 减 1，于是该线程可以顺利进入临界区或继续执行后续代码。

实现原理

下面不展开底层细节，只从概念上说明 信号量 的工作流程。一个信号量本质上维护三样东西：

计数值 – 表示当前可用资源的数量。
运行队列 – 正在执行或可以立即执行的线程集合。
阻塞队列 – 因资源不足而暂时挂起的线程集合。

在信号量上执行 P 操作和 V 操作和设计到对于线程状态的改变：

P 操作
- 当线程的 P 操作执行成功后，线程被加入信号量的 运行队列。
- 当线程的 P 操作执行失败后，线程被加入信号量的 阻塞队列。
V 操作
- 当线程的 V 操作执行成功后，线程被从运行队列中移除，并尝试从阻塞队列中选取线程继续执行 P 操作。

当一个线程尝试执行 P 操作并发现 信号量 的值为 0 或负数时，该操作会导致该线程阻塞。具体地说，线程会被移出运行队列并放入一个特定的阻塞队列。这个阻塞队列是与 信号量 关联的，其中保存了因该 信号量 被阻塞的所有线程。

当其他线程对该 信号量 执行 V 操作并增加其值时，一个被阻塞的线程（或多个，具体取决于实现和 信号量 的增量）会从阻塞队列中被选出并被唤醒，随后它可以继续执行。

信号量应用

信号量比较灵活，可以替代锁的功能，也能实现更加复杂的同步操作，这节主要谈论 信号量 最常见的几种用法。

实现锁

当 信号量 的初始值为 1 时，可以把 信号量 当作锁使用：

执行 P(sem) 相当于 lock(&mutex)。
执行 V(sem) 相当于 unlock(&mutex)。

semaphore S = 1;

P1() {
    P(S);
    // critical section
    V(S);
}

P2() {
    P(S);
    // critical section
    V(S);
}

实现简单同步

利用 信号量 可以实现线程间的同步，保证不同线程间某些操作的 顺序关系。
这种简单同步用 条件变量 也可以实现，不过用 信号量 更为简单。

比如下述的代码，可以保证执行完 P1 中的 code1 之后，才会执行 P2 中的 code2：

semphore S = 0;  // 将信号量的初始值设置为 0

P1() {
    code1;       // 先执行 code1
    V(S);        // 告诉线程 P2，code1 已经完成
    ...
}

P2() {
    ...
    P(S);        // 检查 code1 是否完成
    code2;       // 检查无误，运行 code2
}

注意实现这种 P1 → P2 的同步关系，需要将 信号量 的初始值设置为 0，并在 P1 中调用 V(S)，并在 P2 中调用 P(S)，P2 中的 V(S) 会一直阻塞到 P1 中的 P(S) 执行完。

实现前驱关系

线程的 前驱关系 是指在多线程并发执行的环境中，某些线程的执行必须依赖于其他线程的完成。
这种依赖关系可以通过一个 有向无环图（DAG）来描述，DAG 中的边表示了线程执行的 依赖关系。

如下图所示：S2 和 S3 必须在 S1 执行完之后才能执行，S4 和 S5 必须在 S2 执行完后才能执行，S6 必须在 S3、S4、S5 执行完之后才能执行。

两个线程之间的 前驱关系 在 DAG 中 表示为一条边，我们可以一个 信号量 来表示这条边，将其初始值设置为 0，并使用上文中提到的方法使用这种单向同步。

semphore a1 = a2 = b1 = b2 = c = d = e = 0;

S1() {                       S2() {
    ...;                         P(a1);
    V(a1); V(a2);                ...
}                                V(b1); V(b2);
                             }

S3() {                       S4() {     
    P(a2);                       P(b1); 
    V(e);                        V(c);  
}                            }


S5() {                       S6() {
    P(b2);                       P(c); P(d); P(e);
    V(d);                    }
}

管程

管程（Monitor）本质上是一种 对互斥 + 条件同步的高级封装机制，通过结构化编程方式将“对共享资源的访问”与“同步控制”统一封装成一个模块，提升了程序的安全性和可读性。

补充

🔍 为什么有了信号量/条件变量，还需要管程？

锁和 信号量 是更低级的同步原语。尽管它们非常有用并且广泛应用，但在某些情况下直接使用它们可能导致代码复杂且难以理解。另外，使用这些低级原语可能会增加死锁、饥饿或其他同步问题的风险。

管程的设计是为了将这些低级的细节隐藏起来，并提供一个更高级、更抽象的接口，使得程序员可以更容易地编写 正确、安全 的并发代码。

管程的 核心思想 是确保在任意时刻，最多只有一个线程能够执行管程内部的代码，从而实现对 共享资源 的自动互斥。当其他线程尝试进入管程时，会被阻塞，直到当前线程退出。

管程的 基本组成：

共享数据：管程封装了需要被多个线程共享和访问的数据。
方法：定义了如何操作 共享数据 的函数或方法。这些方法是唯一可以访问和修改 共享数据 的方式。
条件变量：用于控制线程的执行顺序，让线程在某些条件下等待，或通知等待的线程继续执行。

举个实际例子说明什么是管程，比如我们可以用用管程封装生产者消费者问题。管程其实就是对 OS 底层接口的封装，为程序员提供一些更加简单易用的接口。

4 - 经典同步问题

🔥 高优先级

真题练习

同步问题设计 是操作系统解答题必考题，本节的几个经典问题虽然不会直接考察，但是其中的设计思想还是需要深入掌握。

生产者消费者问题

生产者消费者问题是并发编程中的经典问题，涉及到两种线程 —— 生产者 和 消费者，它们共享一个固定大小的缓冲区或存储区。

生产者的任务是生成数据并将其 放入缓冲区。
消费者的任务是 从缓冲区中取出 并消费这些数据。

关键的挑战在于确保生产者不会在缓冲区满时添加数据，同时确保消费者不会在缓冲区空时尝试消费数据。

semaphore mutex = 1;          // 临界区互斥信号量
semaphore empty = n;          // 空闲缓冲区数量
semaphore full  = 0;          // 忙缓冲区数量

producer() {
    while (1) {
        P(empty)              // 等待一个空位置
        P(mutex)              // 进入临界区前先获取mutex
        ....                  // 将数据项添加到缓冲区
        V(mutex)              // 离开临界区，释放mutex
        V(full)               // 增加一个数据项的计数
    }
}

consumer() {
    while (1) {
        P(full)               // 等待一个数据项
        P(mutex)              // 进入临界区前先获取mutex
        ...                  // 从缓冲区取出数据项并消费
        V(mutex)              // 离开临界区，释放mutex
        V(empty)              // 增加一个空位置的计数
    }
}

生产者消费者过程可以参考以下流程图理解：

读者 - 写者问题

读者写者问题 是另一个经典的并发编程问题，涉及到对 共享数据 或资源的访问，这些资源可以被 多个读者 同时读取，但只能被 一个写者 写入，而且当写者正在写入数据时，没有其他读者或写者可以访问该资源。

这个问题的挑战在于两点：

允许多个读者同时读取资源。
确保当有一个写者访问资源时，没有其他读者或写者可以同时访问。

int read_count = 0;
semaphore wrt  = 1;
semphore mutex = 1;

reader() {
    while (1) {
        P(mutex)                     // 获取互斥访问权，以修改 read_count
        read_count += 1
        if (read_count == 1) {       // 如果这是第一个读者，需要锁定资源，防止写者写入
            P(wrt)
        }
        V(mutex)                     // 释放互斥访问权
        ...                          // 读取资源
        P(mutex)                     // 获取互斥访问权，以修改 read_count
        read_count -= 1
        if (read_count == 0) {       // 如果没有读者在读取，释放资源，允许写者写入
            V(wrt)
        }
        V(mutex)                     // 释放互斥访问权
    }
}

writer() {
    while (1) {
        P(wrt)                       // 获取资源的互斥访问权
        ...                          // 写入资源
        V(wrt)                       // 释放资源的互斥访问权
    }
}

int read_count = 0;
int write_count = 0;
semaphore wrt = 1;
semaphore mutex = 1;
semaphore write_mutex = 1;

reader() {
    while (1) {
        P(write_mutex)                  // 在读取之前，确保没有写者正在等待或写入
        P(mutex)                        // 获取互斥访问权，以修改 read_count
        read_count += 1
        if (read_count == 1) {
            P(wrt)
        }
        V(mutex)
        V(write_mutex)

        ...                             // 读取资源

        P(mutex)                        // 获取互斥访问权，以修改read_count
        read_count -= 1
        if (read_count == 0) {
            V(wrt)
        }
        V(mutex)
    }
}

writer() {
    while (1) {
        P(write_mutex)                  // 获取互斥访问权，以修改 write_count
        write_count += 1
        if (write_count == 1) {         // 如果这是第一个写者，锁定资源，防止新的读者读取
            P(wrt)
        }
        V(write_mutex)

        ...                             // 写入资源

        P(write_mutex)                  // 获取互斥访问权，以修改write_count
        write_count -= 1
        if (write_count == 0) {         // 如果没有其他写者在等待或写入，释放资源
            V(wrt)
        }
        V(write_mutex)
    }
}

int read_count = 0;
int write_count = 0;
semaphore wrt = 1;
semaphore mutex = 1;
semaphore queue = 1; // 新增队列信号量，以确保公平性

reader() {
    while (1) {
        P(queue);                 // 进入队列
        P(mutex);                 // 获取互斥访问权，以修改 read_count
        read_count += 1;
        if (read_count == 1) {
            P(wrt);               // 如果是第一个读者，锁定资源
        }
        V(mutex);
        V(queue);                 // 离开队列
        ...                       // 读取资源
        P(mutex);                 // 获取互斥访问权，以修改 read_count
        read_count -= 1;
        if (read_count == 0) {
            V(wrt);               // 如果是最后一个读者，释放资源
        }
        V(mutex);
    }
}

writer() {
    while (1) {
        P(queue);                 // 进入队列
        P(wrt);                   // 锁定资源
        ...                       // 写入资源
        V(wrt);                   // 释放资源
        V(queue);                 // 离开队列
    }
}

试题中如果考察读者写者问题的话，一般考察的还是读者优先，读者优先的同步实现方案可以通过以下流程图进行理解：

哲学家就餐问题

假设有五位 哲学家 坐在一个圆桌周围，每两位哲学家之间有一把叉子。哲学家的生活由 思考和吃饭 两种活动组成。为了吃饭，一个哲学家需要两把叉子——左边和右边的一把。问题在于，如何设计一个算法使得哲学家们可以正常就餐，而不会因为竞争叉子而导致死锁或饥饿。

哲学家就餐问题有多种解法，这里只提供一种 最直观的解法，对于包含 N 位哲学家的问题：- 前 N-1 个哲学家先拿起 左边的叉子，再拿起 右边的叉子 - 最后一个 哲学家先拿起 右边的叉子，再拿起 左边的叉子

semaphore fork[5] = {1, 1, 1, 1, 1};      // 五个叉子，初始都是可用的

void philosopher(int i) {
    if (i < 5) {
        // 对于前面的哲学家，先左后右
        first = i;
        second = (i + 1) % 5;
    } else {
        // 对于最后一个哲学家，先右后左
        first = (i + 1) % 5;
        second = i;
    }
    while (1) {
        think();
        P(fork[first]);
        P(fork[second]);
        eat();
        V(fork[first]);
        V(fork[second]);
    }
}

生产者消费者过程可以参考以下流程图理解：

5 - 死锁

⭐ 中优先级

真题练习

选择题高频考点，本节的几个知识点都经常考察，除了死锁的检测和删除之外。

死锁产生的必要条件

只有以下四个条件同时满足，死锁才会发生：

互斥条件（Mutual Exclusion）: 指的是至少有一个资源必须处于非共享模式，也就是说，一次只有一个进程可以使用资源。如果其他进程请求该资源，那么请求的进程必须等到该资源的持有者释放该资源。
占有并等待（Hold and Wait）: 指的是一个进程因请求资源而阻塞时，对当前获得的资源保持不放。换句话说，进程至少已经持有一个资源，但又申请新的资源；由于其他进程持有这些资源，所以它现在是阻塞的。
非抢占（No Preemption）: 资源不能被抢占，也就是说，只有资源的持有者才可以释放它。资源在完全自愿的基础上被释放，不能被强行从持有进程中夺走。
循环等待（Circular Wait）：存在一个进程资源的等待链，链中的每一个进程都在等待下一个进程所持有的资源。这导致了一个循环的等待链。

为了 避免死锁，需要破坏上述的任意一个条件。

上图中的进程就处于死锁状态。每个进程都既要又要，持有的不释放，想要的也得不到，也不允许其他进程去抢占自己所占有的，所有的进程和资源之间组成一个循环链条。以上这些特点决定了系统进入了死锁状态。

死锁处理策略

处理死锁 主要包含三种策略：

死锁预防：设置限制条件，破坏产生死锁的 4 个必要条件之一。
死锁避免：在资源的动态分配过程中，用某种算法避免系统进入不安全状态。
死锁的检测和解除：允许进程在运行过程中发生死锁，通过系统检测机构及时检测出死锁的发生，然后采取某种措施解除死锁。

死锁预防

死锁预防是通过确保系统永远不会满足死锁产生的四个必要条件中的某些条件，从而避免死锁的发生：

破坏互斥条件
- 互斥条件在某些情况下是不可避免的，例如打印机等硬件资源。但在某些场景下，通过资源复制或虚拟化技术，可以尝试减少资源的互斥使用。
破坏占有并等待
- 要求进程在开始时一次性申请其需要的所有资源。只有当所有资源都可用时，进程才被分配资源并开始执行。这样，进程在执行期间不会等待其他资源。
- 另一个方法是，如果进程申请新资源而被拒绝，则它必须释放所有已分配的资源，再重新申请。
破坏非抢占
- 当一个进程需要的资源被另一个进程所占有时，它可以抢占另一个进程的资源。
破坏循环等待
- 对进程申请资源的顺序进行限制

死锁避免

死锁避免是系统级的算法，需要对系统的资源和实体进行抽象，进行统筹规划，其中最经典的算法是 银行家算法。

银行家算法

这里首先说一下次算法的命名，为什么叫“银行家”。一般而言，银行家都具备以下特点：

掌管金库（即资源），可以放贷（即满足进程申请的资源）
理性地作出决策，避免银行破产（即系统进入不安全状态）

相对于银行家的就是客户（即进程），进程需要申请一定量的资源。
但是进程可能不会立即申请全部的资源，进程也许会依次申请所有请求资源中的一部分，当进程申请完全部的资源之后，它才会释放这些资源。

为了对刚刚描述的过程进行建模，我们需要定义如下的数据结构：

系统
- Available：表示每种资源的 可用数量。
进程
- Max：表示每个进程对每种资源的 最大需求量。
- Allocation：表示已经 分配给 每个进程的资源数量。
- Need：表示每个进程 还需要 的资源数量，Need = Max - Allocation

系统中所有进程的资源状态可以用下表所示：

算法步骤

初始化：为每个进程和每种资源设置 Max、Allocation 和 Need。
当一个进程请求资源时，检查请求的资源数量是否 小于等于 Need，如果大于则请求失败。
检查请求的资源数量是否 小于等于 Available，如果大于则请求失败。
如果请求合法（满足上述两个条件），则 模拟分配 资源给该进程（预分配），即将资源从系统的 Available 减去，加到进程的 Allocation 中，并从进程的 Need 中减去相应数量的资源。
然后，进行安全性检查，判断是否存在一种 安全分配序列，使得所有进程都能顺利执行完成。
如果存在 安全分配序列，则执行资源分配，否则拒绝请求，因为分配资源可能导致死锁，并且回收预先模拟分配的资源。
当进程完成任务时，释放已分配的资源，将它们从 Allocation 减去，加到 Available 中。

银行家 算法流程 如下图所示：

安全分配序列

安全分配序列 是进程的一个排列，它保证了对于序列中的每个进程，当这些进程都申请 Need 中的全部资源时，系统都能够满足这些需求。

如果系统存在一个 安全分配序列，则系统处于 安全状态 。

注意

不安全状态不意味着死锁，但它意味着有死锁的风险。不安全状态只是死锁的一个先兆，但不是死锁本身。

对于前图中的各进程状态，我们可以得到如下的一个 安全分配序列：

具体计算过程如下：

首先，available = (3, 3, 2) > P1_Need = (1, 2, 2)，分配资源给 P1 后回收 P1_Allocation = (2, 0, 0)，然后 available 增加为 (5, 3, 2)
其次，available = (5, 3, 2) > P3_Need = (0, 1, 1)，分配资源给 P3 后回收 P3_Allocation = (2, 1, 1)，然后 available 增加为 (7, 4, 3)
…..
以此类推，得到 安全序列 P1、P3、P0、P2、P4

安全性检查

安全性检查 即判断系统中是否至少存在一个 安全分配序列，其过程如下：

假设系统中存在 N 个进程的话，则最多进行 N 轮遍历，每一轮至少找到一个 need 小于或等于 available 的进程，如果可以找到的话，就回收这些进程的 allocation，并将其加入 available 中，直到回收了所有进程的资源。如果有一轮存在这种情况：剩余的进程（任务未完成的进程）中的每一个 need 都大于 available，那么则说明无法找到一个 安全分配序列，系统处于 不安全状态。

这种判断方式的背后具有这样的逻辑：因为进程必须申请完所有需要的资源（即 max）才能返还已申请的资源，所以系统在当下肯定是尽量满足那些可以返还资源的进程，因为只有回收了一些资源之后，才能满足之前可能无法满足的进程。

但是如果在某一个时刻，剩余的进程的资源一个都无法回收了，那么系统就进入了 不安全状态。

这里还要需要注意的是，在实际的算法中，我们需要用 work 替代 available 来帮助我们完成 安全性检查 的过程，因为检查只是一种“逻辑推演”，我们并不希望实际修改系统中的资源情况，具体的代码实现可以参考如下链接：

银行家算法代码实现

死锁的检测和删除

为了能对系统是否已发生了死锁进行检测，必须：

用某种数据结构来保存资源的请求和分配信息：
提供一种算法，利用上述信息来检测系统是否已进入死锁状态。

一般来说，一种简单的建模方式是使用 资源分配图：

将系统中的所有资源和进程表示为图中的节点。
如果进程 P1 请求资源 R1，绘制从 P1 到 R1 的有向边。
如果资源 R1 分配给了进程 P2，绘制从 R1 到 P2 的有向边。

在构建完 资源分配图，可以通过使用 DFS 检查图中是否存在环路以判断是否存在死锁。