这是本节的多页打印视图。点击此处打印.

图

本章在选择题中考察，也有可能作为一道概念题在大题中出现，需要熟练掌握图的存储结构（代码实现），并且要求在概念上理解图的应用，要求能够手工模拟。

1: 定义
2: 算法和应用

学习思维导图：

# 图

## 图的基本概念

## 图的存储结构及基本操作

- 邻接矩阵
- 邻接表
- 邻接多重表、十字链表

## 图的遍历

- 深度优先搜索
- 广度优先搜索

## 图的基本应用

- 最小生成树
- 最短路径
- 拓扑排序
- 关键路径

1 - 定义

需熟练掌握图的定义以及邻接矩阵和邻接表的表示方式，常常在大题中考察。

图的概念

图是由顶点和边组成的非线性数据结构。顶点有时也被称为节点，而边是连接图中任意两个节点的线或弧。更正式地说，图是由一组顶点 $(V)$ 和一组边 $(E)$ 组成的。图用 $G(E, V)$ 表示。

补充

树和图的区别？

树是受限制的图类型，只是有更多的规则。每棵树都是一个图，但不是所有的图都是树。链表、树和堆都是图的特殊情况。

在图论中，根据边的方向性、连接方式、顶点间的关系等，可以进一步划分出多种类型的图，并引入如连通性、完全性、度数等一系列关键概念。这些分类和术语有助于我们更好地理解图的结构特点和应用场景，下面我们将逐一进行介绍。

方向

有向图（directed graph）：边是有方向的，从一个定点指向另一个定点
无向图（undirected graph）：边是没有方向的

连通性

连通图（Connected Graph）：图中的每一对不同顶点都可以通过一条或多条边相互连接，也就是说，从图中的任意一个顶点出发，都可以到达图中的任意其他顶点。
非连通图（Disconnected Graph）：图中存在两个或多个互不相连的子图，也就是说，其中至少存在一个顶点集合，无法通过边连接到图中的其他顶点集合。
完全图（Complete Graph）：完全图是一种特殊的图，其中每一对不同的顶点都直接相连，也就是说，完全图中的任意两个顶点之间都存在一条边。如果一个完全图有 n 个顶点，那么它将有 $C(n, 2) = n(n-1)/2$ 条边，其中 $C(n, 2)$ 表示从 n 个顶点中选择 2 个顶点的组合数。

连通分量（Connected Components）：连通分量（Connected Components），也称为连通子图，是一个无向图中的一个重要概念。一个连通分量是指在无向图中，如果从其中一个顶点出发，可以通过边的路径到达该连通分量内的任何其他顶点，而无法通过图中的边到达其他连通分量内的顶点。

度

顶点的度（Degree）：顶点的度是指与该顶点相邻的边的数量，也就是与该顶点直接相连的其他顶点的个数。对于有向图和无向图都适用。
- 在无向图中，顶点的度就是与该顶点相邻的边的数量。
- 在有向图中，顶点的度分为入度和出度，分别表示指向该顶点的边的数量和从该顶点出发的边的数量的总和。
入度（In-Degree）：入度是指在有向图中指向某个顶点的边的数量，也就是与该顶点关联的边中以该顶点为终点的边的数量。
出度（Out-Degree）：出度是指在有向图中从某个顶点出发的边的数量，也就是与该顶点关联的边中以该顶点为起点的边的数量。

路径

简单路径：顶点 不出现重复 的路径
非简单路径：顶点出现重复的路径
回路：路径的起点和终点相同

图的存储

在我们使用数据结构存储图时，主要关注两点：1. 如何存储顶点？ 2. 如何存储边？采用的数据结构需要能够准备表示这些信息。

邻接矩阵

定义

图的邻接矩阵（Adjacency Matrix）是一种常用的图表示方法，特别适用于稠密图，它以矩阵的形式表示图的连接关系。

在邻接矩阵中，行和列分别代表图的顶点，矩阵的元素表示顶点之间是否相邻或者边的权重。

对于无向图：
- 如果顶点 $i$ 和顶点 $j$ 之间存在边，则邻接矩阵中 $(i, j)$ 和 $(j, i)$ 位置的元素都被标记为 $1$ （或者表示边的权重）。
- 如果顶点 $i$ 和顶点 $j$ 之间不存在边，则邻接矩阵中 $(i, j)$ 和 $(j, i)$ 位置的元素都被标记为 $0$ 。
对于有向图：
- 如果有一条从顶点 $i$ 到顶点 $j$ 的有向边，则邻接矩阵中 $(i, j)$ 位置的元素被标记为 $1$ （或者表示边的权重）。
- 如果没有从顶点 $i$ 到顶点 $j$ 的有向边，则邻接矩阵中 $(i, j)$ 位置的元素被标记为 $0$ 。

实现

在邻接矩阵的实现中，我们使用一个二维数组来表示图的连接关系，邻接矩阵 matrix 的行数和列数与图中的顶点数量相同。其中 matrix[i][j] 表示顶点 i 到顶点 j 是否有边（或边的权值）。

##define MAX_VERTICES 100

int adjMatrix[MAX_VERTICES][MAX_VERTICES]; // 邻接矩阵

// 初始化邻接矩阵
void initializeMatrix(int vertices) {
    for (int i = 0; i < vertices; i++) {
        for (int j = 0; j < vertices; j++) {
            adjMatrix[i][j] = 0; // 初始化所有元素为 0
        }
    }
}

// 在邻接矩阵中添加一条边
void addEdge(int start, int end) {
    adjMatrix[start][end] = 1; // 添加边，将对应位置的元素设为 1
    adjMatrix[end][start] = 1; // 无向图需要将对称位置的元素也设为 1
}

入度出度

如果需要计算邻接矩阵中某个顶点的出度的话，假设顶点编号为 i，我们统计邻接矩阵中的 第 i 行 有多少元素不为 0 即可（该顶点指向哪些顶点）。

如果需要计算邻接矩阵中某个顶点的出度的话，假设顶点编号为 i，我们统计邻接矩阵中的 第 i 列 有多少元素不为 0 即可（哪些顶点指向该顶点）。

邻接表

定义

图的邻接表（Adjacency List）是一种常见的图表示方法，特别适用于稀疏图，它使用链表或数组的形式来表示图的连接关系。每个顶点都对应一个链表，链表中存储与该顶点相邻的其他顶点。

邻接表的主要思想是为每个顶点创建一个链表，链表中的每个节点表示与该顶点相邻的另一个顶点。对于无向图，通常需要为每一条边创建两个链表节点，分别表示两个相邻的顶点。

实现

在邻接表的实现中，我们为每个顶点维护一个链表，用于存储与该顶点相邻的所有顶点；所有顶点对应的链表头节点组成一个数组或列表（在以下实现为 struct AdjList *array），形成整个图的邻接表结构。

// 链表节点结构：表示邻接的一个顶点
struct Node {
    int dest;            // 邻接顶点的编号
    struct Node* next;   // 指向下一个邻接点
};

// 邻接表：每个顶点有一个链表
struct AdjList {
    struct Node* head;   // 链表头
};

// 图结构
struct Graph {
    int V;                      // 顶点数
    struct AdjList* array;      // 邻接表数组
};

struct Node* newNode(int dest) {
    struct Node* node = (struct Node*)malloc(sizeof(struct Node));
    node->dest = dest;
    node->next = NULL;
    return node;
}

struct Graph* createGraph(int V) {
    struct Graph* graph = (struct Graph*)malloc(sizeof(struct Graph));
    graph->V = V;

    // 创建邻接表数组
    graph->array = (struct AdjList*)malloc(V * sizeof(struct AdjList));
    for (int i = 0; i < V; ++i)
        graph->array[i].head = NULL;

    return graph;
}

void addEdge(struct Graph* graph, int src, int dest) {
    // src -> dest
    struct Node* n1 = newNode(dest);
    n1->next = graph->array[src].head;
    graph->array[src].head = n1;

    // dest -> src（因为是无向图）
    struct Node* n2 = newNode(src);
    n2->next = graph->array[dest].head;
    graph->array[dest].head = n2;
}

邻接多重表

邻接多重表（Adjacency Multi-list）是一种用于表示 无向图 的数据结构，主要用于避免在邻接表存储方式中重复存储无向边，提高存储效率，同时便于图的操作（如边的删除）。

邻接多重表中顶点种类分为两种：

顶点结点（Vertex Node）：
- 每个顶点有一个头结点，存储该顶点的信息，以及指向其所有关联边的指针。
边结点（Edge Node）：
- 每条边有一个结点，存储该边的两个顶点及其相关信息。
- 该结点包含两个指针，分别指向该边所连接的两个顶点的邻接边链表的下一条边，使得图的存储更加紧凑。

还是举个实际例子说明，在上述的邻接多重表中，总共需要存储 5 条边，每条边只需要存储一次，所以总共有 5 个边结点，每个边结点中存储的数据如下表所示：

边	`ivex`	`jvex`	`ilink` 指向	`jlink` 指向
12	1	2	13	23
13	1	3	14	32
14	1	4	NULL	43
23	2	3	NULL	34
34	3	4	NULL	NULL

注意

ilink 和 jlink 的含义是什么？

ilink 和 jlink 指向的是“该边对应顶点的下一条边”，用于遍历一个顶点的所有相邻边。这样，每条无向边只存储一次，同时仍然能通过 ilink 和 jlink 遍历所有邻接的边。

总结一下，相比于邻接表，邻接多重表最大的不同在于如下两点：

节省存储空间：对于无向图，每条边只存储一次。
方便进行边的操作：例如，删除一条边时，只需要修改相关顶点的链表中的指针，而不需要像邻接表那样在两个顶点的邻接表中都进行操作。

十字链表

十字链表（Orthogonal List）是一种用于表示 有向图 的链式存储结构，它兼顾了出边和入边的高效查找。相比邻接表只方便查找出边，十字链表允许同时高效遍历某个顶点的所有出边和所有入边。

在十字链表（Orthogonal List）中，顶点种类也可以分为两种：

顶点结点：
- 每个顶点对应一个头结点，存储该顶点的信息；
- 同时包含两个指针：
  - firstout：指向从该顶点出发的第一条出边；
  - firstin：指向以该顶点为终点的第一条入边；
- 这样可分别建立“出边链表”和“入边链表”。
边结点：
- 每条有向边对应一个边结点，存储该边的起点和终点在顶点表中的位置；
- 包含两个指针，使该边同时链接在：
  - 起点顶点的出边链表中（通过 hlink）；
  - 终点顶点的入边链表中（通过 tlink）；
- 边结点也可扩展存储额外信息（如权重）。

下图给出了一个十字链表的一个实例，其中忽略了边结点的 info 字段。我们可以沿着顶点结点的 firstin 和 firstout 字段高效遍历所有的入边和出边。

2 - 算法和应用

需熟练掌握图对于各种问题的应用，在选择题和大题中都是考察重点。

DFS

深度优先搜索（Depth-First Search，简称 DFS）是一种用于图的遍历和搜索的算法，它从图中的一个起始顶点开始，尽可能深地访问顶点，直到无法继续前进，然后回溯到之前的顶点，继续深入其他分支。DFS 通常用递归或栈来实现，确保在深度方向上优先遍历。

以下是 DFS 算法的一般步骤：

从起始顶点开始，将其标记为已访问。
遍历与当前顶点相邻的未访问顶点，选择其中一个未访问顶点作为下一个深度遍历的目标，然后递归地进行 DFS。
如果无法继续深度遍历（即当前顶点没有未访问的邻居），则回溯到上一个顶点，继续遍历其他未访问的邻居。
重复步骤 2 和步骤 3，直到所有顶点都被访问。

图中 DFS 实现的框架与树的遍历类似，不同点在于需要使用 visit 数组记录已经访问过的节点，避免重复遍历：

function DFS(G, v, visited):
    visited[v] ← true
    for each neighbor u of v in G.adjacent[v]:
        if not visited[u]:
            DFS(G, u, visited)

图在邻接矩阵和邻接表中的 DFS 都遵循这个框架，两者的不同点在于获取 v 的邻居 u 的方式不同。

邻接矩阵

在邻接矩阵中，我们定义一个递归函数 dfs，函数从 start 顶点出发，输出当前结点，然后递归地去访问所有与其相邻的顶点。

注意递归前需要保证下一个顶点未被访问过，这样可以避免重复访问结点以及死循环。

// 全局变量，标记顶点是否被访问过
int visited[MAX_VERTICES];

// 递归函数，从 start 顶点出发
void dfs(int start) {
    visited[start] = 1;
    printf("%d ", start);

    // 依次访问 start 的邻接顶点
    for (int i = 0; i < MAX_VERTICES; i++) {
        // 递归的两个条件：
        // 1. 顶点 (start, i) 之间存在边
        // 2. 顶点 i 未被访问过
        if (adjMatrix[start][i] == 1 && !visited[i]) {
            // 递归调用
            dfs(i);
        }
    }
}

邻接表

邻接表的递归思路与邻接矩阵一致，唯一的区别就是访问邻接顶点方式的不同。

在邻接矩阵中，通过遍历矩阵中的一行来访问相邻顶点。在邻接表中，通过遍历链表来访问相邻顶点。

// 全局变量，标记顶点是否被访问过
int visited[MAX_VERTICES];

// 递归函数，从 start 顶点出发
void dfs(struct Graph* graph, int start) {
    visited[start] = 1;
    printf("%d ", start);

    // 依次访问 start 的邻接顶点
    struct Node* temp = graph->adjacencyList[start];
    while (temp) {
        int adjVertex = temp->data;
        // 递归条件：顶点 i 未被访问过
        if (!visited[adjVertex]) {
            dfs(graph, adjVertex);
        }
        temp = temp->next;
    }
}

BFS

广度优先搜索（Breadth-First Search，简称 BFS）是一种用于图的遍历和搜索的算法，它从图中的一个起始顶点开始，逐层地访问与该顶点相邻的顶点，然后再访问这些相邻顶点的邻居，以此类推。BFS 通常用队列来实现，确保按照广度优先的顺序访问顶点。

以下是 BFS 算法的一般步骤：

将起始顶点放入队列中，标记为已访问。
从队列中弹出一个顶点并访问它。
遍历该顶点的所有未被访问的邻居，将它们放入队列中，并标记为已访问。
重复步骤 2 和步骤 3，直到队列为空。

BFS 的伪代码实现如下所示，基于邻接矩阵或邻接表的 BFS 都遵循这个框架：

function BFS(G, start):
    visited[start] ← true
    enqueue(Q, start)

    while Q is not empty:
        v ← dequeue(Q)
        process(v)
        for each neighbor u of v in G.adjacent[v]:
            if not visited[u]:
                visited[u] ← true
                enqueue(Q, u)

邻接矩阵

实现 bfs 时，首先添加起始顶点进入队列中，然后不断从队列中取出顶点，并添加该顶点的未访问相邻顶点进入队列。重复直到队列为空。

在 dfs 中，visited 数组是各个递归函数都需要访问的数据结构，为了方便起见，可以定义为全局变量。在 bfs 中，由于算法实现是基于迭代而非递归，所以 visited 和队列可以定义为局部变量。

// 从 start 开始遍历图
void bfs(int start, int vertices) {
    // 队列 q
    queue q;
    // 标记顶点是否被访问过
    int visited[MAX_VERTICES];
    // 添加初始顶点
    q.enqueue(start);
    visited[start] = 1;

    // 一直遍历到队列为空
    while (q.size() > 0) {
        // 从队列头部取出结点作为当前结点
        int currentVertex = q.dequeue();
        // 输出当前结点
        printf("%d ", currentVertex);
        // 将当前结点的所有 相邻的未访问顶点 添加到队列中
        for (int i = 0; i < vertices; i++) {
            if (adjMatrix[currentVertex][i] == 1 && !visited[i]) {
                q.enqueue(i);
                visited[i] = 1;
            }
        }
    }
}

邻接表

实现思路与邻接矩阵方式一致，不同点在与访问相邻顶点的方式不同。

void bfs(struct Graph* graph, int start) {
    // 队列 q
    queue q;
    // 标记顶点是否被访问过
    int visited[MAX_VERTICES];
    // 添加初始顶点
    q.enqueue(start);
    visited[start] = 1;

    // 一直遍历到队列为空
    while (front != rear) {
        // 从队列头部取出结点作为当前结点
        int currentVertex = q.dequeue();
        // 输出当前结点
        printf("%d ", currentVertex);
        // 将当前结点的所有 相邻的未访问顶点 添加到队列中
        struct Node* temp = graph->adjacencyList[currentVertex];
        while (temp) {
            int adjVertex = temp->data;
            if (!visited[adjVertex]) {
                q.enqueue(adjVertex);
                visited[adjVertex] = 1;
            }
            temp = temp->next;
        }
    }
}

最小生成树

最小生成树（Minimum Spanning Tree，MST）是在一个连接所有顶点的无向图中，通过选择一部分边而形成的树，使得树的总权重（或成本）最小。

准确的最小生成树定义如下：在无向图 $G = (V, E)$ 中，$(u, v)$ 代表连接顶点 $u$ 和顶点 $v$ 的边，而 $w(u, v)$ 代表此边的权重，若存在 $T$ 为 $E$ 的子集且 $(V, T)$ 为树，使得 $w(T) = \sum_{(u, v) \in T} w(u, v)$ 最小，则此 $T$ 为 $G$ 的最小生成树。

最小生成树满足以下特点：

包含图中的所有顶点。
通过选择一些边而形成一个树结构，没有环路。
边的总权重最小。

prim 算法

Prim 算法的主要思想是从一个初始顶点开始，逐步扩展生成树，每次选择与当前生成树相邻且权重最小的边所连接的顶点，并将该顶点加入生成树。算法的运行过程可以概括为以下步骤：

选择一个起始顶点作为生成树的根节点。
初始化一个空的生成树，包含初始顶点。
将与生成树中的顶点相邻且权重最小的边的另一端顶点加入生成树，即选择一条最小权重边。
重复步骤 3，直到生成树包含了所有的顶点。
最终生成树即为原图的最小生成树。

kruskal 算法

Kruskal 算法是一种用于求解最小生成树（Minimum Spanning Tree，MST）的贪心算法。Kruskal 算法的基本思想是从边的权重最小的边开始，逐步构建生成树，确保不会形成环路。

以下是 Kruskal 算法的一般流程：

初始化一个空的生成树，开始时生成树中没有边。
将图中的所有边按照权重从小到大进行排序。
依次从排序后的边列表中选取边，加入生成树，但要确保添加该边不会形成环路。可以使用并查集来检查是否形成环路。
重复步骤 3，直到生成树包含了所有的顶点，即生成树中的边数等于顶点数减 1。
返回生成树作为最小生成树。

最短路径

dijkstra 算法

Dijkstra 算法是一种用于计算 单源最短路径 的经典算法，适用于 带非负权重的有向或无向图。

Dijkstra_Animation

Dijkstra 算法是一种贪心算法。它从起点开始，维护一组已知的最短路径，每次从所有未处理的顶点中选择一个当前距离起点最短的顶点，将其加入“最短路径已确定”的集合，并通过它尝试更新其邻居的最短路径。该过程重复，直到所有顶点的最短路径都被确定。

🛠️ 算法需要定义以下数据结构：

dist[]: 一个数组，dist[v] 表示起点到节点 v 的当前最短路径长度，初始化为 ∞，起点为 0。
visited[]: 一个布尔数组，记录哪些节点的最短路径已被确定。

✨ 算法具体流程如下：

初始化
- dist[source] ← 0
- 其他 dist[v] ← ∞
- 所有 visited[v] ← false
主循环（直到所有顶点都被访问）
- 找出未访问的、dist[] 值最小的节点 u
- 标记 visited[u] ← true
- 对于 u 的每个邻居 v：
  - 如果 v 未访问，且 dist[u] + w(u,v) < dist[v]，则更新 dist[v] ← dist[u] + w(u,v)
结束
- 所有最短路径保存在 dist[] 中

Dijkstra 的考察侧重于手工模拟其过程，代码实现一般不会考察，这里给出算法的简单伪代码实现，帮助各位理清其中的处理细节。

function Dijkstra_Simple(Graph, source):
    对于图中每个顶点 v:
        dist[v] ← ∞          // 起点到 v 的距离初始化为无穷大
        visited[v] ← false   // 所有顶点初始都未被访问
    dist[source] ← 0         // 起点到自身距离为 0

    重复 |图中顶点数| 次:
        u ← 所有未访问的顶点中 dist[u] 最小的顶点
        visited[u] ← true    // 标记 u 已被访问

        对于 u 的每个相邻顶点 v:
            边权重 weight ← 图中边(u, v) 的权重
            如果 v 未访问 且 dist[v] > dist[u] + weight:
                dist[v] ← dist[u] + weight  // 通过 u 到 v 更短，更新最短路径

    return dist[] // 表示起点到所有顶点的最短路径

假设顶点的个数为 $V$，边的个数为 $E$，那么最佳实现（使用了优先队列）的 dijkstra 算法时间复杂度为 $O(V+E)$。

floyd 算法

Floyd Warshall 是一种基于动态规划的方法，用于求解任意两个顶点之间的最短路径，它适用于带权有向图。

该算法的核心思想是尝试使用每一个顶点作为中转点，逐步更新所有顶点对之间的最短路径。对任意两点 $i → j$，判断是否可以通过一个中间点 $k$ 得到更短路径：

$$dist[i][j] = min(dist[i][j], dist[i][k] + dist[k][j])$$

这个过程会遍历所有可能的中转点 $k$，不断优化路径。

✨ 算法具体流程如下：

初始化距离矩阵 dist：
- dist[i][j] = 0（若 i=j）
- dist[i][j] = 边权（若 i→j 有边）
- dist[i][j] = ∞（其余情况）

三重循环更新最短路径

for k in 所有顶点:
    for i in 所有顶点:
        for j in 所有顶点:
            if dist[i][k] + dist[k][j] < dist[i][j]:
                dist[i][j] ← dist[i][k] + dist[k][j]

输出 dist 矩阵 ：表示所有顶点对之间的最短路径长度。

若顶点数为 $n$，则 Floyd Warshall 算法的时间复杂度为 $O(n^3)$，该算法适合在算法题中兜底使用，因为实现比较简单，建议大家熟练掌握代码实现。

拓扑排序

拓扑排序这样一种对图中顶点的排序方式：

将图中的所有顶点排序，使得对于每一条有向边 u → v，顶点 u 都排在 v 之前。

拓扑排序主要应用于 DAG（有向无环图）或 AOV 网，这种图没有环路，因此可以对其进行拓扑排序。

首先需要区分 AOV 和 AOE 这两个概念，注意拓扑排序适用于 AOV，关键路径适用于 AOE。

AOV 网

AOV（Activity on Vertex Network）网是一种以顶点表示活动或任务的网络模型。每个顶点代表一个任务或活动，而边表示任务之间的依赖关系。在 AOV 网中，任务或活动通常表示为顶点，而依赖关系（任务的先后顺序）表示为有向边。

算法步骤

计算拓扑排序的算法有两种，一种是 Kahn 算法（基于入度），另一种是 DFS+栈的实现。

Kahn算法

Kahn 算法的核心思想是 依次选取入度为 0 的顶点进行输出，其具体步骤如下：

选择一个没有前驱顶点（入度为 0）的顶点作为起始顶点，将其加入拓扑排序的结果序列中。
从图中移除该顶点以及与之相关的边（即将与之相邻的顶点的入度减 1）。
重复步骤 1 和步骤 2，直到所有的顶点都被加入到拓扑排序的结果序列中，或者发现图中存在环路。
如果所有的顶点都被成功加入结果序列，那么这个序列就是拓扑排序的结果。

下图展示了一个采用 Kahn 算法输出 AOE 网中的拓扑序列的实例：

DFS + 栈

此外，可以通过 DFS+栈得到拓扑序列，其步骤如下：

对图进行深度优先遍历。
每个节点 DFS 结束后将其压入栈中。
最后将栈中元素逆序输出，就是拓扑排序结果。

DFS 过程中，每个节点在其所有后继节点访问完成后才被加入栈中，因此栈中元素的逆序正好满足拓扑排序所需的“前驱先于后继”的约束。

拓扑排序的时间复杂度通常为 $O(V + E)$ ，其中 $V$ 是顶点的数量， $E$ 是边的数量。这个算法非常适合于解决任务调度和依赖关系问题，因为它可以确定任务的执行顺序或依赖关系的合理性。

关于拓扑排序，还需要关注以下几点：

拓扑排序的结果可能不唯一，因为在构建过程中往往会出现多个入度为 0 的顶点，不同的选择顺序会产生不同的合法排序结果。

如果图中 存在环路，那么无法进行拓扑排序，因为无法找到入度为 0 的顶点作为起始顶点。

关键路径

关键路径是指 AOE 网（Activity On Edge Network）中，从源点到汇点所经过的 最长路径。这条路径决定了整个项目完成所需的最短时间，因此被称为关键路径。

AOE 网

AOE（Activity on Edge Network）网是一种以边表示活动或任务的网络模型。每条边代表一个任务或活动，而顶点通常表示事件，表示任务的开始或完成时间。

为了理解关键路径，首先需要明确 AOE 网中的以下概念：

源点：在 $AOE$ 网中仅有一个入度为 $0$ 的顶点，称为开始顶点，表示整个工程的开始。
汇点：在 $AOE$ 网中仅有一个出度为 $0$ 的顶点，称为结束结点，表示整个工程的结束。
关键路径的长度：完成整个工程的最短时间，也是 $AOE$ 网中从源点到汇点的最长路径。
关键活动：关键路径上的活动。
活动的时间余量：某个活动可以被延迟的最大时间，而不会影响整个项目的最短完成时间（总工期）。
$ve(k)$：事件 $v_k$ 的最早可以发生时间。
$vl(k)$：事件 $v_k$ 的最晚可以发生时间。

有几个概念比较重要，还需要进行进一步的阐述：

事件和活动

在 AOE 网中，边代表活动（Activity），顶点代表事件（Event）。

活动（边）：表示一个具体的工作、任务或操作，具有确定的持续时间。一个活动必须在其起点事件“发生”之后才能开始。
事件（顶点）：表示一个时间点，通常是某些活动的“开始”或“结束”条件已经满足，代表某种逻辑上的时刻状态。

通俗讲：活动是“做某事”，事件是“可以开始做某事的时间点”

事件的发生时间

在 AOE 网中，一个事件的“发生”是指其所有前驱活动都已完成，这标志着“条件成熟”，从该事件出发的活动才可能被启动。

两个关键时间：

时间名称	含义	数学符号
最早发生时间	某事件最早可以发生的时间	`ve(i)`
最晚发生时间	某事件最晚必须发生的时间（不影响工期）	`vl(i)`

事件发生的判断逻辑：

一个事件是否可以发生，不看它的出边活动，而是看它的所有前驱活动（入边）是否完成：

若某事件 i 的所有进入活动（任务）都已完成 → 则事件 i 发生；
一旦事件 i 发生，其所有出边活动 可以开始，但 不必须同时开始；
出边活动的实际开始时间取决于它们自身的调度灵活性（浮动时间）。

活动时间余量

“活动的时间余量”在 AOE 网中指的是：

一个活动可以被延迟的最大时间，而不会影响整个项目的最短完成时间（总工期）。

首先，为什么要有时间余量呢？因为在 AOE 网络中，不是所有活动都在关键路径上。

关键路径上的活动：必须准时进行，没有时间余量（余量 = 0）
非关键路径上的活动：允许适当延迟，但必须不阻碍项目的最晚结束时间

时间余量可以通过以下数学公式计算：

对于一个活动 $A(i \rightarrow j)$，持续时间为 $d_{ij}$，其时间余量：

$$\text{时间余量} = vl(j) - ve(i) - d_{ij}$$

其中：

$ve(i)$：起点事件 i 的最早发生时间
$vl(j)$：终点事件 j 的最晚发生时间
$d_{ij}$：活动持续时间

关键路径和活动

关键路径上的所有活动都是 关键活动，它是决定整个工程的关键因素，因此可通过加快关键活动来缩短整个工程的工期。

关键路径和关键活动具有以下 典型特征：

关键活动的时间余量为 0：即对某活动 $A(i \rightarrow j)$ 有：
$$ vl(j) - ve(i) - d_{ij} = 0 $$
说明该活动不能被延迟任何时间，否则将影响总工期。
关键活动连接的事件满足：
$$ ve(i) = vl(i) \quad \text{且} \quad ve(j) = vl(j) $$
即活动的起点和终点事件的最早发生时间等于最晚发生时间。它们必须在确定的时间点发生，不能提前也不能推迟。
关键路径是工程中的最长路径：它决定了整个项目从开始到结束所需的最短时间，也即项目总工期。
关键路径可能有多条：若多个路径的总时长都等于项目的最短完成时间，这些路径上的活动都必须受到严格监控。

算法步骤

求解关键路径的 核心思路 在于找到所有最早发生时间和最晚发生时间相同的结点，连接这些结点即可得到关键路径。

所以在求关键路径的算法中，我们需要依次计算每个顶点的最早发生时间（ve）和最晚发生时间（vk），然后判断哪些顶点的 ve 和 vk 相等。

具体步骤：

从源点出发，令 $ve(start) = 0$ ，按照拓扑排序求其他顶点的最早发生时间 $ve$ 。
- 对于源点：$ve(start) = 0$。
- 对于后续结点：$ve(k) = \text{Max} \{ ve(j) + weight(v_j, v_k) \}$，$v_k$ 为 $v_j$ 的任意后继，$weight(v_j, v_k)$ 表示 $<v_j, v_k>$ 的权值。
从汇点出发，令 $vl(end) = ve(end)$，按逆拓扑有序求其余顶点的最迟发生时间 $vl$。
- 对于汇点：$vl(end) = 0$。
- 对于前继结点：$vl(k) = \text{Min} \{ vl(j) - weight(v_k, v_j) \}$，$v_k$ 为 $v_j$ 的任意前驱。
连接所有 $ve(i) = vl(i)$ 的结点 $i$，得到关键路径。下图中例子中所有 $ve$ 和 $vl$ 相同的结点为$v_1, v_3, v_4, v_6$，其对应的关键路径为 $v_1 \rightarrow v_3 \rightarrow v_4 \rightarrow v_6$ 即 $a_2, a_5, a_7$。

用图表达树

当表达式中存在共享的子表达式时，二叉树可能不是存储这些表达式的最有效方式，因为它会重复存储共享的子表达式。在这种情况下，可以使用有向无环图（Directed Acyclic Graph, DAG）来表示表达式，这样可以避免重复，并且更有效地表示表达式。

比如对于表达式 (x + y) * ((x + y) / x)，用二叉树和 DAG 的表示如下图：