2.2 增广矩阵与行变换

一个线性方程组包含两类资料：变量前面的系数，以及右边的常数。当我们解方程组时，变量符号、加号和等号的排列模式其实没有改变；真正会改变的是那些数字。

这正是增广矩阵有用的原因。它把会被行变换改写的资料集中起来，让你不必每做一步都重写所有变量符号。

为什么增广矩阵是恰当的包装

考虑一个有 m 条方程、n 个未知数的线性方程组：

\begin{aligned} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n &= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n &= b_2, \\ &\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m. \end{aligned}

参考笔记把它同时写成三种平行形式：

方程列表；
矩阵方程 $Ax = b$ ；
增广矩阵 [A|b]。

定义

系数矩阵、常数向量与增广矩阵

对于系统 $Ax = b$ ：

$A$ 称为系数矩阵；
b 称为常数向量；
[A|b] 称为增广矩阵，即把常数列接在系数矩阵右边所得的矩阵。

中间那条直线只是记号上的提示，用来提醒你最后一列来自等号右边。它不代表有另一种独立的矩阵运算。

还有一种很重要的列向量读法。若 $A$ 的各列由左至右分别是 $a_1, a_2, \ldots, a_n$ ，那么

Ax = b \quad\Longleftrightarrow\quad x_1 a_1 + x_2 a_2 + \cdots + x_n a_n = b.

这个观点在之后学习张成与列空间时会再出现。不过即使在现阶段，它也说明了同一个线性系统可以从“按行阅读”和“按列阅读”两方面理解。

例题

把同一个系统写成三种形式

考虑

\begin{aligned} x_1 + 2x_2 + 2x_3 &= 4, \\ x_1 + 3x_2 + 3x_3 &= 5, \\ 2x_1 + 6x_2 + 5x_3 &= 6. \end{aligned}

它的系数矩阵和常数向量分别是

A = \begin{bmatrix} 1 & 2 & 2 \\ 1 & 3 & 3 \\ 2 & 6 & 5 \end{bmatrix}, \qquad b = \begin{bmatrix} 4 \\ 5 \\ 6 \end{bmatrix}.

所以这个系统可以写成 $Ax = b$ ，其中

x = \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix},

而它的增广矩阵是

\left[ \begin{array}{ccc|c} 1 & 2 & 2 & 4 \\ 1 & 3 & 3 & 5 \\ 2 & 6 & 5 & 6 \end{array} \right].

三种基本行变换

本地笔记只允许三种行变换：

交换两行；
用一个非零纯量乘一行；
用一行的倍数加到另一行。

第二种操作里的“非零”非常重要。若你用 0 乘一行，就会把整条方程抹掉，而不是把它等价地改写，所以这一步不再可逆。

定义

基本行变换

对增广矩阵可做的行变换只有以下三种：

$R_i \leftrightarrow R_j$
$R_i \leftarrow \alpha R_i$ ，其中 $\alpha \ne 0$
$R_j \leftarrow \alpha R_i + R_j$

这三种操作称为基本行变换。

为什么这些操作会保留解集

真正要紧的，不是行变换让矩阵“变得好看”；真正要紧的是它保留了解集。

定理

行等价的增广矩阵代表等价方程组

若一个增广矩阵可由另一个增广矩阵经有限次基本行变换得到，则两者所代表的线性方程组是等价的，也就是说，它们有完全相同的解集。

证明

逐种解释为什么基本行变换是安全的

参考笔记也特别强调“可逆”。这一点很重要，因为它把真正的等价改写，和会破坏资料的捷径清楚分开。

把每一个行变换读成方程操作

做行变换时，不要只想“我在表格里改数字”。更准确的想法是：“我正在用其中一条方程去改写另一条方程。”

例题

先读懂消元，再背步骤

从

\left[ \begin{array}{ccc|c} 1 & 2 & 2 & 4 \\ 1 & 3 & 3 & 5 \\ 2 & 6 & 5 & 6 \end{array} \right]

开始，做

R_2 \leftarrow R_2 - R_1, \qquad R_3 \leftarrow R_3 - 2R_1.

就会得到

\left[ \begin{array}{ccc|c} 1 & 2 & 2 & 4 \\ 0 & 1 & 1 & 1 \\ 0 & 2 & 1 & -2 \end{array} \right].

这不是魔法，它只是表示：

第二条方程被换成“第二条方程减第一条方程”；
第三条方程被换成“第三条方程减 2 倍第一条方程”。

因此，同一个系统只是被改写成更容易看出下方零项结构的形式。问题本身没有变，变的只是呈现方式。

下一节会仔细处理高斯消元。这里最重要的观念比较基础：增广矩阵只是同一个系统的压缩记录，而行变换之所以合法，是因为它保留解集。

实际解题时的基本策略

参考笔记把矩阵方法概括成三步：

先把方程组写成增广矩阵；
用行变换把它化成较简单的矩阵；
把较简单的矩阵重新读成较简单的方程组，或直接从够简单的形式读出解答。

这个策略说起来很短，但只有当你一路清楚知道每一步保留了什么、想建立哪种结构时，它才会真正可靠。

用下面的互动图去对照：每一个行变换符号，究竟对应系统的哪种受控改写。

边读边试

把一个方程组翻成矩阵

互动探索器会突显每条方程如何变成矩阵的一行和一个常数项。

方程组

x + 2y = 5
3x - y = 4

结果

1	2	5
3	-1	4

常见错误与细节

常见错误

`[A|b]` 中的直线不是可以忽略的墙

最后一列和前面的系数列属于同一个系统。若你只对系数做行变换而不改常数列，你就不再是在改写同一个方程组。

常见错误

用 `0` 乘一行不是合法步骤

合法的缩放操作要求乘数非零。用 0 乘一行会抹掉方程，既不可逆，也不保证保留解集。

常见错误

行变换改的是方程，不是变量的意思

行变换是把方程彼此线性组合，不是“把 $x_2$ 换成别的东西”，也不是改变未知数本身的意义。

快速检查

为什么 $R_i \leftarrow 0R_i$ 不是合法的行变换？

请从可逆性与资料流失两方面回答。

解答

答案

快速检查

若只是交换两条方程，系统的解集会改变吗？

不要只看外观，要想“同时满足全部方程”这件事本身有没有变。

解答

答案

练习

快速检查

把系统 $x_1 - 2x_2 - x_3 + x_4 = 1$ 、 $x_2 + x_3 - x_4 = 2$ 、 $x_3 + 2x_4 = 3$ 写成增广矩阵。

即使某条方程没有出现某个变量，也要在该变量的栏位留出系数位置。

解答

引导解答

快速检查

对同一个系统，用哪一个单一步骤可以消去第一条方程中的 $x_2$ 项？新的一条方程会是什么？

第一条方程中的 $x_2$ 系数是 $-2$ ，而第二条方程中的 $x_2$ 系数是 1。

解答

2.2 增广矩阵与行变换

MATH1030：线性代数 I

为什么增广矩阵是恰当的包装

系数矩阵、常数向量与增广矩阵

把同一个系统写成三种形式

三种基本行变换

基本行变换

为什么这些操作会保留解集

行等价的增广矩阵代表等价方程组

逐种解释为什么基本行变换是安全的

把每一个行变换读成方程操作

先读懂消元，再背步骤

实际解题时的基本策略

把一个方程组翻成矩阵

常见错误与细节

`[A|b]` 中的直线不是可以忽略的墙

用 `0` 乘一行不是合法步骤

行变换改的是方程，不是变量的意思

快速检查

为什么 $R_i \leftarrow 0R_i$ 不是合法的行变换？

答案

若只是交换两条方程，系统的解集会改变吗？

答案

练习

把系统 $x_1 - 2x_2 - x_3 + x_4 = 1$ 、 $x_2 + x_3 - x_4 = 2$ 、 $x_3 + 2x_4 = 3$ 写成增广矩阵。

引导解答

对同一个系统，用哪一个单一步骤可以消去第一条方程中的 $x_2$ 项？新的一条方程会是什么？

引导解答

预备链接

本节掌握 checkpoint

以下哪一个候选行变换不是基本行变换？

若某个行变换把 $R_3$ 换成 $R_3+2R_1$ ，哪个行变换可以把它逆转？

先备知识

本单元重点词汇

Premium learning add-ons

本系列更多笔记

2.2 增广矩阵与行变换

MATH1030：线性代数 I

为什么增广矩阵是恰当的包装

系数矩阵、常数向量与增广矩阵

把同一个系统写成三种形式

三种基本行变换

基本行变换

为什么这些操作会保留解集

行等价的增广矩阵代表等价方程组

逐种解释为什么基本行变换是安全的

把每一个行变换读成方程操作

先读懂消元，再背步骤

实际解题时的基本策略

把一个方程组翻成矩阵

常见错误与细节

[A|b] 中的直线不是可以忽略的墙

用 0 乘一行不是合法步骤

行变换改的是方程，不是变量的意思

快速检查

为什么 Ri←0RiR_i \leftarrow 0R_iRi​←0Ri​ 不是合法的行变换？

答案

若只是交换两条方程，系统的解集会改变吗？

答案

练习

把系统 x1−2x2−x3+x4=1x_1 - 2x_2 - x_3 + x_4 = 1x1​−2x2​−x3​+x4​=1、x2+x3−x4=2x_2 + x_3 - x_4 = 2x2​+x3​−x4​=2、x3+2x4=3x_3 + 2x_4 = 3x3​+2x4​=3 写成增广矩阵。

引导解答

对同一个系统，用哪一个单一步骤可以消去第一条方程中的 x2x_2x2​ 项？新的一条方程会是什么？

引导解答

预备链接

本节掌握 checkpoint

先备知识

本单元重点词汇

Premium learning add-ons

本系列更多笔记

`[A|b]` 中的直线不是可以忽略的墙

用 `0` 乘一行不是合法步骤

为什么 $R_i \leftarrow 0R_i$ 不是合法的行变换？

把系统 $x_1 - 2x_2 - x_3 + x_4 = 1$ 、 $x_2 + x_3 - x_4 = 2$ 、 $x_3 + 2x_4 = 3$ 写成增广矩阵。

对同一个系统，用哪一个单一步骤可以消去第一条方程中的 $x_2$ 项？新的一条方程会是什么？