Evanalysis
2.2有来源支持嵌入式互动预计阅读时间: 1 分钟

2.2 增广矩阵与行变换

把方程组写成 `Ax = b` 和 `[A|b]`,并严格理解为什么基本行变换会保留解集。

笔记系列

MATH1030:线性代数 I

以严谨方式整理的线性代数笔记,涵盖方程组、矩阵、结构与证明;互动只在真正有助理解数学时使用。

章节 1

方程组

学习把方程读成完整的解集。

章节 2

矩阵与消元

建立矩阵直觉,并有目的地使用行化简。

章节 3

矩阵代数

矩阵乘法、转置与结构化矩阵记号。

章节 4

解的结构

齐次方程组、零空间与完整解集的结构。

章节 5

可逆性

理解什么情况下矩阵可以被反转,以及这件事的重要性。

一个线性方程组包含两类资料:变量前面的系数,以及右边的常数。当我们 解方程组时,变量符号、加号和等号的排列模式其实没有改变;真正会改变 的是那些数字。

这正是增广矩阵有用的原因。它把会被行变换改写的资料集中起来,让你不 必每做一步都重写所有变量符号。

为什么增广矩阵是恰当的包装

考虑一个有 m 条方程、n 个未知数的线性方程组:

a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2, am1x1+am2x2++amnxn=bm.\begin{aligned} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n &= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n &= b_2, \\ &\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m. \end{aligned}

参考笔记把它同时写成三种平行形式:

  • 方程列表;
  • 矩阵方程 Ax=bAx = b
  • 增广矩阵 [A|b]

定义

系数矩阵、常数向量与增广矩阵

对于系统 Ax=bAx = b

  • AA 称为系数矩阵
  • b 称为常数向量
  • [A|b] 称为增广矩阵,即把常数列接在系数矩阵右边所得的矩阵。

中间那条直线只是记号上的提示,用来提醒你最后一列来自等号右边。它不 代表有另一种独立的矩阵运算。

还有一种很重要的列向量读法。若 AA 的各列由左至右分别是 a1,a2,,ana_1, a_2, \ldots, a_n,那么

Ax=bx1a1+x2a2++xnan=b.Ax = b \quad\Longleftrightarrow\quad x_1 a_1 + x_2 a_2 + \cdots + x_n a_n = b.

这个观点在之后学习张成与列空间时会再出现。不过即使在现阶段,它也说 明了同一个线性系统可以从“按行阅读”和“按列阅读”两方面理解。

例题

把同一个系统写成三种形式

考虑

x1+2x2+2x3=4,x1+3x2+3x3=5,2x1+6x2+5x3=6.\begin{aligned} x_1 + 2x_2 + 2x_3 &= 4, \\ x_1 + 3x_2 + 3x_3 &= 5, \\ 2x_1 + 6x_2 + 5x_3 &= 6. \end{aligned}

它的系数矩阵和常数向量分别是

A=[122133265],b=[456].A = \begin{bmatrix} 1 & 2 & 2 \\ 1 & 3 & 3 \\ 2 & 6 & 5 \end{bmatrix}, \qquad b = \begin{bmatrix} 4 \\ 5 \\ 6 \end{bmatrix}.

所以这个系统可以写成 Ax=bAx = b,其中

x=[x1x2x3],x = \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix},

而它的增广矩阵是

[122413352656].\left[ \begin{array}{ccc|c} 1 & 2 & 2 & 4 \\ 1 & 3 & 3 & 5 \\ 2 & 6 & 5 & 6 \end{array} \right].

三种基本行变换

本地笔记只允许三种行变换:

  1. 交换两行;
  2. 用一个非零纯量乘一行;
  3. 用一行的倍数加到另一行。

第二种操作里的“非零”非常重要。若你用 0 乘一行,就会把整条方程 抹掉,而不是把它等价地改写,所以这一步不再可逆。

定义

基本行变换

对增广矩阵可做的行变换只有以下三种:

  1. RiRjR_i \leftrightarrow R_j
  2. RiαRiR_i \leftarrow \alpha R_i,其中 α0\alpha \ne 0
  3. RjαRi+RjR_j \leftarrow \alpha R_i + R_j

这三种操作称为基本行变换

为什么这些操作会保留解集

真正要紧的,不是行变换让矩阵“变得好看”;真正要紧的是它保留了解集。

定理

行等价的增广矩阵代表等价方程组

若一个增广矩阵可由另一个增广矩阵经有限次基本行变换得到,则两者所代 表的线性方程组是等价的,也就是说,它们有完全相同的解集。

证明

逐种解释为什么基本行变换是安全的

参考笔记也特别强调“可逆”。这一点很重要,因为它把真正的等价改写, 和会破坏资料的捷径清楚分开。

把每一个行变换读成方程操作

做行变换时,不要只想“我在表格里改数字”。更准确的想法是:“我正在 用其中一条方程去改写另一条方程。”

例题

先读懂消元,再背步骤

[122413352656]\left[ \begin{array}{ccc|c} 1 & 2 & 2 & 4 \\ 1 & 3 & 3 & 5 \\ 2 & 6 & 5 & 6 \end{array} \right]

开始,做

R2R2R1,R3R32R1.R_2 \leftarrow R_2 - R_1, \qquad R_3 \leftarrow R_3 - 2R_1.

就会得到

[122401110212].\left[ \begin{array}{ccc|c} 1 & 2 & 2 & 4 \\ 0 & 1 & 1 & 1 \\ 0 & 2 & 1 & -2 \end{array} \right].

这不是魔法,它只是表示:

  • 第二条方程被换成“第二条方程减第一条方程”;
  • 第三条方程被换成“第三条方程减 2 倍第一条方程”。

因此,同一个系统只是被改写成更容易看出下方零项结构的形式。问题本身 没有变,变的只是呈现方式。

下一节会仔细处理高斯消元。这里最重要的观念比较基础:增广矩阵只是同 一个系统的压缩记录,而行变换之所以合法,是因为它保留解集。

实际解题时的基本策略

参考笔记把矩阵方法概括成三步:

  1. 先把方程组写成增广矩阵;
  2. 用行变换把它化成较简单的矩阵;
  3. 把较简单的矩阵重新读成较简单的方程组,或直接从够简单的形式读出 解答。

这个策略说起来很短,但只有当你一路清楚知道每一步保留了什么、想建立 哪种结构时,它才会真正可靠。

用下面的互动图去对照:每一个行变换符号,究竟对应系统的哪种受控改写。

边读边试

把一个方程组翻成矩阵

互动探索器会突显每条方程如何变成矩阵的一行和一个常数项。

方程组

  1. x + 2y = 5
  2. 3x - y = 4

结果

125
3-14

常见错误与细节

常见错误

[A|b] 中的直线不是可以忽略的墙

最后一列和前面的系数列属于同一个系统。若你只对系数做行变换而不改常 数列,你就不再是在改写同一个方程组。

常见错误

0 乘一行不是合法步骤

合法的缩放操作要求乘数非零。用 0 乘一行会抹掉方程,既不可逆,也不 保证保留解集。

常见错误

行变换改的是方程,不是变量的意思

行变换是把方程彼此线性组合,不是“把 x2x_2 换成别的东西”,也不是改 变未知数本身的意义。

快速检查

快速检查

为什么 Ri0RiR_i \leftarrow 0R_i 不是合法的行变换?

请从可逆性与资料流失两方面回答。

解答

答案

快速检查

若只是交换两条方程,系统的解集会改变吗?

不要只看外观,要想“同时满足全部方程”这件事本身有没有变。

解答

答案

练习

快速检查

把系统 x12x2x3+x4=1x_1 - 2x_2 - x_3 + x_4 = 1x2+x3x4=2x_2 + x_3 - x_4 = 2x3+2x4=3x_3 + 2x_4 = 3 写成增广矩阵。

即使某条方程没有出现某个变量,也要在该变量的栏位留出系数位置。

解答

引导解答

快速检查

对同一个系统,用哪一个单一步骤可以消去第一条方程中的 x2x_2 项?新的一条方程会是什么?

第一条方程中的 x2x_2 系数是 2-2,而第二条方程中的 x2x_2 系数是 1

解答

引导解答

预备链接

这一页建立在 1.1 方程与解集2.1 矩阵基础, 并为 2.3 高斯消元与 RREF 作准备。

本单元重点词汇