一个线性方程组包含两类资料:变量前面的系数,以及右边的常数。当我们 解方程组时,变量符号、加号和等号的排列模式其实没有改变;真正会改变 的是那些数字。
这正是增广矩阵有用的原因。它把会被行变换改写的资料集中起来,让你不 必每做一步都重写所有变量符号。
为什么增广矩阵是恰当的包装
考虑一个有 m 条方程、n 个未知数的线性方程组:
参考笔记把它同时写成三种平行形式:
- 方程列表;
- 矩阵方程 ;
- 增广矩阵
[A|b]。
定义
系数矩阵、常数向量与增广矩阵
对于系统 :
- 称为系数矩阵;
b称为常数向量;[A|b]称为增广矩阵,即把常数列接在系数矩阵右边所得的矩阵。
中间那条直线只是记号上的提示,用来提醒你最后一列来自等号右边。它不 代表有另一种独立的矩阵运算。
还有一种很重要的列向量读法。若 的各列由左至右分别是 ,那么
这个观点在之后学习张成与列空间时会再出现。不过即使在现阶段,它也说 明了同一个线性系统可以从“按行阅读”和“按列阅读”两方面理解。
例题
把同一个系统写成三种形式
考虑
它的系数矩阵和常数向量分别是
所以这个系统可以写成 ,其中
而它的增广矩阵是
三种基本行变换
本地笔记只允许三种行变换:
- 交换两行;
- 用一个非零纯量乘一行;
- 用一行的倍数加到另一行。
第二种操作里的“非零”非常重要。若你用 0 乘一行,就会把整条方程
抹掉,而不是把它等价地改写,所以这一步不再可逆。
定义
基本行变换
对增广矩阵可做的行变换只有以下三种:
- ,其中
这三种操作称为基本行变换。
为什么这些操作会保留解集
真正要紧的,不是行变换让矩阵“变得好看”;真正要紧的是它保留了解集。
定理
行等价的增广矩阵代表等价方程组
若一个增广矩阵可由另一个增广矩阵经有限次基本行变换得到,则两者所代 表的线性方程组是等价的,也就是说,它们有完全相同的解集。
证明
逐种解释为什么基本行变换是安全的
参考笔记也特别强调“可逆”。这一点很重要,因为它把真正的等价改写, 和会破坏资料的捷径清楚分开。
把每一个行变换读成方程操作
做行变换时,不要只想“我在表格里改数字”。更准确的想法是:“我正在 用其中一条方程去改写另一条方程。”
例题
先读懂消元,再背步骤
从
开始,做
就会得到
这不是魔法,它只是表示:
- 第二条方程被换成“第二条方程减第一条方程”;
- 第三条方程被换成“第三条方程减
2倍第一条方程”。
因此,同一个系统只是被改写成更容易看出下方零项结构的形式。问题本身 没有变,变的只是呈现方式。
下一节会仔细处理高斯消元。这里最重要的观念比较基础:增广矩阵只是同 一个系统的压缩记录,而行变换之所以合法,是因为它保留解集。
实际解题时的基本策略
参考笔记把矩阵方法概括成三步:
- 先把方程组写成增广矩阵;
- 用行变换把它化成较简单的矩阵;
- 把较简单的矩阵重新读成较简单的方程组,或直接从够简单的形式读出 解答。
这个策略说起来很短,但只有当你一路清楚知道每一步保留了什么、想建立 哪种结构时,它才会真正可靠。
用下面的互动图去对照:每一个行变换符号,究竟对应系统的哪种受控改写。
边读边试
把一个方程组翻成矩阵
互动探索器会突显每条方程如何变成矩阵的一行和一个常数项。
方程组
- x + 2y = 5
- 3x - y = 4
结果
| 1 | 2 | 5 |
| 3 | -1 | 4 |
常见错误与细节
常见错误
[A|b] 中的直线不是可以忽略的墙
最后一列和前面的系数列属于同一个系统。若你只对系数做行变换而不改常 数列,你就不再是在改写同一个方程组。
常见错误
用 0 乘一行不是合法步骤
合法的缩放操作要求乘数非零。用 0 乘一行会抹掉方程,既不可逆,也不
保证保留解集。
常见错误
行变换改的是方程,不是变量的意思
行变换是把方程彼此线性组合,不是“把 换成别的东西”,也不是改 变未知数本身的意义。
快速检查
快速检查
为什么 不是合法的行变换?
请从可逆性与资料流失两方面回答。
解答
答案
快速检查
若只是交换两条方程,系统的解集会改变吗?
不要只看外观,要想“同时满足全部方程”这件事本身有没有变。
解答
答案
练习
快速检查
把系统 、、 写成增广矩阵。
即使某条方程没有出现某个变量,也要在该变量的栏位留出系数位置。
解答
引导解答
快速检查
对同一个系统,用哪一个单一步骤可以消去第一条方程中的 项?新的一条方程会是什么?
第一条方程中的 系数是 ,而第二条方程中的 系数是 1。
解答
引导解答
预备链接
这一页建立在 1.1 方程与解集 和 2.1 矩阵基础, 并为 2.3 高斯消元与 RREF 作准备。