可逆性是线性代数中最早让你感受到“一个矩阵表示一个可逆过程”的地方。对于方阵,如果它可逆,就表示有另一个方阵能够把它完全还原。更重要的是,这个概念和许多其他说法其实等价:可以行化简成单位矩阵、每个方程组 Ax=b 都有解、列向量线性无关,以及矩阵乘法可以被系统地反向处理。
这一页会把这些等价关系分开讲清楚。目标不只是会写 A−1,而是能严格判断一个方阵什么时候可逆,以及怎样可靠地算出它的逆矩阵。
开始之前
可逆性会同时用到前面几节的多个概念。读这一节之前,最好已经熟悉以下习惯。
- 矩阵乘法有顺序:一般来说,
AB 和 BA 是不同表达式。
- 单位矩阵 Ip 的作用是让每个相容向量保持不变。
- 行化简是一串受控制的行变换;只要每一步基本行变换合法,它就是可逆的。
- 齐次系统 Ax=0 用来检测 A 的列向量里是否有隐藏自由度。
- 方程组 Ax=b 唯一可解,等价于行化简后没有自由变量。
本节的新重点是:对方阵来说,这些事实不是零散知识。可逆、能行化简到单位
矩阵、没有非零零空间向量、每个系统都有唯一解,其实都是同一个定理包里的
不同语言。
左逆和右逆
先不要直接进入方阵。对一般矩阵,左逆和右逆是两个不同概念。
定义
左逆与右逆
设 A 是一个 p×q 矩阵。
- 如果一个 q×p 矩阵 H 满足 HA=Iq,那么 H 是 A 的左逆。
- 如果一个 q×p 矩阵 G 满足 AG=Ip,那么 G 是 A 的右逆。
这两个定义很重要,因为矩阵乘法不交换。对于长方形矩阵,左逆和右逆不一定同时存在;即使都存在,也不一定相同。方阵的情况更特殊。
维度也解释了“左”和“右”的含义。若 H 是左逆,它出现在 A 左边,
满足 HA=Iq;若 G 是右逆,它出现在 A 右边,满足 AG=Ip。
这两个要求不同,因为两个乘积的大小和数学意义都不同。
常见错误
不要把单侧逆命题当成对称命题
由 HA=Iq 不能直接把乘法顺序反过来,推出 AH=Ip。矩阵乘法有方向。
方阵可逆的强处,正是左右两个方向同时成立。
定义
可逆矩阵
如果 A 是一个 p×p 方阵,并且存在另一个 p×p 矩阵 B
使得
BA=AB=Ip,那么 A 称为可逆。矩阵 B 称为 A 的逆矩阵,记作 A−1。
定理
逆矩阵是唯一的
如果 B 是 A 的左逆,而 C 是 A 的右逆,那么 B=C。所以可逆矩阵只有一个逆矩阵。
什么叫可逆
可逆本质上就是“可以完全反过来”。A 做一次变换之后,如果 A−1 存在,
就能把结果准确地拉回原位。
单位矩阵 Ip 之所以出现,是因为它不会改变任何向量:
Ipx=x
对任何相容向量 x 都成立。逆矩阵就是让你回到这个“不被改变”的状态的矩阵。
例题
对角矩阵最容易看出逆矩阵
设
D=diag(2,−1,3).那么
D−1=diag(21,−1,31).原因很直接:对角线上的非零元素变成倒数,其余位置的零保持不变。把 D 和 D−1 相乘,就会得到 I3。
行化简和逆矩阵
实际计算逆矩阵时,最可靠的方法是行化简。课程材料的核心想法分成两步:
- 行变换矩阵本身可逆,而且它的逆就是反向行变换矩阵;
- 一个方阵可逆,当且仅当它能够被行化简到 Ip。
定理
行变换矩阵是可逆的
如果 ρ 是一个对 p 行矩阵进行的行变换,而 ρˉ 是对应的反向行变换,那么行变换矩阵 M[ρ] 和 M[ρˉ] 满足
M[ρ]−1=M[ρˉ],M[ρˉ]−1=M[ρ].
所以每一步行化简,其实都是在左乘一个可逆矩阵。这个观点会让后面的很多证明更清楚。
定理
可逆性和行化简
对一个方阵 A,以下命题等价:
- A 可逆;
- A 与 Ip 行等价;
- A 是若干个行变换矩阵的乘积;
- A 是非奇异矩阵。
所以当你把 A 和 Ip 并排写成 [A∣Ip],再做行化简时,
如果左边最后变成 Ip,右边就会读出 A−1。
边读边试
跟着看一个用行化简求逆的例子
互动示范让你逐步把 [A | I] 化简,直到左边变成 I。
由 [A | I] 开始。若 A 可逆,行化简会把左边化成 I。
上面的交互示范直接展示“把 [A | I] 化到左边变成 I”到底是什么意思。它不是定义本身,而是和定义完全一致的计算方法。
边读边试
跟着走完一条行化简路径
互动步骤器会带你走完一条完整的消元路径,逐步显示行变换、正在处理的主元,以及每一步得到的矩阵。
要留意什么
第 1 列的第一行已经有方便的主元 1,所以暂时不用换行。
先由增广矩阵开始。第一个主元的工作,是帮我们把它下面的元素清掉。
第二个交互工具显示一条完整的消元路径。对于可逆矩阵,重点不是“做了多少步”,而是“左边最后真的化成了 Ip”。
等价表述
可逆性有一个非常重要的“字典”:它可以用很多不同语言来描述。
定理
识别可逆矩阵的等价条件
设 A 是一个 p×p 矩阵。以下命题等价:
- A 可逆。
- A 与 Ip 行等价。
- A 是若干个行变换矩阵的乘积。
- A 有左逆。
- A 有右逆。
- A 是非奇异矩阵。
- 对每个
p 维列向量 b,方程组 Ax=b 都相容。
- 对每个
p 维列向量 b,方程组 Ax=b 都有唯一解,且解为 x=A−1b。
其中两个最实用:
- 第 7 点说明:A 的列向量张成 Rp。
- 第 8 点说明:一旦可逆,就不只是“有解”,而是可以直接写出解。
所以可逆性正是矩阵解方程组时最核心的代数条件。
如何使用可逆性的等价字典
上面的等价条件不是拿来死背的一长串列表,而是解题工具。做题时,应选择最
接近已知信息的那一种表述。
- 如果题目给了行化简过程,就读主元位置:方阵可逆,当且仅当每一列都有主元。
- 如果题目给了 A−1 或某个方阵的单侧逆,就用单位矩阵和矩阵乘法做代数推理。
- 如果题目给了非零向量
v 且 Av=0,就用零空间条件证明 A 不可逆。
- 如果题目问所有系统 Ax=b,就把问题翻译成“每个
b 是否都有唯一原像”。
例题
非零零空间向量可以证明不可逆
设 A 是方阵,并且
v=1−21=0,Av=0.那么 A 不可能可逆。理由是:若 A−1 存在,把 Av=0 左乘
A−1,就会得到
A−1Av=A−10.左边等于 v,右边等于 0,于是会推出 v=0。这和已知的非零向量矛盾。
因此,只要找到一个非零的 Ax=0 解,就已经证明 A 是奇异矩阵。
例题
用逆矩阵解方程组
设
A−1=[20−13],b=[5−1].若 Ax=b,两边左乘 A−1:
x=A−1b=[20−13][5−1]=[11−3].逆矩阵不只是“把 A 反过来”的符号,它给出了唯一解的明确公式。
从可逆矩阵角度理解行等价
现在把行变换观点再向前推进一步:不只把行等价理解成一连串行变换,而是
把整个过程打包成左边乘上一个可逆矩阵。
定理
行等价等同于左乘一个可逆矩阵
设 A 和 B 是有 p 行的矩阵。以下命题等价:
- A 和 B 行等价;
- 存在一个可逆的 p×p 矩阵 G,使得
B=GA.并且一旦 B=GA,就同时有
A=G−1B.
这个定理不是另一种计算技巧,而是对同一现象更干净的表达。任何有限步行
变换都可以压缩成左边一个可逆矩阵 G;反向行变换则由 G−1 编码。
例题
把行等价读成一条矩阵等式
设
A=110021131,G=1−10010001.矩阵 G 正是行变换
R2←R2−R1对应的行变换矩阵。所以
GA=100021121.如果把这个新矩阵记作 B,那么就有 B=GA。这一条等式已经完整记录了
这次行变换。因为 G 可逆,所以 A 和 B 行等价。
它的理论价值很高。只要知道行等价就是左乘一个可逆矩阵,后面很多“什么量
被保留”的结论都可以一行说明。
定理
行变换保留对应列向量之间的线性关系
设 A 和 B 是行等价的 p×q 矩阵,并把它们的列写成
A=[a1a2⋯aq],B=[b1b2⋯bq].如果
aj=α1ak1+α2ak2+⋯+αnakn,那么必然有
bj=α1bk1+α2bk2+⋯+αnbkn.特别地,对应列之间的线性相关和线性无关,都会被行等价保留。
一旦知道 B=GA,证明就很短。把 A 的列关系左乘 G,由矩阵乘法的线
性性质可得
Gaj=α1Gak1+α2Gak2+⋯+αnGakn,
这正是 B 的对应列满足同一组系数关系。
这个结果就是从行化简走向列语言的桥梁。行变换会改变列向量本身,但不会改
变哪些列是多余的,也不会改变某一列如何由其他列线性表示。
为什么 RREF 是唯一的
在每个行等价类里,最简行阶梯形其实只有一个。这一点很容易被忽略,但它
正是后面定义能够成立的基础。
定理
每个行等价类只有一个最简行阶梯形
设 A 是一个矩阵,B 和 C 都是 reduced row-echelon form。若 B
与 A 行等价,而 C 也与 A 行等价,那么
B=C.
标准证明会对秩做数学归纳。核心策略是:
- 从左到右比较主元列;
- 用“线性关系被保留”来迫出相同的主元位置;
- 再证明每一个自由列都必须以同样的系数由前面的主元列组合而成。
所以 RREF 不只是“某个方便的最后形状”,而是该行等价类中唯一的最后
形状。
定义
秩
一个矩阵的秩,就是它的 reduced row-echelon form 中主元的数目。
这个定义之所以成立,正因为 RREF 是唯一的。如果不同消元路径会得到不同
RREF,那么主元数目就会跟算法一起改变,rank 便不会是良定的。
列向量的无关与线性组合
可逆性也可以用列向量语言来读。
定理
可逆性和列向量
对一个 p×p 矩阵 A,以下命题等价:
- A 可逆;
- A 的列向量线性无关;
- Rp 中每个向量都可以写成 A 的列向量的线性组合。
这三句话其实是同一件事的三种说法。
如果列向量线性无关,就表示没有一列是多余的。
如果列向量张成 Rp,就表示每个目标向量都能构造出来。
对方阵来说,这两个条件同时成立,正是可逆。
转置和幂次
可逆性和转置也相容。
定理
转置与幂次
如果 A 可逆,那么:
- At 也可逆,而且 (At)−1=(A−1)t;
- An 对每个整数
n 都可逆,而且 (An)−1=(A−1)n。
转置结果方便你把关于列的命题改写成关于行的命题;幂次结果则适合处理重复出现的变换。
乘积等于单位矩阵时怎样推理
有些练习题不会直接给你一个矩阵并要求求逆,而是给出
ABCD=I
这类乘积关系,然后问哪些较短乘积或循环重排必然可逆。正确方法不是把矩阵
任意交换顺序,而是小心分组,并使用方阵情形下的一侧逆信息。
定理
方阵情形下,一侧单位等式已经足够
设 P 和 Q 是同大小方阵。若
PQ=I,则 P 和 Q 都可逆,而且
Q=P−1,QP=I.
这是方阵特别重要的原因之一。对于长方形矩阵,一侧逆不一定是双侧逆;但在
本节的方阵设定中,可逆性等价字典允许我们把一侧单位等式提升为真正的逆矩
阵关系。
例题
由 ABCD=I 得到循环恒等式
假设 A,B,C,D 都是 5×5 矩阵,且
ABCD=I5.先把乘积分组成
(ABC)D=I5.由一侧单位等式的定理,ABC 和 D 互为逆矩阵。因此
DABC=I5.再用已经证明的循环等式继续分组,可以得到
CDAB=I5,BCDA=I5.所以 BCDA、CDAB 和 DABC 确实必然等于 I5。但像 DCBA 或
DBAC 这些任意重排则没有被迫成立;矩阵乘法仍然不可交换。
安全的解题流程是:
- 除非有定理支持,否则保持题目给出的顺序;
- 把相邻因子分组成 PQ=I;
- 用方阵可逆性把它反向成 QP=I;
- 只在已证明的等式上继续推理。
如何处理可逆性题目
当题目问一个矩阵是否可逆时,不要一开始就随机猜逆矩阵的元素。先判断哪种
证据最省力。
- 先确认矩阵是方阵。非方阵没有本节意义下的双侧逆。
- 如果给出具体元素,就行化简,并检查每一列是否都有主元。
- 如果后面课程中已经给出行列式,可用 det(A)=0;在行列式出现之前,
主要用主元、秩或零空间。
- 如果题目给出候选逆矩阵,就按需要的顺序相乘,检查是否得到单位矩阵。
- 如果题目给出非零零空间向量或列关系,就可以立即推出不可逆。
这样的顺序能避免无意义的长计算。关键不是做最多步骤,而是选一个合法的等价
条件,并把它用清楚。
例题
例题
用行化简求逆矩阵
设
A=[1325].先写出 [A∣I2]:
[13251001].先消去左下角的 3:
[102−11−301].再把第二行除以 −1,然后清掉第一行第二列:
[1001−532−1].因此
A−1=[−532−1].
重点不只是算出答案,而是看清楚:当左边变成单位矩阵时,右边自然就是逆矩阵。
练习式逆矩阵计算
在进阶练习中,逆矩阵问题通常不会像第一个 2×2 例子那样短。矩阵
可能含有参数,或者行化简只以压缩步骤呈现。不过核心规则不变:
[A∣Ip]∼[Ip∣B]⟹B=A−1.
若左边不能化成 Ip,矩阵就不可逆;若左边化成 Ip,右边不是附属计
算,而正是逆矩阵。
例题
由行化简得到参数化逆矩阵
对实数 α,令
Aα=11012302111122α3.把增广矩阵 [Aα∣I4] 行化简,得到
10000100001000015−α−1α−1−2100−1010α−20−α1.由于左边对每个实数 α 都是 I4,矩阵 Aα 对每个实数
α 都可逆,而且
Aα−1=5−α−1α−1−2100−1010α−20−α1.请注意这个结论的意思。参数仍然留在逆矩阵中;它不是需要解出的未知数。
行化简真正说明的是:没有任何 α 会让左边失去主元。
常见错误
不要把每个参数都当成限制条件
有时参数出现,是因为答案是一族逆矩阵,而不是因为矩阵在某些值下失效。
限制来自缺少主元或非法除以零,不是来自符号本身。
读取已给出的行化简表格
较长的逆矩阵题目,往往不会要求你从头把每一个步骤都重做,而是给出行化简链
中的某些中间阶段。只要能读懂这条链的结构,这些资料已经足够。每次应先问:
左边区块是什么形状?这迫使右边区块代表什么?
如果某个行操作序列把
[A∣Ip]化成[Ip∣D],
那么 A 可逆,而且 D=A−1。如果最后左边区块只是一个缺少主元列的
行阶梯形,即使右边区块看起来很复杂,也不能把它读成逆矩阵。
例题
由行化简表格恢复 A 并解转置系统
假设一个行化简表格显示 [A∣I4] 与 [I4∣D] 行等价,其中
D=30−31−21103−2−21−212−1.这个最终形状本身已经说明
A−1=D.如果表格前半部允许我们反向读取最初几个行操作,原本的左边区块可恢复为
A=1123111212341333.现在令
g=1030.要求解 Atx=g,不需要从头再行化简一次。因为 A 可逆,所以 At 也可逆,
并且
(At)−1=(A−1)t=Dt.因此
x=(At)−1g=Dtg=−61−34.这个计算很短,是因为行化简表格已经完成了主要工作。
例题
用主元列读四个逆矩阵计算
以下每个矩阵都用同一个方法处理:先行化简 [A∣I4],先看左边区块的
主元模式;只有当左边区块变成 I4 时,右边区块才可读作逆矩阵。
情况 (a)。 对
A1=12−14013232023334,其中一个行阶梯阶段的左边区块是
A1♯=100001003−4103−310.第四列没有主元,所以 A1 不可逆。
情况 (b)。 对
A2=1123111212341333,行化简可达到 [I4∣A2−1],其中
A2−1=30−31−21103−2−21−212−1.情况 (c)。 对
A3=13012211−103130151510,其中一个行阶梯阶段的左边区块是
A3♯=10002100−13503015−50.同样有主元列缺失,所以 A3 不可逆。
情况 (d)。 对
A4=1231133224331111,行化简可达到 [I4∣A4−1],其中
A4−1=1−2101−22−301−11−23−23.这个例子故意重复同一种判读。重点正在于:每一个情况都先由左边区块判断
可逆性,然后才决定能否把右边区块解读为逆矩阵。
例题
最后的单位区块控制整条行操作链
假设一条行操作链把 [A∣I5] 经过中间矩阵 [B∣C],最后化成
[D∣E]。在最后几步之后,所得增广矩阵是
[D∣E]=100000100000100000100000119−6−3−601200−2−18116120−32120−2001.左边区块是 I5,所以 D=I5,而
A−1=E=19−6−3−601200−2−18116120−32120−2001.于是可以立即推出 At 可逆,且
(At)−1=Et=10−20091−18−3−2−621120−30610−601221.同一条行操作链也可以被读成一次左乘。令 H 为整条链中所有行操作矩阵的
乘积。因为 HA=I5 且 HI5=E,所以 H=A−1。因此,如果同一批行操作
把 F+I5 化成 A3+3A+I5,就有
A3+3A+I5=A−1(F+I5).左乘 A 得到
F+I5=A(A3+3A+I5)=A4+3A2+A,所以
F=A4+3A2+A−I5.这里的教训是:行化简表格不只是数值计算,它也记录了一个在左边相乘的
可逆矩阵。
不用行列式的证明练习
有些证明练习会刻意要求不用行列式处理可逆性。这是很好的训练:很多逆矩阵事实其
实是关于乘积、单位矩阵与零空间的事实。
例题
由向量恒等式证明可逆
假设 A 是 7×7 矩阵,而且
A2x=Ax+x对每个 x∈R7 都成立。把含有 A 的项移到左边:
(A2−A)x=x对每个 x.因为 A2−A=(A−I7)A,这就是
((A−I7)A)x=I7x对每个 x.若两个矩阵作用在每个向量上的结果都相同,它们就是同一个矩阵,所以
(A−I7)A=I7.因此 A−I7 是 A 的左逆。由于 A 是方阵,一侧单位等式已经足够推出:
A 可逆,而且其逆矩阵是 A−I7。
例题
用反证法证明某个多项式矩阵不可逆
假设 A 和 B 是两个不同的 6×6 矩阵,且
A3=B3,A2B=B2A.我们证明 A2+B2 不可逆。令
C=A2+B2.先比较 CB 与 CA:
CB=(A2+B2)B=A2B+B3,而
CA=(A2+B2)A=A3+B2A.利用已知的 A2B=B2A 和 B3=A3,可得
CB=CA.如果 C 可逆,左乘 C−1 就会得到 B=A,这与 A、B 不同矛盾。
所以 C=A2+B2 不可逆。
常见错误
常见错误
不要把长方形矩阵的一侧逆当成另一侧逆
对于非方阵,左逆不一定等于右逆,甚至不一定存在。方阵则不同:一旦逆矩阵存在,它就同时是左逆和右逆,而且一定唯一。
常见错误
不要只凭外表判断可逆性
一个矩阵看起来简单,也不代表它一定可逆。正确方法是行化简,或者使用上面列出的等价条件。
常见错误
不要在未证明时任意交换因子
由 ABCD=I 可以通过逆矩阵理论推出某些循环恒等式,例如 DABC=I。但这
不代表可以把因子任意改排成 DCBA;除非已知矩阵彼此可交换,否则不能
这样做。
快速检查
快速检查
如果 A 可逆,A−1A 是什么?
快速检查
如果 A 可逆,齐次方程组 Ax=0 会不会有非零解?
快速检查
如果 A 可逆,At 是否可逆?
快速检查
若 B=GA,而 G 可逆,同时 A 的列满足 a3=2a1−a2,那么 B 的对应列必须满足什么关系?
保留同一组系数,并用 bj=Gaj。
快速检查
为什么定义 rank 时,RREF 的唯一性这么重要?
快速检查
若 v=0 且 Av=0,A 可以可逆吗?
快速检查
假设 A,B,C,D 都是方阵,且 ABCD=I。哪一个循环等式必然成立:DABC=I 还是 DCBA=I?
把原式分组成 (ABC)D=I。
快速检查
在上面的参数化逆矩阵中,当 α=3 时,Aα−1 的 (1,4) 元素是多少?
把 α=3 代入第一行第四列。
快速检查
若对每个向量 x 都有 A2x=Ax+x,哪个矩阵可作为 A 的逆矩阵?
把恒等式改写成 (A−I)A=I。
快速检查
若行操作把 [A∣Ip] 化成 [Ip∣D],D 是什么?
快速检查
若某个行操作乘积 H 满足 HA=Ip 且 HIp=E,H 是什么?
练习
快速检查
假设 A 可逆,而且 AB=Ip。证明 B=A−1。
可以利用逆矩阵唯一性,也可以左乘 A−1。
快速检查
假设 (A−B)A=I,其中 A 和 B 是方阵。证明 A 和 B 可交换。
先使用方阵的一侧单位等式定理,再展开 AB−BA。
先读这些页
这一页特别依赖
2.3 高斯消元与 RREF、
3.1 矩阵乘法与单位矩阵
和
3.2 转置与特殊矩阵。