Evanalysis
3.2预计阅读时间: 15 分钟

3.2 转置与特殊矩阵

用转置、对称性、不交换乘积与分块结构去理解矩阵的形状与代数行为。

课程目录

MATH1030:线性代数 I

线性代数笔记。

37

当矩阵乘法已经出现之后,矩阵的“形状”开始和它的数值一样重要。转置是 本节最基本的工具:行与列对调,主对角线变成反射轴。这个简单想法,足以说 明对称、反对称、可交换现象,以及分块矩阵的阅读方法。

转置就是把行与列对调

定义

转置

A=[aij]A = [a_{ij}] 是一个 m×nm \times n 矩阵,则它的转置 ATA^Tn×mn \times m 矩阵,其 (j,i) 位置的元素为 aija_{ij}

也就是

(AT)ji=aij.(A^T)_{ji} = a_{ij}.

所以 AA 的每一行都会变成 ATA^T 的一列,而 AA 的每一列都会变成 ATA^T 的一行。

这不是一个神秘的新运算,只是把同一批元素用相反方向重新阅读。

例题

计算一个转置

A=[142035].A = \begin{bmatrix} 1 & 4 & -2 \\ 0 & 3 & 5 \end{bmatrix}.

AT=[104325].A^T = \begin{bmatrix} 1 & 0 \\ 4 & 3 \\ -2 & 5 \end{bmatrix}.

原来的 2×32 \times 3 矩阵变成 3×23 \times 2,因为行与列的角色对调了。

几条基本恒等式,应当视作本节的核心语言:

(AT)T=A,(A+B)T=AT+BT,(cA)T=cAT.(A^T)^T = A, \qquad (A + B)^T = A^T + B^T, \qquad (cA)^T = cA^T.

若乘积有定义,转置会把次序反过来:

(AB)T=BTAT.(AB)^T = B^T A^T.

这个“反序”不是小事,而是行乘列配对被转向之后的必然结果。

例题

转置恒等式的例子

A=[1201],B=[3045].A = \begin{bmatrix} 1 & 2 \\ 0 & 1 \end{bmatrix}, \qquad B = \begin{bmatrix} 3 & 0 \\ 4 & 5 \end{bmatrix}.

A+B=[4246],(A+B)T=[4426].A + B = \begin{bmatrix} 4 & 2 \\ 4 & 6 \end{bmatrix}, \qquad (A + B)^T = \begin{bmatrix} 4 & 4 \\ 2 & 6 \end{bmatrix}.

另一方面,

AT+BT=[1021]+[3405]=[4426].A^T + B^T = \begin{bmatrix} 1 & 0 \\ 2 & 1 \end{bmatrix} + \begin{bmatrix} 3 & 4 \\ 0 & 5 \end{bmatrix} = \begin{bmatrix} 4 & 4 \\ 2 & 6 \end{bmatrix}.

乘积也是同样道理,只是次序一定要反过来:

AB=[111045],(AB)T=[114105],AB = \begin{bmatrix} 11 & 10 \\ 4 & 5 \end{bmatrix}, \qquad (AB)^T = \begin{bmatrix} 11 & 4 \\ 10 & 5 \end{bmatrix},

BTAT=[3405][1021]=[114105].B^T A^T = \begin{bmatrix} 3 & 4 \\ 0 & 5 \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 2 & 1 \end{bmatrix} = \begin{bmatrix} 11 & 4 \\ 10 & 5 \end{bmatrix}.

定理

转置的基本性质

对所有尺寸相容的矩阵,

  1. (AT)T=A(A^T)^T = A
  2. (A+B)T=AT+BT(A + B)^T = A^T + B^T
  3. (cA)T=cAT(cA)^T = cA^T
  4. (AC)T=CTAT(AC)^T = C^T A^T

乘积公式的证明值得细读一次:比较 (AC)T(AC)^TCTATC^T A^T 的对应元素, 你会发现求和中的数字没有改变,只是读取方向变了。

对称矩阵与反对称矩阵

定义

对称矩阵与反对称矩阵

AA 为方阵。

  • AT=AA^T = A,则 AA 称为对称矩阵。
  • AT=AA^T = -A,则 AA 称为反对称矩阵。

对称表示沿主对角线反射后不变。反对称表示反射后整个矩阵变号。

例题

辨认对称性

矩阵

[214130405]\begin{bmatrix} 2 & -1 & 4 \\ -1 & 3 & 0 \\ 4 & 0 & 5 \end{bmatrix}

是对称矩阵,因为 (i,j)(j,i) 位置的元素相同。

矩阵

[021204140]\begin{bmatrix} 0 & 2 & -1 \\ -2 & 0 & 4 \\ 1 & -4 & 0 \end{bmatrix}

是反对称矩阵,因为转置之后每个非对角元素都改变符号,而对角线保持 0

三个直接后果很重要:

  • 实数反对称矩阵的对角元素全部都是 0
  • 零矩阵既对称又反对称
  • 单位矩阵是对称矩阵

第三项其实只是“对角矩阵在转置下不变”的特例。

定理

两个常用的转置型态

对每一个方阵 AA

(A+AT)T=A+AT,(AAT)T=(AAT).(A + A^T)^T = A + A^T, \qquad (A - A^T)^T = -(A - A^T).

因此 A+ATA + A^T 是对称矩阵,而 AATA - A^T 是反对称矩阵。

证明

为什么成立

上一结果是最重要结构定理的起点。

定理

分解为对称部分与反对称部分

每一个方阵 AA 都可以唯一写成

A=S+K,A = S + K,

其中 SS 是对称矩阵,KK 是反对称矩阵。事实上,

S=12(A+AT),K=12(AAT).S = \frac{1}{2}(A + A^T), \qquad K = \frac{1}{2}(A - A^T).

这个证明是本节最重要的推理范例之一,因为它把直觉变成了可检查的公式。

例题

把矩阵分解成两部分

A=[101213420].A = \begin{bmatrix} 1 & 0 & 1 \\ 2 & -1 & 3 \\ 4 & 2 & 0 \end{bmatrix}.

AT=[124012130].A^T = \begin{bmatrix} 1 & 2 & 4 \\ 0 & -1 & 2 \\ 1 & 3 & 0 \end{bmatrix}.

所以

12(A+AT)=[1152115252520],\frac{1}{2}(A + A^T) = \begin{bmatrix} 1 & 1 & \frac{5}{2} \\ 1 & -1 & \frac{5}{2} \\ \frac{5}{2} & \frac{5}{2} & 0 \end{bmatrix},

12(AAT)=[0132101232120].\frac{1}{2}(A - A^T) = \begin{bmatrix} 0 & -1 & -\frac{3}{2} \\ 1 & 0 & \frac{1}{2} \\ \frac{3}{2} & -\frac{1}{2} & 0 \end{bmatrix}.

第一个矩阵是对称矩阵,第二个矩阵是反对称矩阵,而二者相加正好回到 AA

还有一个非常有用的对称型态,会在后面课题反复出现。

定理

含转置的乘积是对称的

只要乘积有定义,ATAA^T AAATA A^T 都是对称矩阵。

证明

一行证明

这也是转置在后续的正交、投影和最小平方型论证里反复出现的原因之一。

可交换与不可交换的矩阵

定义

可交换矩阵

若两个同大小的矩阵 AABB 满足

AB=BA,AB = BA,

则称它们可交换。

对加法而言,可交换性是预设;对乘法而言,可交换性却是特例。这是矩阵代 数与纯量代数最重要的差别之一。

零矩阵与单位矩阵都会和任何同大小方阵可交换。相同大小的对角矩阵彼此也可 交换,因为它们的乘积仍是对角矩阵,而且对角元素相乘本身就交换。

例题

一对不可交换的矩阵

A=[1101],B=[1011].A = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}, \qquad B = \begin{bmatrix} 1 & 0 \\ 1 & 1 \end{bmatrix}.

AB=[2111],BA=[1112].AB = \begin{bmatrix} 2 & 1 \\ 1 & 1 \end{bmatrix}, \qquad BA = \begin{bmatrix} 1 & 1 \\ 1 & 2 \end{bmatrix}.

因此 ABBAAB \ne BA

这种例子不是小插曲,而是提醒我们:矩阵恒等式里,因子的次序绝不能乱改。

定理

反对称矩阵的可交换测试

AABB 都是反对称方阵,则

AB 对称     AB=BA.AB \text{ 对称 } \iff AB = BA.

证明

为什么成立

例题

对称矩阵与反对称矩阵的组合

S=[2003],K=[0110].S = \begin{bmatrix} 2 & 0 \\ 0 & 3 \end{bmatrix}, \qquad K = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix}.

这里 SS 是对称矩阵,KK 是反对称矩阵,但二者不交换:

SK=[0230],KS=[0320].SK = \begin{bmatrix} 0 & 2 \\ -3 & 0 \end{bmatrix}, \qquad KS = \begin{bmatrix} 0 & 3 \\ -2 & 0 \end{bmatrix}.

若某一对同类矩阵真的可交换,则它们的乘积便会继续保留清楚的对称型态。

特殊矩阵

特殊矩阵的定义方式很直接:看哪些位置必须是 0。这使它们比一般矩阵更 容易阅读与计算。

定义

对角矩阵、上三角矩阵、下三角矩阵

  • 对角矩阵的所有非对角元素都是 0
  • 上三角矩阵的主对角线下方全部是 0
  • 下三角矩阵的主对角线上方全部是 0

例题

三角矩阵的转置

U=[123045006],U = \begin{bmatrix} 1 & 2 & 3 \\ 0 & 4 & 5 \\ 0 & 0 & 6 \end{bmatrix},

UT=[100240356].U^T = \begin{bmatrix} 1 & 0 & 0 \\ 2 & 4 & 0 \\ 3 & 5 & 6 \end{bmatrix}.

所以上三角矩阵的转置是下三角矩阵。

几个结构性事实要一起记:

  • 两个对角矩阵相乘仍是对角矩阵
  • 两个上三角矩阵相乘仍是上三角矩阵
  • 两个下三角矩阵相乘仍是下三角矩阵

对角矩阵尤其简单:

diag(d1,,dn)diag(e1,,en)=diag(d1e1,,dnen).\operatorname{diag}(d_1,\dots,d_n)\, \operatorname{diag}(e_1,\dots,e_n) = \operatorname{diag}(d_1 e_1,\dots,d_n e_n).

这也是为什么同大小的对角矩阵彼此都可交换。

常见错误

不要把零结构和矩阵本身混淆

上三角矩阵可以在对角线上方有很多非零元素,但对角线下方一定是 0。对角 矩阵更严格:所有非对角元素都必须是 0

分块矩阵

大矩阵若分成几个小块,往往更容易阅读。分块矩阵仍然只是矩阵,只是多了一 层组织方式。

定义

分块矩阵

若把矩阵用横线和竖线分隔成若干子矩阵,这些子矩阵就叫做 block(分块)。

例如

A=[1021340152637810]=[A11A12A21A22],A = \begin{bmatrix} 1 & 0 & 2 & 1 \\ 3 & 4 & 0 & -1 \\ 5 & 2 & 6 & 3 \\ 7 & 8 & 1 & 0 \end{bmatrix} = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix},

其中

A11=[1034],A12=[2101],A21=[5278],A22=[6310].A_{11} = \begin{bmatrix} 1 & 0 \\ 3 & 4 \end{bmatrix}, \quad A_{12} = \begin{bmatrix} 2 & 1 \\ 0 & -1 \end{bmatrix}, \quad A_{21} = \begin{bmatrix} 5 & 2 \\ 7 & 8 \end{bmatrix}, \quad A_{22} = \begin{bmatrix} 6 & 3 \\ 1 & 0 \end{bmatrix}.

在分块层面,转置只会把块的位置互换,并且把每一块本身也转置:

AT=[A11TA21TA12TA22T].A^T = \begin{bmatrix} A_{11}^T & A_{21}^T \\ A_{12}^T & A_{22}^T \end{bmatrix}.

这其实就是同一条“行与列对调”原理,只是从元素层面推广到分块层面。

例题

分块乘法

若分块大小相容,设

M=[ABCD],N=[EFGH].M = \begin{bmatrix} A & B \\ C & D \end{bmatrix}, \qquad N = \begin{bmatrix} E & F \\ G & H \end{bmatrix}.

MN=[AE+BGAF+BHCE+DGCF+DH].MN = \begin{bmatrix} AE + BG & AF + BH \\ CE + DG & CF + DH \end{bmatrix}.

这个公式看起来就像 2×22 \times 2 的普通矩阵乘法,只不过每一个位置现在都 是一个分块。

真正要留意的是相容性:只有当内部块的尺寸对得上,分块乘法才有意义。若分 块方式不配合,这种写法就不能直接使用。

常见错误

常见错误

转置乘积时,次序一定反转

正确公式是 (AB)T=BTAT(AB)^T = B^T A^T,不是 ATBTA^T B^T

常见错误

对称不等于可交换

对称是单一矩阵的性质,可交换是两个矩阵之间的性质。两者不是同一件事。

常见错误

实数反对称矩阵的对角线一定是零

AT=AA^T = -A,每个对角元素都要等于自己的相反数,所以只能是 0

常见错误

分块大小一定要相容

只有在块与块的尺寸能匹配时,才能把分块矩阵当成一个整体来乘。

快速检查

快速检查

AA3×23 × 2 矩阵,ATA^T 的大小是什么?

把行与列对调。

解答

答案

快速检查

实数反对称矩阵的对角元素必须是什么?

AT=AA^T = -A 套在对角位置。

解答

答案

快速检查

哪一条公式正确:(AB)T=ATBT(AB)^T = A^T B^T 还是 (AB)T=BTAT(AB)^T = B^T A^T

记住转置会反转乘法次序。

解答

答案

快速检查

SS 是对称矩阵,KK 是反对称矩阵,则 STS^TKTK^T 各是多少?

直接读定义。

解答

答案

引导练习

快速检查

A=[[2,1],[4,3]]A = [[2,1],[4,3]] 分解成对称部分与反对称部分。

使用 S=1/2(A+AT)S = 1/2 (A + A^T)K=1/2(AAT)K = 1/2 (A - A^T)

解答

引导解答

快速检查

AABB 都是对称矩阵,而 AB=BAAB = BA,为什么 AB 也是对称矩阵?

使用转置公式与可交换假设。

解答

引导解答

相关笔记

本节建立在 3.1 矩阵乘法与单位矩阵 之上。若想看解集结构,下一节可读 4.1 齐次方程组与零空间

本节掌握 checkpoint

要完成这一节 checkpoint,需要把每一题答对。 答对进度: 0%.

技能点: transpose, matrix-dimensions

若 A 是 2×5,A^T 的大小是什么?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

技能点: transpose, matrix-identities

填空:对每个矩阵 A,都有 (A^T)^T = ____。

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

输入格式提示: 输入像 AA 这样的简短符号答案即可。

技能点: transpose, special-matrices, symmetric-matrix

若 A 是对称矩阵,必须满足哪个条件?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

技能点: transpose, symmetric-matrix, matrix-algebra

对任意方阵 AA,关于 A+ATA + A^T 可以说什么?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

本单元重点词汇

Premium learning add-ons

Core notes stay free. Advanced exercises, video explanations, and premium exports are available through paid plans.