Article

四大空间

总结自《新版演习线性代数_寺田文行》一书,使用最小笔记的形式去记录。

April 15, 2026 修考 9 min read

[TOC]

什么是“解方程”

从四大空间的角度看,线性方程组最关心的是两个问题:

  • Ax=bAx = b:右侧向量 bb 是否属于矩阵 AA 的列空间 C(A)C(A)
  • Ax=0Ax = 0:矩阵 AA 的零空间 N(A)N(A) 长什么样。

进一步地:

  • 行空间 C(AT)C(A^T) 与零空间 N(A)N(A) 互为正交补。
  • 列空间 C(A)C(A) 与左零空间 N(AT)N(A^T) 互为正交补。

所以,研究四大空间,本质上就是在研究:方程有没有解、解有几个、解长什么样。

为什么关心矩阵是否奇异

我们关心一个矩阵是否 singular,本质上是在问:这个线性变换是否可逆。

  • 如果 AA 可逆,那么 Ax=bAx = b 可以直接写成 x=A1bx = A^{-1}b
  • 对于 n×nn \times n 方阵来说,可逆、满秩、行列式非零,这些条件是等价的。

什么是 full rank

对一个 n×nn \times n 方阵来说,full rank 的意思是:

  • 每一列都对应一个主元(pivot)。
  • 没有自由变量(free variable)。
  • 列向量线性无关。
  • 列空间能够张成整个 Rn\mathbb{R}^n

这和“行列式不为零”并不冲突;在方阵情形下,它们本来就是同一件事的不同表述。

通解的结构(Complete Solution)

对于一般的线性方程组 Ax=bAx = b,它的通解可以写成

x=xp+xnx = x_p + x_n
  • xpx_p:特解(particular solution),满足 Ax=bAx = b
  • xnx_n:齐次解/零空间解(homogeneous solution),满足 Ax=0Ax = 0,因此 xnN(A)x_n \in N(A)

这说明:非齐次方程组的所有解,都可以看成“一个特解 + 一个零空间中的向量”。

解线性方程组的方法

1. 克拉默法则(Cramer’s Rule)

对于线性方程组 Ax=dA\mathbf{x} = \mathbf{d},如果 A0|A| \ne 0,那么

xi=b1dbnAx_i = \frac{|\mathbf{b}_1 \cdots \mathbf{d} \cdots \mathbf{b}_n|}{|A|}

其中,分子表示把 AA 的第 ii 列替换为常数向量 d\mathbf{d} 后得到的行列式。

2. 逆矩阵法

如果 AA 可逆,那么

Ax=bx=A1bAx = b \Rightarrow x = A^{-1}b

3. 高斯消元法

高斯消元法最通用。它通过初等行变换把矩阵化为行阶梯形或简化行阶梯形,从而直接看出主元、自由变量以及解的结构。

image-20260415100316383

解的形式是 通解 + 特解

通解

每次令一个自由变量为1

然后用这个自由变量来表示其他的主元。

特解

令所有的自由变量为0

求出主元对应的内容。

逆矩阵怎么求

1. 定义法

设未知矩阵 XX,直接由

AX=XA=EAX = XA = E

求出 XX

2. 伴随矩阵法

A1=1Aadj(A)=1At[Aij]A^{-1} = \frac{1}{|A|}\operatorname{adj}(A) = \frac{1}{|A|}{}^t[A_{ij}]

其中,adj(A)\operatorname{adj}(A)AA 的伴随矩阵,也就是余因子矩阵的转置。

3. 增广矩阵法

构造增广矩阵 [AE][A \mid E],再通过同步行变换把左边的 AA 化为单位矩阵 EE。此时右边就会自动变成 A1A^{-1}

操作步骤

  1. 写出增广矩阵 [AE][A \mid E]
  2. 通过行变换把左侧化为上三角,再继续化成单位矩阵。
  3. 当左侧变成 EE 时,右侧就是所求的 A1A^{-1}

例如,若计算结果为

A1=[1113/51/52/54/53/51/5]=15[555312431]A^{-1} = \begin{bmatrix} -1 & 1 & -1 \\ 3/5 & -1/5 & 2/5 \\ -4/5 & 3/5 & -1/5 \end{bmatrix} = \frac{1}{5} \begin{bmatrix} -5 & 5 & -5 \\ 3 & -1 & 2 \\ -4 & 3 & -1 \end{bmatrix}

逆矩阵存在的判定

对于 nn 阶方阵 AA,下列条件等价:

  1. A0|A| \ne 0
  2. 存在 XX 使得 AX=EAX = E,或存在 XX 使得 XA=EXA = E
  3. 对任意 b\mathbf{b},方程 Ax=bA\mathbf{x} = \mathbf{b} 有唯一解。
  4. AA 可以表示为一系列初等矩阵的乘积。
  5. rank(A)=n\operatorname{rank}(A) = n

实际做题时:

  • 小矩阵常用行列式判断。
  • 大矩阵更常用高斯消元法判断。

解的个数

用四大空间来理解

  • 无解bC(A)b \notin C(A),也就是 bb 不在列空间里。
  • 唯一解bC(A)b \in C(A)N(A)N(A) 只有零向量。
  • 无穷多解bC(A)b \in C(A)N(A)N(A) 包含非零向量,也就是存在自由变量。
    • 这也是我们常说的非自明解

秩判别标准

rank(A)=rank([Ab])=n唯一解\operatorname{rank}(A) = \operatorname{rank}([A \mid b]) = n \Rightarrow \text{唯一解} rank(A)=rank([Ab])<n无穷多解\operatorname{rank}(A) = \operatorname{rank}([A \mid b]) < n \Rightarrow \text{无穷多解} rank(A)<rank([Ab])无解\operatorname{rank}(A) < \operatorname{rank}([A \mid b]) \Rightarrow \text{无解}

LU 分解与消去矩阵

高斯消去法的每一步,都可以看成左乘一个初等矩阵(elimination matrix)。

例如:

  • E21AE_{21}A 表示消去位置 (2,1)(2, 1) 的元素。
  • 整个消去过程可以写成
GFEA=UGFEA = U

其中 UU 是上三角矩阵。

把这些消去矩阵合并起来,也可以写成

PA=UPA = U

因为 PP 本身就是由一系列初等矩阵组成的。

初等矩阵的逆

  • 对角线上做倍乘操作:逆操作就是乘倒数。
  • 交换两行:逆矩阵还是它自己。
  • 把第 jj 行的 cc 倍加到第 ii 行:逆操作就是把第 jj 行的 c-c 倍加到第 ii 行。

具体来说:

PI1P_I^{-1}

对应“某一行乘以非零常数 cc”,其逆操作是乘以 c1c^{-1}

PII1=PIIP_{II}^{-1} = P_{II}

对应“交换两行”。

PIII1P_{III}^{-1}

对应“把第 jj 行的 cc 倍加到第 ii 行”,其逆操作只要把 cc 改成 c-c 即可。

如何求 Nullspace N(A)N(A)

求零空间的核心方法是高斯消元法,目标是找出所有满足 Ax=0Ax = 0 的向量。

基本步骤

  1. 把矩阵 AA 化为行阶梯形或简化行阶梯形。
  2. 区分主元变量(pivot variables)和自由变量(free variables)。
  3. 依次让一个自由变量取 11,其余自由变量取 00,求出对应的特殊解。
  4. 用这些特殊解的线性组合表示整个零空间。

例子

A=[241451233548151823]A = \begin{bmatrix} 2 & 4 & 1 & 4 & 5 \\ 1 & 2 & 3 & -3 & 5 \\ 4 & 8 & 15 & -18 & 23 \end{bmatrix}

先交换前两行:

[123352414548151823]\begin{bmatrix} 1 & 2 & 3 & -3 & 5 \\ 2 & 4 & 1 & 4 & 5 \\ 4 & 8 & 15 & -18 & 23 \end{bmatrix}

消去第一列下方的元素:

  • r22r1r2r_2 - 2r_1 \to r_2
  • r34r1r3r_3 - 4r_1 \to r_3

得到

[1233500510500363]\begin{bmatrix} 1 & 2 & 3 & -3 & 5 \\ 0 & 0 & -5 & 10 & -5 \\ 0 & 0 & 3 & -6 & 3 \end{bmatrix}

继续化简第二、三行:

  • r2÷(5)r2r_2 \div (-5) \to r_2
  • r3÷3r3r_3 \div 3 \to r_3
  • r3r2r3r_3 - r_2 \to r_3

得到行阶梯形矩阵:

[123350012100000]\begin{bmatrix} 1 & 2 & 3 & -3 & 5 \\ 0 & 0 & 1 & -2 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{bmatrix}

再做 r13r2r1r_1 - 3r_2 \to r_1,可得

[120320012100000]\begin{bmatrix} 1 & 2 & 0 & 3 & 2 \\ 0 & 0 & 1 & -2 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{bmatrix}

因此:

  • 主元变量是 x1,x3x_1, x_3
  • 自由变量是 x2,x4,x5x_2, x_4, x_5

对应方程为

x1+2x2+3x4+2x5=0x32x4+x5=0\begin{aligned} x_1 + 2x_2 + 3x_4 + 2x_5 &= 0 \\ x_3 - 2x_4 + x_5 &= 0 \end{aligned}

所以

x1=2x23x42x5,x3=2x4x5x_1 = -2x_2 - 3x_4 - 2x_5,\qquad x_3 = 2x_4 - x_5

依次令自由变量取值:

  • x2=1,x4=0,x5=0x_2 = 1, x_4 = 0, x_5 = 0 时,
s1=[21000]s_1 = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \\ 0 \end{bmatrix}
  • x2=0,x4=1,x5=0x_2 = 0, x_4 = 1, x_5 = 0 时,
s2=[30210]s_2 = \begin{bmatrix} -3 \\ 0 \\ 2 \\ 1 \\ 0 \end{bmatrix}
  • x2=0,x4=0,x5=1x_2 = 0, x_4 = 0, x_5 = 1 时,
s3=[20101]s_3 = \begin{bmatrix} -2 \\ 0 \\ -1 \\ 0 \\ 1 \end{bmatrix}

因此,

[x1x2x3x4x5]=c1[21000]+c2[30210]+c3[20101],c1,c2,c3R\begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \\ x_5 \end{bmatrix} = c_1 \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \\ 0 \end{bmatrix} + c_2 \begin{bmatrix} -3 \\ 0 \\ 2 \\ 1 \\ 0 \end{bmatrix} + c_3 \begin{bmatrix} -2 \\ 0 \\ -1 \\ 0 \\ 1 \end{bmatrix}, \qquad c_1, c_2, c_3 \in \mathbb{R}