Article

矩阵的对角化与金字塔阶级

梳理矩阵对角化、特征值与特征向量之间的关系,并用层级视角理解不同矩阵的可处理性。

April 15, 2026 修考 8 min read

特征值与特征向量的核心动机

在线性代数中,我们经常需要处理输入向量 xx 经过矩阵 AA 的线性转换,得到输出向量 AxAx。当矩阵 AA 非常庞大(例如 1000×10001000 \times 1000)且需要进行多次转换(例如 AkxA^k x)时,直接相乘的计算量会非常惊人。

特征值与特征向量的发明正是为了解决这个问题。对于一个矩阵 AA,如果我们能找到特定的向量 xx(即特征向量),使得 AA 作用在 xx 上时,其效果等同于纯量 λ\lambda(即特征值)乘上 xxAx=λxAx = \lambda x 那么,高维度的矩阵乘法就被简化成了简单的纯量倍数放大或缩小

矩阵的金字塔阶级

基于特征向量的表现,矩阵被划分为一个严阶级的“金字塔”:

image-20260415090930521

  • L4金字塔底层:瑕疵矩阵 (Defective Matrix)

    • 定义: 虽然能算出特征值(通常伴随重复的特征值),但在求零空间时,找不到 nn 条线性独立的特征向量的矩阵。
    • 后果: 这种矩阵“残缺不全”,无法凑齐构成 nn 维空间的基底 (Basis)。因此,它无法被对角化,在应用上最难处理。
  • L3金字塔中层:可对角化矩阵 (Diagonalizable Matrix)

    • 定义: 如果一个 n×nn \times n 矩阵能够提供 nn 条线性独立的特征向量
    • 优势:nn 条特征向量可以组成 nn 维空间的基底。我们可以将这些特征向量排成一个矩阵 XX(特征向量矩阵),从而将原矩阵 AA 分解为: A=XΛX1A = X \Lambda X^{-1} (其中 Λ\Lambda 是由特征值组成的对角矩阵)。所有复杂的 AA 的运算,都可以转化为极简的 Λ\Lambda 对角矩阵的运算。
  • L2金字塔顶层:完美矩阵 (具有谱定理 Spectral Theorem 的矩阵)

    • 定义: 例如对称矩阵 (Symmetric Matrix)。
    • 优势: 这种矩阵不仅能找到 nn 条独立的特征向量,而且这 nn 条特征向量天然互相垂直 (Orthogonal)
    • 此时对角化公式会进化为 A=QΛQTA = Q \Lambda Q^T(其中 QQ 是正交矩阵,反矩阵 Q1Q^{-1} 直接等同于转置矩阵 QTQ^T),这在工程和纯数学中都是最优美、最好算的形态。
  • L1最上层
    • PD matrix: 天龙人
      • 同时满足矩阵对角化这个空间中最为完美的要求,同时也满足逆矩阵世界中最完美的要求(可逆)

什么是对角化

对角化的推导公式

Normal matrix

这也就是第二层的矩阵

满足AHA=AAHA^H A = A A^H

**正规矩阵(Normal Matrix)在线性代数和数值计算中非常重要,主要因为它是谱定理(Spectral Theorem)**成立的最广泛类矩阵。

简单来说,正规矩阵的核心用处在于:它可以被“完美地”对角化(或块对角化),且变换过程保持几何结构不变(正交/酉变换)。

对角化例题

对于矩阵 A=[12121212]A = \begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix},其对角化公式为:

A=PDP1A = P D P^{-1}

其中:

  1. 对角矩阵 DD(由特征值组成): D=[1000]D = \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix}

  2. 可逆矩阵 PP(由对应的线性无关特征向量组成): P=[1111]P = \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix}

  3. 逆矩阵 P1P^{-1}P1=12[1111]=[12121212]P^{-1} = \frac{1}{2} \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix} = \begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{bmatrix}


推导简述:

  1. 求特征值: 由于 AA 的每一行和为 1,且秩为 1(两行相同),故特征值为 λ1=1,λ2=0\lambda_1 = 1, \lambda_2 = 0。 (或者通过特征方程 λIA=λ(λ1)=0|\lambda I - A| = \lambda(\lambda - 1) = 0 求得)。

  2. 求特征向量

    • 对于 λ1=1\lambda_1 = 1:解 (IA)x=0[1/21/21/21/2][x1x2]=0(I - A)x = 0 \Rightarrow \begin{bmatrix} 1/2 & -1/2 \\ -1/2 & 1/2 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = 0,得 x1=x2x_1 = x_2。取特征向量 v1=[11]v_1 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}
    • 对于 λ2=0\lambda_2 = 0:解 Ax=0[1/21/21/21/2][x1x2]=0Ax = 0 \Rightarrow \begin{bmatrix} 1/2 & 1/2 \\ 1/2 & 1/2 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = 0,得 x1=x2x_1 = -x_2。取特征向量 v2=[11]v_2 = \begin{bmatrix} 1 \\ -1 \end{bmatrix}
  3. 构造 PPDDP=[v1,v2]=[1111],D=diag(1,0)P = [v_1, v_2] = \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix}, \quad D = \text{diag}(1, 0)

  4. 验证PDP1=[1111][1000][12121212]=[1010][12121212]=[12121212]=AP D P^{-1} = \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{bmatrix} = \begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix} = A

注意:由于 AA 是实对称矩阵,它也是正规矩阵,因此可以进行正交对角化。若选取单位正交特征向量,则 PP 为正交矩阵,满足 P1=PTP^{-1} = P^T。 此时 Q=[12121212]Q = \begin{bmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \end{bmatrix},公式为 A=QDQTA = Q D Q^T

使用对角化求解幂次问题

A=[0110]A = \begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} Calculate A4A^4

首先求 AA 的特征值 λ\lambdadet(AλI)=det[λ11λ]=λ2+1=0    λ=i,i\det(A - \lambda I) = \det\begin{bmatrix} -\lambda & -1 \\ 1 & -\lambda \end{bmatrix} = \lambda^2 + 1 = 0 \implies \lambda = i, -i 根据矩阵次方的性质,AkA^k 的特征值是原特征值的 kk 次方

  • λ14=i4=1\lambda_1^4 = i^4 = 1
  • λ24=(i)4=1\lambda_2^4 = (-i)^4 = 1 由于 A4A^4 的特征值全是 1,且 AA 是可对角化的,这意味着 A4A^4 的对角化形式 Λ4\Lambda^4 就是单位矩阵 IIA4=XΛ4X1=X[1001]X1=XIX1=IA^4 = X \Lambda^4 X^{-1} = X \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} X^{-1} = X I X^{-1} = I 最终答案: A4=[1001]A^4 = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}

什么是谱定理 Spectral theorem

矩阵可以进行对角化,也就是有充足的特征向量能够覆盖整个空间。

在这个基础上,这些basis之间还是互相垂直的。

这是集合了两种最好的basis

  1. Orthogonal basis
  2. Engenvector basis