矩阵的部分相关概念定义及其计算

本文为一些矩阵相关知识的自习笔记。

矩阵特征值

若存在标量 δ\delta 和非零向量 xx 使矩阵满足方程 Ax=δx(x0)Ax=\delta x(x\ne 0),则 δ\deltaxx 为矩阵的特征值和特征向量。

特征值 δ\delta 通过方程 det(AδI)=0\mathrm{det}(A-\delta I)=0 求解。

性质

  1. 行列式:矩阵的行列式等于所有特征值的乘积(det(A)=δi\mathrm{det}(A)=\prod \delta_i);
  2. 迹:矩阵的 迹(对角线元素之和) 等于所有特征值的和;
  3. 相似矩阵:若 A 和 B 为相似矩阵(即存在 P 使 P1AP=BP^{-1}AP=B),则 A 和 B 具有相同的特征值;
  4. 特殊矩阵:三角矩阵的特征值就是其主对角线元素。

共轭转置矩阵

记作 AHA^HAA^*。共轭转置即先将矩阵进行转置,再对每个元素取复共轭的操作。对于实数矩阵,共轭转置等同于普通转置。

矩阵的奇异值

A 的奇异值是 AAA^{*}A 的特征值 δi\delta_i 的非负平方根 σi=δi\sigma_i=\sqrt{\delta_i}

矩阵范数

矩阵范数用于度量矩阵的大小。常见有 1-范数,\infty-范数,Frobenius范数,2-范数。

MATLAB计算代码:norm(A, 1)norm(A, inf)norm(A, 'fro')norm(A, 2)

1-范数

A1||A||_{1}:矩阵列向量的绝对值之和的最大值(列和最大)。

\infty-范数

A||A||_{\infty}:矩阵行向量的绝对值之和的最大值(行和最大)。

Frobenius范数

AF||A||_{F}:矩阵元素绝对值平方和的平方根,即 i,jaij2\sqrt{\sum_{i,j}|a_{ij}|^{2}}

2-范数

A2||A||_{2}:矩阵的最大奇异值,即 AAA^{*}A 最大特征值的平方根。

舒尔补

舒尔补通常用于将大的复杂的矩阵分解成小的易于解决的矩阵,更具体地,通常用于把含有未知变量相乘(非线性)的复杂不等式,拉伸成一个维度更高、但完全线性的矩阵不等式,从而能够直接求解。

舒尔补的定义

假设一个 (p+q)×(p+q)(p+q)\times (p+q) 的矩阵 MM 被分为 A,B,C,DA, B, C, D 四个部分,分别是 p×pp\times pp×qp\times qq×pq\times p 以及 q×qq\times q 的矩阵,也就是说:

M=[AB CD]M=\begin{bmatrix} A & B \\\ C & D \end{bmatrix}

DD 可逆,则 DD 在矩阵内的舒尔补为 ABD1CA-BD^{-1}C;同理,若 AA 可逆,则 AA 在矩阵内的舒尔补为 DCA1BD-CA^{-1}B

舒尔补的性质

以下以 AA 可逆,S=DCA1BS=D-CA^{-1}BAA 的舒尔补为例。

行列式关系如下:

det(M)=det(A)×det(DCA1B)\mathrm{det}(M) = \mathrm{det}(A) \times \mathrm{det}(D-CA^{-1}B)

正定性关系如下:
矩阵 MM 正定,当且仅当 AA 和其舒尔补 S=DCA1BS=D-CA^{-1}B 正定。

舒尔补在解方程中的应用

考虑一个方程 Mx=bM\mathbf{x}=\mathbf{b},将 MM 进行划分:

M=[AB CD],x=[x1 x2],b=[b1 b2]M=\begin{bmatrix} A & B \\\ C & D\end{bmatrix}, \mathbf{x}=\begin{bmatrix} \mathbf{x_1} \\\ \mathbf{x_2}\end{bmatrix}, \mathbf{b}=\begin{bmatrix} \mathbf{b_1} \\\ \mathbf{b_2}\end{bmatrix}

通过第一行得到

x1=A1(b1Bx2)\mathbf{x}_{1}=A^{-1}\left(\mathbf{b}_{1}-B \mathbf{x}_{2}\right)

代入到第二行得到

(DCA1B)x2=b2CA1b1\left(D-C A^{-1} B\right) \mathbf{x}_{2}=\mathbf{b}_{2}-C A^{-1} \mathbf{b}_{1}

通过 AA 和它的舒尔补解出方程。

舒尔补在求矩阵的逆时的应用

如果 MM 可逆且 AA 可逆,则:

M1=[AB CD]1=[(ABD1C)1(ABD1C)1BD1 D1C(ABD1C)1D1+D1C(ABD1C)1BD1]\begin{array}{l}M^{-1} = \left[\begin{array}{ll}A & B \\\ C & D\end{array}\right]^{-1}=\left[\begin{array}{cc}\left(A-B D^{-1} C\right)^{-1} & -\left(A-B D^{-1} C\right)^{-1} B D^{-1} \\\ -D^{-1} C\left(A-B D^{-1} C\right)^{-1} & D^{-1}+D^{-1} C\left(A-B D^{-1} C\right)^{-1} B D^{-1}\end{array}\right]\end{array}

如果 MM 可逆且 A,DA,D 可逆,则:

M1=[AB CD]1=[(ABD1C)1A1B(DCA1B)1 D1C(ABD1C)1(DCA1B)1]\begin{array}{l}M^{-1} = \left[\begin{array}{ll}A & B \\\ C & D\end{array}\right]^{-1}=\left[\begin{array}{cc}\left(A-B D^{-1} C\right)^{-1} & -A^{-1} B\left(D-C A^{-1} B\right)^{-1} \\\ -D^{-1} C\left(A-B D^{-1} C\right)^{-1} & \left(D-C A^{-1} B\right)^{-1}\end{array}\right]\end{array}

更特殊的,如果 A,B,C,DA,B,C,D 都是系数(数字)时,有:

M1=1ADBC[DB CA]M^{-1}=\frac{1}{A D-B C}\left[\begin{array}{cc}D & -B \\\ -C & A\end{array}\right]