矩阵与线性变换
本章涵盖矩阵的基本运算、特殊矩阵、矩阵的逆与秩,以及线性变换等核心知识点。
矩阵加法与标量乘法
两个相同大小的矩阵 $A$ 和 $B$ 的和定义为对应元素的和:
矩阵 $A$ 与标量 $c$ 的乘积定义为 $A$ 的每个元素都乘以 $c$:
① 交换律:$A + B = B + A$
② 结合律:$(A + B) + C = A + (B + C)$
③ 分配律:$c(A + B) = cA + cB$,$(c + d)A = cA + dA$
计算 $\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} + 2\begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}$
解:$= \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} + \begin{bmatrix} 4 & 2 \\ 2 & 4 \end{bmatrix} = \begin{bmatrix} 5 & 4 \\ 5 & 8 \end{bmatrix}$
矩阵乘法
若 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times p$ 矩阵,则它们的乘积 $AB$ 是 $m \times p$ 矩阵,其中第 $(i,j)$ 个元素为:
① 结合律:$(AB)C = A(BC)$
② 分配律:$A(B + C) = AB + AC$,$(B + C)A = BA + CA$
③ 不满足交换律:一般 $AB \neq BA$
计算 $\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}\begin{bmatrix} 2 & 0 \\ 1 & 3 \end{bmatrix}$
解:$(1)(2)+(2)(1) = 4$,$(1)(0)+(2)(3) = 6$,$(3)(2)+(4)(1) = 10$,$(3)(0)+(4)(3) = 12$
结果为 $\begin{bmatrix} 4 & 6 \\ 10 & 12 \end{bmatrix}$
矩阵转置
矩阵 $A$ 的转置 $A^T$ 是将 $A$ 的行变为列(或列变为行)得到的矩阵。若 $A$ 是 $m \times n$ 矩阵,则 $A^T$ 是 $n \times m$ 矩阵。
① $(A^T)^T = A$
② $(A + B)^T = A^T + B^T$
③ $(cA)^T = cA^T$
④ $(AB)^T = B^T A^T$
$A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{bmatrix}$,求 $A^T$。
解:$A^T = \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{bmatrix}$
单位矩阵
单位矩阵 $I$ 或 $I_n$ 是对角线上全为 1,其余位置全为 0 的 $n \times n$ 矩阵:
对任何 $m \times n$ 矩阵 $A$,有 $I_m A = A$ 且 $A I_n = A$。
单位矩阵是矩阵乘法的单位元。
零矩阵
零矩阵 $O$ 或 $0$ 是所有元素都为 0 的矩阵。
对任何矩阵 $A$,有 $A + O = A$,$AO = O$(大小适配时)。
零矩阵是矩阵加法的单位元。
对角矩阵
对角矩阵是非对角线上的元素都为 0 的矩阵:
对角矩阵的乘法计算简单。若 $D$ 和 $E$ 都是对角矩阵,则 $DE$ 也是对角矩阵,其对角元素为两矩阵对应对角元素的乘积。
$D = \begin{bmatrix} 2 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 4 \end{bmatrix}$,$E = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{bmatrix}$,求 $DE$。
解:$DE = \begin{bmatrix} 2 & 0 & 0 \\ 0 & 6 & 0 \\ 0 & 0 & 12 \end{bmatrix}$
三角矩阵
上三角矩阵是下三角部分都为 0 的矩阵;下三角矩阵是上三角部分都为 0 的矩阵。
两个上(下)三角矩阵的乘积仍是上(下)三角矩阵。
三角矩阵的行列式等于对角线元素的乘积。
对称矩阵
若矩阵 $A$ 满足 $A^T = A$,则称 $A$ 为对称矩阵。
若矩阵 $A$ 满足 $A^T = -A$,则称 $A$ 为反对称矩阵。
$A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{bmatrix}$ 是对称矩阵,因为 $A^T = A$。
矩阵的逆
对于 $n \times n$ 矩阵 $A$,如果存在矩阵 $B$ 使得 $AB = BA = I$,则称 $B$ 为 $A$ 的逆矩阵,记作 $A^{-1}$。
矩阵 $A$ 可逆当且仅当 $\det(A) \neq 0$(即 $A$ 是满秩矩阵)。
验证 $B = -\frac{1}{2}\begin{bmatrix} 4 & -2 \\ -3 & 1 \end{bmatrix}$ 是 $A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 的逆矩阵。
解:计算 $AB = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} \cdot (-\frac{1}{2})\begin{bmatrix} 4 & -2 \\ -3 & 1 \end{bmatrix} = -\frac{1}{2}\begin{bmatrix} -2 & 0 \\ 0 & -2 \end{bmatrix} = I$
矩阵的秩
矩阵 $A$ 的秩(rank)定义为其行简化阶梯形中非零行的个数,记作 $\text{rank}(A)$ 或 $r(A)$。
① 对 $m \times n$ 矩阵 $A$,$0 \leq \text{rank}(A) \leq \min(m,n)$
② $\text{rank}(A) = \text{rank}(A^T)$
③ $\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))$
④ 矩阵 $A$ 满秩当且仅当 $\text{rank}(A) = \min(m,n)$
求矩阵 $A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 1 & 1 & 1 \end{bmatrix}$ 的秩。
解:化为行简化阶梯形,得到 2 个非零行,故 $\text{rank}(A) = 2$。
初等矩阵
初等矩阵是由单位矩阵通过一次初等行变换得到的矩阵。有三种类型:
① 行交换:交换 $I$ 的两行
② 行数乘:将 $I$ 的某一行乘以非零常数 $k$
③ 行倍加:将 $I$ 的某一行加上另一行的 $k$ 倍
用初等矩阵左乘矩阵 $A$,相当于对 $A$ 进行相应的初等行变换。
逆矩阵的求法
当 $\det(A) \neq 0$ 时:
其中 $A^*$ 是 $A$ 的伴随矩阵。
对增广矩阵 $[A|I]$ 进行初等行变换,化为 $[I|A^{-1}]$。
用初等行变换求 $A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 的逆矩阵。
解:$\left[ \begin{array}{cc|cc} 1 & 2 & 1 & 0 \\ 3 & 4 & 0 & 1 \end{array}\right] \to \left[ \begin{array}{cc|cc} 1 & 0 & -2 & 1 \\ 0 & 1 & 3/2 & -1/2 \end{array} \right]$
因此 $A^{-1} = \begin{bmatrix} -2 & 1 \\ 3/2 & -1/2 \end{bmatrix}$
分块矩阵
分块矩阵是将矩阵按行或列分成若干个子矩阵(块),然后将这些块看作矩阵的元素进行运算。
分块矩阵的加法、数乘、乘法等运算与普通矩阵运算规则相同,只需满足块的大小相容即可。
LU分解
对于 $n \times n$ 矩阵 $A$,LU分解是将 $A$ 分解为一个下三角矩阵 $L$ 和一个上三角矩阵 $U$ 的乘积:
其中 $L$ 是下三角矩阵(通常要求对角线元素为 1),$U$ 是上三角矩阵。
LU分解可用于求解线性方程组 $A\mathbf{x} = \mathbf{b}$:
① 求 $L\mathbf{y} = \mathbf{b}$(前向替代)
② 求 $U\mathbf{x} = \mathbf{y}$(回向替代)
线性变换
从向量空间 $V$ 到 $W$ 的函数 $T: V \to W$ 是线性变换,如果对所有 $\mathbf{u}, \mathbf{v} \in V$ 和标量 $c$,有:
从 $\mathbb{R}^n$ 到 $\mathbb{R}^m$ 的任何线性变换都可以用 $m \times n$ 矩阵表示:$T(\mathbf{x}) = A\mathbf{x}$。
验证 $T(\mathbf{x}) = A\mathbf{x}$,其中 $A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 是线性变换。
解:对任意 $\mathbf{u}, \mathbf{v}$ 和标量 $c$:
$T(\mathbf{u} + \mathbf{v}) = A(\mathbf{u} + \mathbf{v}) = A\mathbf{u} + A\mathbf{v} = T(\mathbf{u}) + T(\mathbf{v})$ ✓
$T(c\mathbf{v}) = A(c\mathbf{v}) = c(A\mathbf{v}) = cT(\mathbf{v})$ ✓
投影变换
将向量投影到某个方向或平面的变换称为投影变换。
向量 $\mathbf{v}$ 在向量 $\mathbf{u}$ 方向上的标量投影为 $\text{proj}_{\mathbf{u}} \mathbf{v} = \frac{\mathbf{u} \cdot \mathbf{v}}{\left \| \mathbf{u} \right \|^2}$
向量 $\mathbf{v}$ 在向量 $\mathbf{u}$ 方向上的向量投影为 $\text{proj}_{\mathbf{u}} \mathbf{v} = \frac{\mathbf{u} \cdot \mathbf{v}}{\left \| \mathbf{u} \right \|^2}\mathbf{u}$
剪切变换
剪切变换是使平面图形沿某一方向平移,但不改变方向上的距离的变换。
$x$ 方向的剪切变换矩阵:$S_x = \begin{bmatrix} 1 & k \\ 0 & 1 \end{bmatrix}$,将点 $(x, y)$ 变换为 $(x+ky, y)$。
旋转变换
旋转变换是绕原点旋转平面上的点或向量。
逆时针旋转角度 $\theta$ 的旋转矩阵为:
旋转矩阵是正交矩阵,满足 $R^T R = I$,且 $\det(R) = 1$。
将点 $(1, 0)$ 绕原点逆时针旋转 $90°$。
解:$\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$
伸缩变换
伸缩变换(缩放变换)是沿某些方向放大或缩小距离的变换。
均匀伸缩(缩放因子为 $k$)的矩阵为 $S = \begin{bmatrix} k & 0 \\ 0 & k \end{bmatrix}$。
$x$ 方向缩放因子为 $a$,$y$ 方向缩放因子为 $b$ 的矩阵为 $S = \begin{bmatrix} a & 0 \\ 0 & b \end{bmatrix}$。
线性映射
线性映射是向量空间之间的函数,保持向量加法和标量乘法。这与线性变换的定义相同。
• 像(值域):$\text{Im}(T) = \{T(\mathbf{v}) : \mathbf{v} \in V\}$
• 核(零空间):$\ker(T) = \{\mathbf{v} : T(\mathbf{v}) = \mathbf{0}\}$
• 秩:$\text{rank}(T) = \dim(\text{Im}(T))$
• 零化度:$\text{nullity}(T) = \dim(\ker(T))$
$$\text{rank}(T) + \text{nullity}(T) = \dim(V)$$
单射与满射
线性映射 $T: V \to W$ 是单射,如果不同的向量映射到不同的像。等价地,$\ker(T) = \{\mathbf{0}\}$。
线性映射 $T: V \to W$ 是满射,如果 $\text{Im}(T) = W$。
既是单射又是满射的映射称为双射(一一对应)。
对 $m \times n$ 矩阵 $A$:
• $\text{rank}(A) = n$ ⟺ $T_A$ 是单射
• $\text{rank}(A) = m$ ⟺ $T_A$ 是满射
• $\text{rank}(A) = m = n$ ⟺ $T_A$ 是双射