矩阵加法与标量乘法

定义

两个相同大小的矩阵 $A$ 和 $B$ 的定义为对应元素的和:

$$A + B = \begin{bmatrix} a_{11}+b_{11} & a_{12}+b_{12} & \cdots \\ a_{21}+b_{21} & a_{22}+b_{22} & \cdots \\ \vdots & \vdots & \ddots \end{bmatrix}$$

矩阵 $A$ 与标量 $c$ 的乘积定义为 $A$ 的每个元素都乘以 $c$:

$$cA = \begin{bmatrix} ca_{11} & ca_{12} & \cdots \\ ca_{21} & ca_{22} & \cdots \\ \vdots & \vdots & \ddots \end{bmatrix}$$
性质

① 交换律:$A + B = B + A$
② 结合律:$(A + B) + C = A + (B + C)$
③ 分配律:$c(A + B) = cA + cB$,$(c + d)A = cA + dA$

例题

计算 $\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} + 2\begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}$

解:$= \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} + \begin{bmatrix} 4 & 2 \\ 2 & 4 \end{bmatrix} = \begin{bmatrix} 5 & 4 \\ 5 & 8 \end{bmatrix}$

矩阵乘法

定义

若 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times p$ 矩阵,则它们的乘积 $AB$ 是 $m \times p$ 矩阵,其中第 $(i,j)$ 个元素为:

$$(AB)_{ij} = \sum_{k=1}^{n} a_{ik}b_{kj}$$
性质

① 结合律:$(AB)C = A(BC)$
② 分配律:$A(B + C) = AB + AC$,$(B + C)A = BA + CA$
不满足交换律:一般 $AB \neq BA$

例题

计算 $\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}\begin{bmatrix} 2 & 0 \\ 1 & 3 \end{bmatrix}$

解:$(1)(2)+(2)(1) = 4$,$(1)(0)+(2)(3) = 6$,$(3)(2)+(4)(1) = 10$,$(3)(0)+(4)(3) = 12$
结果为 $\begin{bmatrix} 4 & 6 \\ 10 & 12 \end{bmatrix}$

矩阵转置

定义

矩阵 $A$ 的转置 $A^T$ 是将 $A$ 的行变为列(或列变为行)得到的矩阵。若 $A$ 是 $m \times n$ 矩阵,则 $A^T$ 是 $n \times m$ 矩阵。

$$(A^T)_{ij} = A_{ji}$$
性质

① $(A^T)^T = A$
② $(A + B)^T = A^T + B^T$
③ $(cA)^T = cA^T$
④ $(AB)^T = B^T A^T$

例题

$A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{bmatrix}$,求 $A^T$。

解:$A^T = \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{bmatrix}$

单位矩阵

定义

单位矩阵 $I$ 或 $I_n$ 是对角线上全为 1,其余位置全为 0 的 $n \times n$ 矩阵:

$$I_n = \begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{bmatrix}$$
性质

对任何 $m \times n$ 矩阵 $A$,有 $I_m A = A$ 且 $A I_n = A$。
单位矩阵是矩阵乘法的单位元。

零矩阵

定义

零矩阵 $O$ 或 $0$ 是所有元素都为 0 的矩阵。

$$O = \begin{bmatrix} 0 & 0 & \cdots \\ 0 & 0 & \cdots \\ \vdots & \vdots & \ddots \end{bmatrix}$$
性质

对任何矩阵 $A$,有 $A + O = A$,$AO = O$(大小适配时)。
零矩阵是矩阵加法的单位元。

对角矩阵

定义

对角矩阵是非对角线上的元素都为 0 的矩阵:

$$D = \begin{bmatrix} d_1 & 0 & \cdots & 0 \\ 0 & d_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & d_n \end{bmatrix}$$
性质

对角矩阵的乘法计算简单。若 $D$ 和 $E$ 都是对角矩阵,则 $DE$ 也是对角矩阵,其对角元素为两矩阵对应对角元素的乘积。

例题

$D = \begin{bmatrix} 2 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 4 \end{bmatrix}$,$E = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{bmatrix}$,求 $DE$。

解:$DE = \begin{bmatrix} 2 & 0 & 0 \\ 0 & 6 & 0 \\ 0 & 0 & 12 \end{bmatrix}$

三角矩阵

定义

上三角矩阵是下三角部分都为 0 的矩阵;下三角矩阵是上三角部分都为 0 的矩阵。

$$\text{上三角:} \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ 0 & a_{22} & a_{23} \\ 0 & 0 & a_{33} \end{bmatrix} \quad \text{下三角:} \begin{bmatrix} a_{11} & 0 & 0 \\ a_{21} & a_{22} & 0 \\ a_{31} & a_{32} & a_{33} \end{bmatrix}$$
性质

两个上(下)三角矩阵的乘积仍是上(下)三角矩阵。
三角矩阵的行列式等于对角线元素的乘积。

对称矩阵

定义

若矩阵 $A$ 满足 $A^T = A$,则称 $A$ 为对称矩阵
若矩阵 $A$ 满足 $A^T = -A$,则称 $A$ 为反对称矩阵

$$A = A^T \Rightarrow a_{ij} = a_{ji} \text{ 对所有 } i,j$$
例题

$A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \\ 3 & 5 & 6 \end{bmatrix}$ 是对称矩阵,因为 $A^T = A$。

矩阵的逆

定义

对于 $n \times n$ 矩阵 $A$,如果存在矩阵 $B$ 使得 $AB = BA = I$,则称 $B$ 为 $A$ 的逆矩阵,记作 $A^{-1}$。

可逆条件

矩阵 $A$ 可逆当且仅当 $\det(A) \neq 0$(即 $A$ 是满秩矩阵)。

$$AA^{-1} = A^{-1}A = I$$
例题

验证 $B = -\frac{1}{2}\begin{bmatrix} 4 & -2 \\ -3 & 1 \end{bmatrix}$ 是 $A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 的逆矩阵。

解:计算 $AB = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} \cdot (-\frac{1}{2})\begin{bmatrix} 4 & -2 \\ -3 & 1 \end{bmatrix} = -\frac{1}{2}\begin{bmatrix} -2 & 0 \\ 0 & -2 \end{bmatrix} = I$

矩阵的秩

定义

矩阵 $A$ 的(rank)定义为其行简化阶梯形中非零行的个数,记作 $\text{rank}(A)$ 或 $r(A)$。

性质

① 对 $m \times n$ 矩阵 $A$,$0 \leq \text{rank}(A) \leq \min(m,n)$
② $\text{rank}(A) = \text{rank}(A^T)$
③ $\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))$
④ 矩阵 $A$ 满秩当且仅当 $\text{rank}(A) = \min(m,n)$

例题

求矩阵 $A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 1 & 1 & 1 \end{bmatrix}$ 的秩。

解:化为行简化阶梯形,得到 2 个非零行,故 $\text{rank}(A) = 2$。

初等矩阵

定义

初等矩阵是由单位矩阵通过一次初等行变换得到的矩阵。有三种类型:

三种初等矩阵

行交换:交换 $I$ 的两行
行数乘:将 $I$ 的某一行乘以非零常数 $k$
行倍加:将 $I$ 的某一行加上另一行的 $k$ 倍

性质

用初等矩阵左乘矩阵 $A$,相当于对 $A$ 进行相应的初等行变换。

逆矩阵的求法

方法一:伴随矩阵法

当 $\det(A) \neq 0$ 时:

$$A^{-1} = \frac{1}{\det(A)} A^*$$

其中 $A^*$ 是 $A$ 的伴随矩阵。

方法二:初等行变换法

对增广矩阵 $[A|I]$ 进行初等行变换,化为 $[I|A^{-1}]$。

例题

用初等行变换求 $A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 的逆矩阵。

解:$\left[ \begin{array}{cc|cc} 1 & 2 & 1 & 0 \\ 3 & 4 & 0 & 1 \end{array}\right] \to \left[ \begin{array}{cc|cc} 1 & 0 & -2 & 1 \\ 0 & 1 & 3/2 & -1/2 \end{array} \right]$
因此 $A^{-1} = \begin{bmatrix} -2 & 1 \\ 3/2 & -1/2 \end{bmatrix}$

分块矩阵

定义

分块矩阵是将矩阵按行或列分成若干个子矩阵(块),然后将这些块看作矩阵的元素进行运算。

$$A = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix}, \quad B = \begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{bmatrix}$$
运算规则

分块矩阵的加法、数乘、乘法等运算与普通矩阵运算规则相同,只需满足块的大小相容即可。

LU分解

定义

对于 $n \times n$ 矩阵 $A$,LU分解是将 $A$ 分解为一个下三角矩阵 $L$ 和一个上三角矩阵 $U$ 的乘积:

$$A = LU$$

其中 $L$ 是下三角矩阵(通常要求对角线元素为 1),$U$ 是上三角矩阵。

应用

LU分解可用于求解线性方程组 $A\mathbf{x} = \mathbf{b}$:
① 求 $L\mathbf{y} = \mathbf{b}$(前向替代)
② 求 $U\mathbf{x} = \mathbf{y}$(回向替代)

线性变换

定义

从向量空间 $V$ 到 $W$ 的函数 $T: V \to W$ 是线性变换,如果对所有 $\mathbf{u}, \mathbf{v} \in V$ 和标量 $c$,有:

$$T(\mathbf{u} + \mathbf{v}) = T(\mathbf{u}) + T(\mathbf{v})$$ $$T(c\mathbf{v}) = cT(\mathbf{v})$$
矩阵表示

从 $\mathbb{R}^n$ 到 $\mathbb{R}^m$ 的任何线性变换都可以用 $m \times n$ 矩阵表示:$T(\mathbf{x}) = A\mathbf{x}$。

例题

验证 $T(\mathbf{x}) = A\mathbf{x}$,其中 $A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$ 是线性变换。

解:对任意 $\mathbf{u}, \mathbf{v}$ 和标量 $c$:
$T(\mathbf{u} + \mathbf{v}) = A(\mathbf{u} + \mathbf{v}) = A\mathbf{u} + A\mathbf{v} = T(\mathbf{u}) + T(\mathbf{v})$ ✓
$T(c\mathbf{v}) = A(c\mathbf{v}) = c(A\mathbf{v}) = cT(\mathbf{v})$ ✓

投影变换

定义

将向量投影到某个方向或平面的变换称为投影变换

标量投影

向量 $\mathbf{v}$ 在向量 $\mathbf{u}$ 方向上的标量投影为 $\text{proj}_{\mathbf{u}} \mathbf{v} = \frac{\mathbf{u} \cdot \mathbf{v}}{\left \| \mathbf{u} \right \|^2}$

向量投影

向量 $\mathbf{v}$ 在向量 $\mathbf{u}$ 方向上的向量投影为 $\text{proj}_{\mathbf{u}} \mathbf{v} = \frac{\mathbf{u} \cdot \mathbf{v}}{\left \| \mathbf{u} \right \|^2}\mathbf{u}$

剪切变换

定义

剪切变换是使平面图形沿某一方向平移,但不改变方向上的距离的变换。

例子

$x$ 方向的剪切变换矩阵:$S_x = \begin{bmatrix} 1 & k \\ 0 & 1 \end{bmatrix}$,将点 $(x, y)$ 变换为 $(x+ky, y)$。

旋转变换

定义

旋转变换是绕原点旋转平面上的点或向量。

旋转矩阵

逆时针旋转角度 $\theta$ 的旋转矩阵为:

$$R_\theta = \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}$$
性质

旋转矩阵是正交矩阵,满足 $R^T R = I$,且 $\det(R) = 1$。

例题

将点 $(1, 0)$ 绕原点逆时针旋转 $90°$。

解:$\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}\begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}$

伸缩变换

定义

伸缩变换(缩放变换)是沿某些方向放大或缩小距离的变换。

伸缩矩阵

均匀伸缩(缩放因子为 $k$)的矩阵为 $S = \begin{bmatrix} k & 0 \\ 0 & k \end{bmatrix}$。

非均匀伸缩

$x$ 方向缩放因子为 $a$,$y$ 方向缩放因子为 $b$ 的矩阵为 $S = \begin{bmatrix} a & 0 \\ 0 & b \end{bmatrix}$。

线性映射

定义

线性映射是向量空间之间的函数,保持向量加法和标量乘法。这与线性变换的定义相同。

相关概念

(值域):$\text{Im}(T) = \{T(\mathbf{v}) : \mathbf{v} \in V\}$
(零空间):$\ker(T) = \{\mathbf{v} : T(\mathbf{v}) = \mathbf{0}\}$
:$\text{rank}(T) = \dim(\text{Im}(T))$
零化度:$\text{nullity}(T) = \dim(\ker(T))$

秩-零化度定理

$$\text{rank}(T) + \text{nullity}(T) = \dim(V)$$

单射与满射

单射

线性映射 $T: V \to W$ 是单射,如果不同的向量映射到不同的像。等价地,$\ker(T) = \{\mathbf{0}\}$。

满射

线性映射 $T: V \to W$ 是满射,如果 $\text{Im}(T) = W$。

双射

既是单射又是满射的映射称为双射(一一对应)。

判断准则

对 $m \times n$ 矩阵 $A$:
• $\text{rank}(A) = n$ ⟺ $T_A$ 是单射
• $\text{rank}(A) = m$ ⟺ $T_A$ 是满射
• $\text{rank}(A) = m = n$ ⟺ $T_A$ 是双射