一、矩阵对角化及其条件
1.2 矩阵对角化
对角化是对方阵的一种运算,使得其运算结果为一个对角方阵。下面会讲具体的例子:
什么是对角矩阵:从左上角到右下角的直线(叫做对角线)以外的元素都是零。这种方阵称为对角矩阵,简称对角阵,记作: Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) \Lambda=diag(\lambda_1,\lambda_2,\cdots,\lambda_n) Λ=diag(λ1,λ2,⋯,λn)
将方阵
A
A
A的特征向量放入一个新的矩阵
S
S
S,那么有:
A
S
=
A
[
c
1
c
2
⋯
c
n
]
=
[
λ
1
c
1
⋯
λ
n
c
n
]
=
[
c
1
c
2
⋯
c
n
]
[
λ
1
0
⋯
0
0
λ
2
⋯
0
⋯
⋯
⋯
⋯
⋯
⋯
⋯
λ
n
]
=
S
Λ
(1)
\begin{aligned} AS&=A\begin{bmatrix}c_1&c_2&\cdots&c_n\end{bmatrix}\\&=\begin{bmatrix}\lambda_1c_1&\cdots&\lambda_nc_n\end{bmatrix}\\ &=\begin{bmatrix}c_1&c_2&\cdots& c_n\end{bmatrix}\begin{bmatrix}\lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\ \cdots&\cdots&\cdots&\cdots\\ \cdots&\cdots&\cdots&\lambda_n\end{bmatrix}=S\Lambda \end{aligned}\tag{1}
AS=A[c1c2⋯cn]=[λ1c1⋯λncn]=[c1c2⋯cn]
λ10⋯⋯0λ2⋯⋯⋯⋯⋯⋯00⋯λn
=SΛ(1)
也就是有:
A
S
=
S
Λ
(2)
AS=S\Lambda\tag{2}
AS=SΛ(2)
假设特征向量是线性无关的有:
S
−
1
A
S
=
Λ
(3)
S^{-1}AS=\Lambda\tag{3}
S−1AS=Λ(3)
下面是等价表达,也就是我们这节课矩阵对角化的重要公式:
A
=
S
Λ
S
−
1
(4)
A=S\Lambda S^{-1}\tag{4}
A=SΛS−1(4)
这样的对角化为什么是重要的?答:可以化简矩阵的幕,减少运算量。考虑两个相同矩阵
A
A
A相乘的结果:
由(4)可得:
A
2
=
S
Λ
S
−
1
S
Λ
S
−
1
=
S
Λ
(
S
S
−
1
)
Λ
S
−
1
=
S
Λ
2
S
−
1
(5)
A^2=S\Lambda S^{-1}S\Lambda S^{-1}=S\Lambda(SS^{-1})\Lambda S^{-1}=S\Lambda^2S^{-1}\tag{5}
A2=SΛS−1SΛS−1=SΛ(SS−1)ΛS−1=SΛ2S−1(5)
上面的式子告诉我们我们可以将矩阵的幂转化到特征矩阵与特征向量构成的矩阵。更一般的,
A
k
=
S
Λ
k
S
−
1
(6)
A^k=S\Lambda^kS^{-1}\tag{6}
Ak=SΛkS−1(6)
请不要忘记方阵进行对角化的条件,存在矩阵维度大小的独立的特征向量。如果你不想判断特征向量是否独立,可以考虑直接利用特征值是否相同进行判断,有以下结论:所有特征值都不同。
OK,在最后对比一下中学时期学的指数函数与本节学的矩阵作为幂的指数函数:
| 对比项 | 指数无穷大时归零条件 |
|---|---|
| A k A^k Ak |
∀
∣
λ
i
∣
<
1
\forall \quad \vert\lambda_i\vert
关注
打赏
立即登录/注册
微信扫码登录 |
