线性代数之 矩阵乘法的本质
- 前言
- 教材里的矩阵乘法
- 矩阵与向量的乘法
- 矩阵之间的乘法
- 扩展1:方阵与向量的乘法与线性相关性
- 扩展2:方阵间的乘法与秩
- 后记
前言
本文将介绍矩阵乘法及其本质。
教材里的矩阵乘法
矩阵 A ∈ R m × n , B ∈ R n × l A\in R^{m\times n}, B \in R^{n\times l} A∈Rm×n,B∈Rn×l,则定义矩阵乘法 A B AB AB为:
A
B
=
C
∈
R
m
×
l
C
i
j
=
∑
k
=
1
n
a
i
k
b
k
j
AB=C\in R^{m\times l} \\ C_{ij}=\sum_{k=1}^{n} a_{ik}b_{kj}
AB=C∈Rm×lCij=k=1∑naikbkj
以上定义看着就很复杂,理解起来就是左边矩阵的第 i 行的元素乘以右边矩阵第 j 列的对应元素,也就是所谓的“十字”乘法。
这样的定义,满足做题的需求,但对于理解矩阵乘法的本质,没有任何作用。
矩阵与向量的乘法
考虑矩阵与列向量的乘法:
A
x
=
b
将
A
看
作
列
向
量
的
横
向
排
列
:
A
=
(
a
⃗
1
,
a
⃗
2
,
…
,
a
⃗
n
)
(
a
⃗
1
,
a
⃗
2
,
…
,
a
⃗
n
)
x
=
x
1
a
⃗
1
+
x
2
a
⃗
2
+
⋯
+
x
n
a
⃗
n
实
际
上
,
x
1
a
⃗
1
+
x
2
a
⃗
2
+
⋯
+
x
n
a
⃗
n
就
是
矩
阵
A
的
列
向
量
的
线
性
组
合
Ax=b \\ \quad \\ 将A看作列向量的横向排列: \\ \quad \\ A = (\vec a_1, \vec a_2, \dots, \vec a_n) \\ (\vec a_1, \vec a_2, \dots, \vec a_n)x=x_1\vec a_1+x_2\vec a_2+\dots+ x_n\vec a_n \\ \quad \\ 实际上,x_1\vec a_1+x_2\vec a_2+\dots+ x_n\vec a_n就是矩阵A的列向量的线性组合
Ax=b将A看作列向量的横向排列:A=(a
1,a
2,…,a
n)(a
1,a
2,…,a
n)x=x1a
1+x2a
2+⋯+xna
n实际上,x1a
1+x2a
2+⋯+xna
n就是矩阵A的列向量的线性组合
由以上过程,我们就可以把矩阵与列向量的乘积
A
x
=
b
Ax=b
Ax=b,定义为矩阵的列的线性组合,线性组合的系数就是列向量的每个元素。并且结果是矩阵列的线性组合,那么列向量维数的肯定不变。
同理,行向量与矩阵 x T A = b T x^TA=b^T xTA=bT的乘积,就是矩阵行的线性组合。
矩阵之间的乘法
现在来考虑矩阵的乘法:
A
X
=
B
将
X
都
看
作
列
向
量
的
横
向
排
列
X
=
(
x
⃗
1
,
x
⃗
2
,
…
,
x
⃗
n
)
A
X
=
A
(
x
⃗
1
,
x
⃗
2
,
…
,
x
⃗
n
)
=
(
A
x
⃗
1
,
A
x
⃗
2
,
…
,
A
x
⃗
n
)
于
是
,
矩
阵
乘
积
就
变
成
了
矩
阵
与
列
向
量
乘
积
的
横
向
排
列
AX=B \\ \quad \\ 将X都看作列向量的横向排列 \\ \quad \\ X = (\vec x_1, \vec x_2, \dots, \vec x_n) \\ AX=A(\vec x_1, \vec x_2, \dots, \vec x_n)=(A\vec x_1, A\vec x_2, \dots, A\vec x_n) \\ \quad \\ 于是,矩阵乘积就变成了矩阵与列向量乘积的横向排列 \\
AX=B将X都看作列向量的横向排列X=(x
1,x
2,…,x
n)AX=A(x
1,x
2,…,x
n)=(Ax
1,Ax
2,…,Ax
n)于是,矩阵乘积就变成了矩阵与列向量乘积的横向排列
因此,我们就可以把矩阵乘法
A
X
=
B
AX=B
AX=B,定义为矩阵列的不同线性组合的横向排列。既然结果是列的线性组合的横向排列,那么结果的排列个数肯定与
X
X
X的横向排列个数相同。
扩展1:方阵与向量的乘法与线性相关性
对于矩阵和列向量的乘法:
对
于
线
性
齐
次
方
程
组
,
有
A
x
=
0
∈
R
n
对于线性齐次方程组,有\\ \quad \\ Ax=0\in R^n
对于线性齐次方程组,有Ax=0∈Rn
我们知道零向量是矩阵列的线性组合,那么如果矩阵的列向量是线性相关的,就存在非零向量
x
x
x使方程有解 ,如果矩阵的列是线性无关的,方程的解就只有零向量。
扩展2:方阵间的乘法与秩
对于方阵之间的乘法:
A
B
=
E
∈
R
n
×
n
AB=E\in R^{n\times n}
AB=E∈Rn×n
我们知道单位矩阵
E
E
E是
A
A
A的列的线性组合的排列,也就是说
A
A
A的列组合可以表示
E
E
E的每个列,那么必然有
n
≥
r
(
A
)
≥
r
(
E
)
=
n
n\ge r(A)\ge r(E)=n
n≥r(A)≥r(E)=n,则
r
(
A
)
=
n
r(A)=n
r(A)=n。
延伸到向量空间,就能够得到更加本质的结论。
后记
本篇实际上是把矩阵乘法归纳为向量的线性组合。下篇将记录向量空间。
