- 參考:麻省理工線性代數(shù)
- 閱讀本文前請(qǐng)先了解矩陣四個(gè)基本子空間,參考:線性代數(shù)拾遺(5) —— 矩陣的四個(gè)基本子空間
1. 向量投影到一維空間(向量間投影)
-
考察二維平面投影,如下將向量 b \pmb b 投影到向量 a \pmb{a} a 方向,得到 a \pmb{a} a 的子空間中的向量 p \pmb{p} p,假設(shè)是 a \pmb{a} a 的 x x x 倍
如圖可見 b ? p \pmb{b-p} b?p 可以衡量 a , b \pmb{a,b} a,b 間的誤差,它與向量 a \pmb{a} a 正交,內(nèi)積為 0,即有
?????? a ? ( b ? p ) = a ? ( b ? x a ) = 0 ? x = a ? b a ? a ? p = a x = a a ? b a ? a = ( a a ? a ? a ) b \begin{aligned} &\space\space\space\space\space\space\pmb{a^\top}(\pmb{b-p}) = \pmb{a^\top}(\pmb-x\pmb{a}) = \pmb{0}\\ &\Rightarrow x = \frac{\pmb{a^\top b}}{\pmb{a^\top a}} \\ &\Rightarrow \pmb{p} = \pmb{a}x = \pmb{a} \frac{\pmb{a^\top b}}{\pmb{a^\top a}} = ( \frac{\pmb{aa^\top }}{\pmb{a^\top a}}) \pmb \end{aligned} ???????a?(b?p)=a?(b?xa)=0?x=a?aa?b??p=ax=aa?aa?b?=(a?aaa??)b? 這時(shí),我們把 a a ? a ? a \frac{\mathbf{aa^\top }}{\mathbf{a^\top a}} a?aaa?? 稱為投影矩陣
,記為 P \pmb{P} P,用它左乘原始向量 b \pmb b 就得到投影向量 p \pmb{p} p,即 P b = p \pmb{Pb} = \pmb{p} Pb=p -
兩種特殊情況
- 若 b \pmb b 和 a \pmb{a} a 平行,有 P b = b \pmb{Pb} = \pmb Pb=b
- 若 b \pmb b 和 a \pmb{a} a 正交,有 P b = 0 \pmb{Pb} = \pmb{0} Pb=0
二維空間中,平行和正交于向量 a \pmb{a} a 的兩個(gè)向量構(gòu)成一組基,可以線性表出任意向量,投影本質(zhì)就是保留平行部分而消除正交部分
-
研究投影矩陣 P = a a ? a ? a \pmb{P}=\frac{\mathbf{aa^\top }}{\mathbf{a^\top a}} P=a?aaa?? 性質(zhì)
- 分子 a ? a \mathbf{a^\top a} a?a 是向量?jī)?nèi)積,是個(gè)常數(shù),不管它
- 分子
a
a
?
\mathbf{aa^\top }
aa?,這是個(gè)矩陣,顯然有
rank
(
A
)
=
1
\text{rank}(\pmb{A})=1
rank(A)=1,其列空間就是
k
a
k\pmb{a}
ka,因此用投影矩陣左乘向量會(huì)把向量變換到其列空間
k
a
k\pmb{a}
ka 中,實(shí)現(xiàn)投影
注:用矩陣左乘一個(gè)向量時(shí),相當(dāng)于對(duì)這個(gè)矩陣的列向量做線性組合,得到的向量位于矩陣的列空間中
- a a ? \mathbf{aa^\top } aa? 對(duì)稱,所以 p \pmb{p} p 是對(duì)稱矩陣, P = P ? \pmb{P} = \pmb{P^\top} P=P?
-
重復(fù)投影兩次,結(jié)果不變,即有
P
2
=
P
\pmb{P}^2 = \pmb{P}
P2=P
這個(gè)也可以簡(jiǎn)單地展開計(jì)算驗(yàn)證
-
另外提一句, 假設(shè)向量 a , b \pmb{a,b} a,b 夾角為 θ \theta θ,常見的向量?jī)?nèi)積 a ? b = ∣ ∣ b ∣ ∣ ? ∣ ∣ a ∣ ∣ ? c o s ( θ ) \pmb{a}^\top \pmb = ||b||·||a||·cos(\theta) a?b=∣∣b∣∣?∣∣a∣∣?cos(θ) 計(jì)算的就是一個(gè)向量的模乘以另一個(gè)向量在此向量上投影的模長(zhǎng)。如果把其中某一個(gè)向量的模長(zhǎng)設(shè)為1(即變?yōu)閱挝幌蛄浚詈笤俪艘栽撓蛄?,就得到投影向量,?br> a 投影到單位向量 b 為: ( a ? b ) b = ( b ? a ) b = ∣ ∣ a ∣ ∣ c o s ( θ ) b ,其中 ∣ ∣ b ∣ ∣ = 1 b 投影到單位向量 a 為: ( a ? b ) a = ( b ? a ) a = ∣ ∣ b ∣ ∣ c o s ( θ ) a ,其中 ∣ ∣ a ∣ ∣ = 1 \pmb{a}投影到單位向量 \pmb 為: (\pmb{a}^\top \pmb)\pmb=(\pmb^\top \pmb{a})\pmb = ||\pmb{a}||cos(\theta)\pmb,其中 ||\pmb|| = 1\\ \pmb投影到單位向量 \pmb{a} 為: (\pmb{a}^\top \pmb)\pmb{a}=(\pmb^\top \pmb{a})\pmb{a}=||\pmb||cos(\theta)\pmb{a},其中 ||\pmb{a}|| = 1 a投影到單位向量b為:(a?b)b=(b?a)b=∣∣a∣∣cos(θ)b,其中∣∣b∣∣=1b投影到單位向量a為:(a?b)a=(b?a)a=∣∣b∣∣cos(θ)a,其中∣∣a∣∣=1 當(dāng)投影方向不是單位向量時(shí),增加其模的倒數(shù)進(jìn)行縮放,如上圖中的 p = ∣ ∣ b ∣ ∣ c o s ( θ ) a ∣ ∣ a ∣ ∣ \pmb{p} = ||\pmb||cos(\theta)\frac{\mathbf{a}}{||\mathbf{a}||} p=∣∣b∣∣cos(θ)∣∣a∣∣a?
2. 向量投影到多維空間
2.1 計(jì)算方法
-
完全和第 1 節(jié)中二維情況完全類似,現(xiàn)有矩陣 A \pmb{A} A,將向量 b \pmb b 投影到 A \pmb{A} A 列向量 a 1 , a 2 , . . . , a n \pmb{a}_1,\pmb{a}_2,...,\pmb{a}_n a1?,a2?,...,an? 張成的空間中得到 p \pmb{p} p。三維情況示意圖如下
可見這時(shí)仍有 e = b ? p \pmb{e} = \pmb{b-p} e=b?p 可以衡量 b \pmb b 和 A \pmb{A} A 列空間間的誤差,我們希望希望二者正交(也就是希望誤差最小化),這意味著 b \pmb b 與 A \pmb{A} A 的所有列向量正交,內(nèi)積均為 0;另一方面,這時(shí) p \pmb{p} p 在 A \pmb{A} A 列空間中,故能用 A \pmb{A} A 的列向量線性表示,設(shè) p = A x ^ \pmb{p}=\pmb{A\hat{x}} p=Ax^,則有
???? [ a 1 ? a 2 ? ? a m ? ] ( b ? p ) = [ a 1 ? a 2 ? ? a m ? ] ( b ? A x ^ ) = [ 0 0 ? 0 ] ? A ? ( b ? A x ^ ) = 0 ? x ^ = ( A ? A ) ? 1 A ? b ? p = A x ^ = A ( A ? A ) ? 1 A ? b \begin{aligned} &\space\space\space\space\begin{bmatrix} \pmb{a}_1^\top \\ \pmb{a}_2^\top \\ \vdots\\ \pmb{a}_m^\top \end{bmatrix} (\pmb{b-p}) = \begin{bmatrix} \pmb{a}_1^\top \\ \pmb{a}_2^\top \\ \vdots\\ \pmb{a}_m^\top \end{bmatrix} (\pmb-\pmb{A}\pmb{\hat{x}}) = \begin{bmatrix} \pmb{0}\\ \pmb{0} \\ \vdots\\ \pmb{0} \end{bmatrix} \\ &\Rightarrow \pmb{A^\top}(\pmb{b-\pmb{A}\hat{x}}) = \pmb{0}\\ &\Rightarrow \pmb{\hat{x}} = (\pmb{A^\top A})^{-1}\pmb{A^\top b} \\ &\Rightarrow \pmb{p} = \pmb{A\hat{x}} = \pmb{A}(\pmb{A^\top A})^{-1}\pmb{A^\top b} \end{aligned} ????? ?a1??a2???am??? ?(b?p)= ?a1??a2???am??? ?(b?Ax^)= ?00?0? ??A?(b?Ax^)=0?x^=(A?A)?1A?b?p=Ax^=A(A?A)?1A?b? 這時(shí),我們把 A ( A ? A ) ? 1 A ? \pmb{A}(\pmb{A^\top A})^{-1}\pmb{A^\top} A(A?A)?1A? 稱為投影矩陣
,記為 P \pmb{P} P,用它左乘原始向量 b \pmb b 就得到投影向量 p \pmb{p} p,即 P b = p \pmb{Pb} = \pmb{p} Pb=p。 -
兩種特殊情況
- 若
b
∈
C
(
A
)
\pmb \in C(\pmb{A})
b∈C(A),有
P
b
=
b
\pmb{Pb} = \pmb
Pb=b
這時(shí) b = A x \pmb = \pmb{Ax} b=Ax 是 A \pmb{A} A 的線性組合,有 P b = A ( A ? A ) ? 1 A ? A x = A x = b \pmb{Pb} = \pmb{A}(\pmb{A^\top A})^{-1}\pmb{A^\top Ax }= \pmb{Ax}=\pmb Pb=A(A?A)?1A?Ax=Ax=b
- 若
b
⊥
C
(
A
)
\pmb \perp C(\pmb{A})
b⊥C(A),即
b
∈
N
(
A
?
)
\pmb \in N(\pmb{A^\top})
b∈N(A?),有
P
b
=
0
\pmb{Pb} = \pmb{0}
Pb=0
這時(shí) A ? b = 0 \pmb{A^\top b} = \pmb{0} A?b=0,有 P b = A ( A ? A ) ? 1 A ? x = 0 \pmb{Pb} = \pmb{A}(\pmb{A^\top A})^{-1}\pmb{A^\top x }= \pmb{0} Pb=A(A?A)?1A?x=0
m m m 維( A \pmb{A} A 列向量尺寸)空間可以分解為 C ( A ) C(\pmb{A}) C(A) 和 N ( A ? ) N(\pmb{A^\top}) N(A?) 的正交直和,因此這兩個(gè)空間的基放在一起就構(gòu)成 m m m 維空間的一組基,可以線性表出任意向量,投影本質(zhì)就是保留 C ( A ) C(\pmb{A}) C(A) 中部分而消除 N ( A ? ) N(\pmb{A^\top}) N(A?) 中部分,可以用子空間關(guān)系圖如下表示
如圖可見,除了上述投影 P b = p \pmb{Pb=p} Pb=p 把 b \pmb b 投影到 C ( A ) C(\pmb{A}) C(A) 中以外,還有另一個(gè)投影 ( I ? P ) b = e (\pmb{I-P})\pmb = \pmb{e} (I?P)b=e 將 b \pmb b 投影到 N ( A ? ) N(\pmb{A^\top}) N(A?) 中,可見當(dāng) P \pmb{P} P 是投影矩陣時(shí), I ? P \pmb{I-P} I?P 也是一個(gè)投影矩陣文章來源:http://www.zghlxwxcb.cn/news/detail-466210.html - 若
b
∈
C
(
A
)
\pmb \in C(\pmb{A})
b∈C(A),有
P
b
=
b
\pmb{Pb} = \pmb
Pb=b
-
研究投影矩陣 P = A ( A ? A ) ? 1 A ? \pmb{P}=\pmb{A}(\pmb{A^\top A})^{-1}\pmb{A^\top} P=A(A?A)?1A? 性質(zhì)文章來源地址http://www.zghlxwxcb.cn/news/detail-466210.html
- 當(dāng) A \pmb{A} A 非方陣時(shí), A \pmb{A} A 列滿秩 ? A ? A \Leftrightarrow \pmb{A^\top A} ?A?A 可逆,
- 當(dāng) A \pmb{A} A 是可逆方陣時(shí),其中的括號(hào)可以打開,這時(shí)有 P = I \pmb{P}=\pmb{I} P=I,即投影矩陣做的是恒等映射。確實(shí)如此,因?yàn)? A \pmb{A} A 可逆,意味著列滿秩,其列空間是整個(gè) n n n 維空間,投影前后都在同一個(gè)空間中,那么恒等映射顯然是誤差最小的
- 簡(jiǎn)單計(jì)算即可得到 P \pmb{P} P 是對(duì)稱矩陣,即有 P = P ? \pmb{P} = \pmb{P^\top} P=P?
- 重復(fù)投影兩次,結(jié)果不變,即有 P 2 = P \pmb{P}^2 = \pmb{P} P2=P,也可從代數(shù)角度簡(jiǎn)單計(jì)算驗(yàn)證
- P \pmb{P} P 是投影矩陣時(shí), I ? P \pmb{I-P} I?P 也是一個(gè)投影矩陣
2.2 意義
- 現(xiàn)實(shí)生活中常有這樣的應(yīng)用:根據(jù)一些測(cè)量值求解另一些值,比如根據(jù)衛(wèi)星與幾個(gè)基站的通訊延時(shí)測(cè)量其位置。這其實(shí)就是在解方程,通常一組觀測(cè)值解出一個(gè)結(jié)果,為了提高準(zhǔn)確性,通常會(huì)收集很多數(shù)據(jù),這樣就聯(lián)立到得到方程組 A x = b \pmb{Ax} = \pmb Ax=b一般情況下樣本量遠(yuǎn)大于未知數(shù)個(gè)數(shù),即 A m × n \pmb{A}_{m\times n} Am×n? 中 m > > n m>>n m>>n,這樣的超定方程很難有解析解,除非其中含有多達(dá) m ? n m-n m?n 個(gè)無效約束,因?yàn)槲覀儧]法對(duì)非方陣的 A \pmb{A} A 求逆來得到 x = A ? 1 b \pmb{x} = \pmb{A}^{-1}\pmb x=A?1b
- 這時(shí)我們可以不斷地去除方程,直到剩下的方程組有解為止,但這會(huì)造成數(shù)據(jù)浪費(fèi)。另一種更好的方法是找一個(gè)和已知數(shù)據(jù) “誤差最小” 的解,設(shè)這個(gè)近似解為
x
^
\pmb{\hat{x}}
x^,我們有
A x ^ = p \pmb{A\hat{x}} = \pmb{p} Ax^=p 第 1 節(jié)中已分析過,我們這時(shí)是通過矩陣 A \pmb{A} A 左乘,把向量 x ^ \pmb{\hat{x}} x^ 變換到了 A \pmb{A} A 的列空間中得到 p \pmb{p} p,為了保證 “誤差最小” ,這時(shí) p \pmb{p} p 應(yīng)當(dāng)是 b \pmb b 在 A \pmb{A} A 列空間中的投影 - 一句話說,可以利用空間投影估計(jì)無解線性方程組的最小誤差解,基于這個(gè)原理可以得到最小二乘法
到了這里,關(guān)于線性代數(shù)拾遺(6)—— 向量空間投影與投影矩陣的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!