投影矩陣 /冪等矩陣
投影矩陣 /冪等矩陣 (idempotent matrix) P \mathbf P P滿足 P 2 = P P^2=P P2=P,也即 P ( I ? P ) = 0 P(I-P)=0 P(I?P)=0
- 冪等矩陣
P
P
P 的幾何意義:將向量
x
\mathbf{x}
x 投影至
P
P
P 的列空間
C
(
P
)
C(P)
C(P)內(nèi)
而 P 2 = P P^2=P P2=P的意義就是“投影兩次等效于投影一次” - 投影也分為兩類:斜投影(oblique projection) 和 正交投影(額外滿足 P H = P P^H=P PH=P)
下面先介紹一般投影的特點,然后再介紹正交投影
投影矩陣 /冪等矩陣 的性質(zhì)
關(guān)于特征值和行列式:
- 特征值必為
λ
=
0
或
1
\lambda=0 或 1
λ=0或1(證明:
P
2
x
=
P
x
P^2\mathbf{x}=P\mathbf{x}
P2x=Px,則
λ
2
x
=
λ
x
\lambda^2\mathbf{x}=\lambda\mathbf{x}
λ2x=λx,
λ
2
=
λ
\lambda^2=\lambda
λ2=λ)
①其中, λ = 1 \lambda=1 λ=1 的特征子空間為 C ( P ) C(P) C(P), λ = 0 \lambda=0 λ=0 的特征子空間為 N ( P ) N(P) N(P)
② det ? P = 0 或 1 \det P=0 或 1 detP=0或1 - 推論:投影矩陣 P P P必然可以相似對角化為 d i a g ( 1 , … , 1 , 0 , … , 0 ) \mathrm{diag}(1,\ldots,1,0,\ldots,0) diag(1,…,1,0,…,0)
證明:
因為 λ = 1 \lambda=1 λ=1 的特征子空間為 C ( P ) C(P) C(P), λ = 0 \lambda=0 λ=0 的特征子空間為 N ( P ) N(P) N(P),而 C n = C ( P ) ⊕ N ( P ) \mathbb C^n=C(P)\oplus N(P) Cn=C(P)⊕N(P)(后面證明),有充足的無關(guān)特征向量,代數(shù)重數(shù)=幾何重數(shù),投影矩陣 P P P**必然可以相似對角化
- r a n k ( P ) = t r a c e ( P ) \mathrm{rank}(P)=\mathrm{trace}(P) rank(P)=trace(P)
證明: t r a c e ( P ) = λ 1 + . . . + λ n = 特征值 1 的個數(shù) \mathrm{trace}(P)=\lambda_1+...+\lambda_n=特征值1的個數(shù) trace(P)=λ1?+...+λn?=特征值1的個數(shù)
另外,投影矩陣的重要意義是,投影隱含了兩個投影矩陣、隱含了空間的直和分解
-
(
I
?
P
)
(I-P)
(I?P)也是冪等矩陣,幾何意義是將向量正交投影至
C
(
I
?
P
)
C(I-P)
C(I?P)
并且 C ( I ? P ) C(I-P) C(I?P)與 C ( P ) C(P) C(P)互為直和補: C n = C ( P ) ⊕ C ( I ? P ) \mathbb C^n=C(P)\oplus C(I-P) Cn=C(P)⊕C(I?P)
如圖,任意向量可拆分為投影部分 C ( P ) C(P) C(P)和投影的“軌跡”部分 C ( I ? P ) C(I-P) C(I?P): x = P x + ( I ? P ) x \mathbf{x}=P\mathbf{x}+(I-P)\mathbf{x} x=Px+(I?P)x
-
N
(
P
)
=
C
(
I
?
P
)
N(P)=C(I-P)
N(P)=C(I?P), 同理有
N
(
I
?
P
)
=
C
(
P
)
N(I-P)=C(P)
N(I?P)=C(P)
推論: P ( I ? P ) = 0 P(I-P)=0 P(I?P)=0、 ( I ? P ) P = 0 (I-P)P=0 (I?P)P=0
證明:
①若 x ∈ N ( P ) \mathbf{x}\in N(P) x∈N(P), P x = 0 P\mathbf{x}=\mathbf{0} Px=0,故 ( I ? P ) x = x ? P x = x (I-P)\mathbf{x}=\mathbf{x}-P\mathbf{x}=\mathbf{x} (I?P)x=x?Px=x,亦即 x ∈ C ( I ? P ) \mathbf{x}\in C(I-P) x∈C(I?P)
②若 x ∈ C ( I ? P ) \mathbf{x}\in C(I-P) x∈C(I?P), x = ( I ? P ) y \mathbf{x}=(I-P)\mathbf{y} x=(I?P)y,故 P x = P ( I ? P ) y = 0 y = 0 P\mathbf{x}=P(I-P)\mathbf{y}=0\mathbf{y}=\mathbf{0} Px=P(I?P)y=0y=0,即 x ∈ N ( P ) \mathbf{x}\in N(P) x∈N(P)
- 推論:每個投影矩陣,唯一對應(yīng)空間的一個直和分解: C n = C ( P ) ⊕ N ( P ) \mathbb C^n=C(P)\oplus N(P) Cn=C(P)⊕N(P)
證明: C n = C ( P ) ⊕ C ( I ? P ) \mathbb C^n=C(P)\oplus C(I-P) Cn=C(P)⊕C(I?P),帶入 C ( I ? P ) = N ( P ) C(I-P)=N(P) C(I?P)=N(P)即可
正交投影矩陣
在此冪等矩陣 P 2 = P P^2=P P2=P的基礎(chǔ)上, P P P為正交投影矩陣的充要條件是:
- P 2 = P = P H P^2=P=P^H P2=P=PH
為何正交投影要求 P H = P P^H=P PH=P?
理解:“垂直投影”即 P H ( I ? P ) x = 0 P^H(I-P)\mathbf{x}=0 PH(I?P)x=0,
這要求 P H = P H P P^H=P^HP PH=PHP,又因為 ( P H P ) H = P H P (P^HP)^H=P^HP (PHP)H=PHP,則 P H = P P^H=P PH=P
- P = P H P P=P^H P P=PHP
這是 P 2 = P = P H P^2=P=P^H P2=P=PH的等價描述
證明:
若 P 2 = P = P H P^2=P=P^H P2=P=PH,則 P H P = P P = P P^H P=PP=P PHP=PP=P;
若 P = P H P P=P^H P P=PHP,則 P H = P H P = P P^H=P^H P=P PH=PHP=P,且 P = P H P = P P P=P^H P=PP P=PHP=PP。
- 正交投影矩陣 P P P的幾何意義:“垂直”的投影,i.e. 投影“軌跡” x ? P x = ( I ? P ) x \mathbf{x}-P\mathbf{x}=(I-P)\mathbf{x} x?Px=(I?P)x必然垂直于 C ( P ) C(P) C(P)
正交投影矩陣的性質(zhì)與一般的投影矩陣相同,主要有以下不同:
-
正交投影矩陣必為 Hermite矩陣、必為 正規(guī)矩陣(
P
H
=
P
P^H=P
PH=P,
P
H
P
=
P
P
H
P^HP=PP^H
PHP=PPH)
因此,正交投影矩陣必必有一套正交的特征向量(可酉對角化)、必有實特征值(0和1)、滿足 A x = λ x ? A H x = λ ˉ x A\mathbf x=\lambda\mathbf x\Rightarrow A^H\mathbf x=\bar\lambda\mathbf x Ax=λx?AHx=λˉx、奇異值 σ 1 , . . . , σ n = ∣ λ 1 ∣ , … , ∣ λ n ∣ \sigma_1,...,\sigma_n=\vert\lambda_1\vert,\ldots,\vert\lambda_n\vert σ1?,...,σn?=∣λ1?∣,…,∣λn?∣(特征值的絕對值) - 正交投影矩陣至少為半正定矩陣
原因:正交投影矩陣滿足 P H = P P^H=P PH=P,且特征值為0和1(特征值 ≥ 0 \ge 0 ≥0),故為半正定矩陣 - [將空間分解為 C n = X ⊕ X ⊥ \mathbb{C}^n=\mathcal{X}\oplus\mathcal{X}^{\perp} Cn=X⊕X⊥] 唯一對應(yīng)一個 [正交投影矩陣],反之亦然
向 C ( P ) C(P) C(P)做投影,斜投影矩陣有無數(shù)個,正交投影矩陣則只有一個( X \mathcal{X} X唯一確定其正交補 X ⊥ \mathcal{X}^{\perp} X⊥)
①對于斜投影矩陣 P P P,空間被分為 C n = C ( P ) ⊕ N ( P ) \mathbb C^n=C(P)\oplus N(P) Cn=C(P)⊕N(P),我們說矩陣 P P P 將向量 v \mathbf{v} v 沿著 N ( P ) N(P) N(P) 投影至 C ( P ) C(P) C(P)( N ( P ) N(P) N(P)與 C ( P ) C(P) C(P)不一定正交)
②對于正交投影矩陣 P P P,空間被分為 C n = C ( P ) ⊕ N ( P ) \mathbb C^n=C(P)\oplus N(P) Cn=C(P)⊕N(P)(其中 N ( P ) = C ( P ) ⊥ N(P)=C(P)^{\perp} N(P)=C(P)⊥ ),我們可以直接說矩陣 P P P 將向量 v \mathbf{v} v (沿著 N ( P ) = C ( P ) ⊥ N(P)=C(P)^{\perp} N(P)=C(P)⊥ )投影至 C ( P ) C(P) C(P)
- 正交投影中實際上隱含了兩個正交投影矩陣,也將空間分解為兩個正交補
① P P P將向量正交投影至 C ( P ) C(P) C(P); ( I ? P ) (I-P) (I?P)將向量正交投影至 C ( I ? P ) C(I-P) C(I?P);
② C n = C ( P ) ⊕ C ( I ? P ) \mathbb C^n=C(P)\oplus C(I-P) Cn=C(P)⊕C(I?P),且 C ( P ) ⊥ = C ( I ? P ) C(P)^{\perp}=C(I-P) C(P)⊥=C(I?P)(正交補)
③ C n = C ( P ) ⊕ N ( P ) \mathbb C^n=C(P)\oplus N(P) Cn=C(P)⊕N(P),且 C ( P ) ⊥ = N ( P ) C(P)^{\perp}=N(P) C(P)⊥=N(P)(因為 N ( P ) = C ( I ? P ) N(P)=C(I-P) N(P)=C(I?P) )
如圖,任意向量可拆分為 x = P x + ( I ? P ) x \mathbf{x}=P\mathbf{x}+(I-P)\mathbf{x} x=Px+(I?P)x, 且 P x ⊥ ( I ? P ) x P\mathbf{x}\perp (I-P)\mathbf{x} Px⊥(I?P)x
- 對于任意的
x
\mathbf{x}
x,正交投影矩陣保證
∥
P
x
∥
≤
∥
x
∥
\Vert P\mathbf{x}\Vert\le\Vert\mathbf{x}\Vert
∥Px∥≤∥x∥
這就是說,正交投影 P x P\mathbf{x} Px 的長度必不大于原向量 x \mathbf{x} x 的長度 - 反過來,任何不會增長向量長度的投影必為正交投影
i.e. 對于投影矩陣 P = P 2 P=P^2 P=P2,若對任意 x \mathbf{x} x有 ∥ P x ∥ ≤ ∥ x ∥ \Vert P\mathbf{x}\Vert\le\Vert\mathbf{x}\Vert ∥Px∥≤∥x∥,則 P H = P P^H=P PH=P - 兩正交投影矩陣
P
P
P 和
Q
Q
Q 正交(
P
H
Q
=
P
Q
=
0
P^HQ=PQ=0
PHQ=PQ=0),則
①它們所投影到的空間也正交( C ( P ) C(P) C(P)與 C ( Q ) C(Q) C(Q)正交)
②進(jìn)而有 Q = I ? P Q=I-P Q=I?P
證明:
若 P H Q = 0 P^HQ=0 PHQ=0 且 x ∈ C ( P ) \mathbf{x}\in C(P) x∈C(P), y ∈ C ( Q ) \mathbf{y}\in C(Q) y∈C(Q),則 x H y = ( P x ) H ( Q y ) = x H P H Q y = 0 \mathbf{x}^{H}\mathbf{y}=(P\mathbf{x})^{H}(Q\mathbf{y})=\mathbf{x}^{H}P^{H}Q\mathbf{y}=0 xHy=(Px)H(Qy)=xHPHQy=0
若 C ( P ) ⊥ C ( Q ) C(P)\perp C(Q) C(P)⊥C(Q),則對于 Q x ∈ C ( Q ) ? C ( P ) ⊥ Q\mathbf{x}\in C(Q)\subseteq C(P)^{\perp} Qx∈C(Q)?C(P)⊥,有 P H ( Q x ) = 0 P^H(Q\mathbf{x})=\mathbf{0} PH(Qx)=0,即 P H Q = 0 P^HQ=0 PHQ=0
如何求向 C ( A ) C(A) C(A)做正交投影的正交投影矩陣
給出列滿秩矩陣
A
A
A(列向量線性無關(guān)),我們希望向列空間
C
(
A
)
C(A)
C(A)做正交投影
對應(yīng)的正交投影矩陣就是
P
=
A
(
A
T
A
)
?
1
A
T
P=A(A^TA)^{-1}A^T
P=A(ATA)?1AT,可以驗證
P
2
=
P
=
P
T
P^2=P=P^T
P2=P=PT、
C
(
P
)
=
C
(
A
)
C(P)=C(A)
C(P)=C(A)
說明:
①再次強調(diào)前提: rank A = n \hbox{rank}A=n rankA=n,此時才有 A T A A^TA ATA可逆
②注意,其中 ( A T A ) ? 1 A T (A^TA)^{-1}A^T (ATA)?1AT就是 A A A的左逆 A l e f t ? 1 A_{left}^{-1} Aleft?1?
③ P = A ( A T A ) ? 1 A T P=A(A^TA)^{-1}A^T P=A(ATA)?1AT中左側(cè)先出現(xiàn)因子 A A A,這保證了 C ( P ) = C ( A ) C(P)=C(A) C(P)=C(A)
推導(dǎo)過程:線代膠囊──正交投影矩陣
- 假如
A
A
A的列向量是正交化的,公式得到簡化:
將QR分解 A = Q R A=QR A=QR帶入 P = A ( A T A ) ? 1 A T P=A(A^TA)^{-1}A^T P=A(ATA)?1AT,化簡得到 P = Q Q T P=QQ^T P=QQT
另外,如果 P = Q Q T = [ q 1 T ? q k T ] [ q 1 ? q k ] = q 1 q 1 T + ? + q k q k T P=QQ^{T}=\begin{bmatrix} \mathbf{q}_1^T\\ \vdots\\ \mathbf{q}_k^T \end{bmatrix}\begin{bmatrix} \mathbf{q}_1&\cdots&\mathbf{q}_k \end{bmatrix}=\mathbf{q}_1\mathbf{q}_1^T+\cdots+\mathbf{q}_k\mathbf{q}_k^{T} P=QQT= ?q1T??qkT?? ?[q1????qk??]=q1?q1T?+?+qk?qkT?
那么向量 x \mathbf x x的投影容易計算: P x = ( q 1 q 1 T + ? + q k q k T ) x = ( q 1 T x ) q 1 + ? + ( q k T x ) q k P\mathbf{x}=(\mathbf{q}_1\mathbf{q}_1^T+\cdots+\mathbf{q}_k\mathbf{q}_k^{T})\mathbf{x}=(\mathbf{q}_1^T\mathbf{x})\mathbf{q}_1+\cdots+(\mathbf{q}_k^T\mathbf{x})\mathbf{q}_k Px=(q1?q1T?+?+qk?qkT?)x=(q1T?x)q1?+?+(qkT?x)qk?文章來源:http://www.zghlxwxcb.cn/news/detail-736352.html
- 注意,這里的正交投影矩陣
P
P
P 是唯一的:
即使 A A A的列向量改變,只要 C ( A ) C(A) C(A)仍不變、 A A A仍列滿秩,則 A A A仍不變 - 當(dāng) A A A為一個向量 a \mathbf{a} a,正交投影矩陣退化為 P = a ( a T a ) ? 1 a T = a a T a T a \displaystyle P=\mathbf{a}(\mathbf{a}^T\mathbf{a})^{-1}\mathbf{a}^T=\frac{\mathbf{a}\mathbf{a}^T}{\mathbf{a}^T\mathbf{a}} P=a(aTa)?1aT=aTaaaT?
reference:
直和與投影(前置知識)
特殊矩陣 (5):冪等矩陣
線代膠囊──正交投影矩陣
正交投影矩陣的性質(zhì)與界定
從線性變換解釋最小平方近似(正交投影的應(yīng)用:最小二乘法)文章來源地址http://www.zghlxwxcb.cn/news/detail-736352.html
到了這里,關(guān)于矩陣?yán)碚搢 特殊矩陣:冪等矩陣、投影、正交投影的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!