引言:如何判定兩個矩陣相似
相似矩陣,本質(zhì)上是同一個線性變換在不同坐標系下的矩陣
因此,兩個矩陣相似的一大特點是:特征值相同,各特征值的幾何重數(shù)/代數(shù)重數(shù)相同
進而,我們可以用特征多項式、特征值、行列式、跡、秩 等相似不變量來迅速輔助判定兩個矩陣是否相似,但這些都不是充要條件
兩個矩陣相似的充要條件:兩個矩陣具有相同的Jordan標準型(包含了大量信息,如特征值、代數(shù)/幾何重數(shù)、特征向量和可對角化判定的信息,下面會說明)
- Jordan標準型是一整個“相似矩陣大家族”的典型代表,根據(jù)相似關(guān)系的傳遞性,上述結(jié)論顯然
Jordan標準型
Jordan標準型可以視為一種“矩陣三角化”。(ps. 也可以理解為一種由Jordan塊構(gòu)成的主對角分塊矩陣)
對于n階方陣 A \mathbf A A,一定存在正交矩陣/酉矩陣 Q \mathbf Q Q使 A \mathbf A A相似于上三角陣: A = Q U Q T \mathbf A=\mathbf Q\mathbf U\mathbf Q^T A=QUQT,詳見矩陣三角化的 Schur 定理
如果將正交矩陣改為普通的可逆矩陣 P \mathbf P P,同樣可以得到上三角陣 J \mathbf J J,即Jordan標準型: A = P J P ? 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1} A=PJP?1
為何要三角化?Jordan標準型是由于無法相似對角化而提出的,而上三角陣就是最接近對角矩陣的“最佳形式”
Jordan標準型的一般形式
任何方陣 A \mathbf A A都相似于一個Jordan標準型: A = P J P ? 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1} A=PJP?1
Jordan標準型
J
\mathbf J
J由多個Jordan塊組成
J
=
[
J
m
1
(
λ
1
)
0
?
0
0
J
m
2
(
λ
2
)
?
0
?
?
?
?
0
0
?
J
m
k
(
λ
k
)
]
,其中
J
m
i
(
λ
i
)
=
[
λ
i
1
?
?
?
1
λ
i
]
m
i
×
m
i
\mathbf J=\left[\begin{array}{cccc} J_{m_1}\left(\lambda_{1}\right) & 0 & \cdots & 0 \\ 0 & J_{m_2}\left(\lambda_{2}\right) & \cdots & 0 \\ \vdots & \vdots & \ddots & \ddots \\ 0 & 0 & \cdots & J_{m_k}\left(\lambda_{k}\right) \end{array}\right],其中J_{m_i}\left(\lambda_{i}\right)=\left[\begin{array}{cccc} \lambda_{i} & 1 & \\ & \ddots & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_{i} \end{array}\right]_{m_i\times m_i}
J=
?Jm1??(λ1?)0?0?0Jm2??(λ2?)?0??????00?Jmk??(λk?)?
?,其中Jmi??(λi?)=
?λi??1?????1λi??
?mi?×mi??
一般默認的排列順序為
λ
1
≥
λ
2
≥
.
.
.
≥
λ
k
\lambda_1\geq\lambda_2\geq...\geq\lambda_k
λ1?≥λ2?≥...≥λk?
每個Jordan塊 J ( λ i ) J\left(\lambda_{i}\right) J(λi?)的對角線上為特征值 λ i \lambda_{i} λi?,對角線上方全為1
Jordan標準型中隱含的信息
-
特征值: J \mathbf J J的所有主對角元 λ 1 , . . . , λ k \lambda_1,...,\lambda_k λ1?,...,λk?
-
特征值 λ i \lambda_i λi?的代數(shù)重數(shù) β i \beta_i βi?: J \mathbf J J的對角線上 λ i \lambda_i λi?的出現(xiàn)次數(shù)(特征值 λ i \lambda_i λi?的重根數(shù))
ps. 代數(shù)重數(shù)滿足 β i + β 2 + . . . + β k = n \beta_i+\beta_2+...+\beta_k=n βi?+β2?+...+βk?=n -
特征值 λ i \lambda_i λi?的幾何重數(shù) n i n_i ni?:主對角元為 λ i \lambda_i λi?的Jordan塊個數(shù)
(一個Jordan塊對應(yīng)一個獨立的特征向量/一個幾何重數(shù))矩陣可對角化,那么其所有特征值的幾何重數(shù)=代數(shù)重數(shù),也就是說其Jordan標準型中所有的Jordan塊都必須為1階的
或者說,可對角化矩陣,其Jordan標準型就是一個對角矩陣
-
某個Jordan塊的特征向量(不是原矩陣 A \mathbf A A的特征向量):
每個Jordan塊可以被寫為 J m ( λ ) = [ λ 1 ? ? ? 1 λ ] = [ λ ? ? λ ] + [ 0 1 ? ? ? 1 0 ] = λ I m + J m ( 0 ) \begin{aligned}J_{m}(\lambda)&=\left[\begin{array}{cccc}\lambda & 1 & & \\& \ddots & \ddots & \\& & \ddots & 1 \\& & & \lambda\end{array}\right] \\ &=\left[\begin{array}{llll}\lambda & & & \\& \ddots & & \\& & \ddots & \\& & & \lambda\end{array}\right] +\left[\begin{array}{llll}0 & 1 & & \\& \ddots & \ddots & \\& & \ddots & 1 \\& & & 0\end{array}\right] \\ &=\lambda I_{m}+J_{m}(0)\end{aligned} Jm?(λ)?= ?λ?1?????1λ? ?= ?λ?????λ? ?+ ?0?1?????10? ?=λIm?+Jm?(0)?這是一個單位陣和一個冪零(nilpotent)矩陣
①單位陣的特征值為 λ \lambda λ,特征向量為任意向量( λ I m x = λ x \lambda\bold I_{m}\bold x=\lambda\bold x λIm?x=λx)
②冪零矩陣 J m ( 0 ) J_{m}(0) Jm?(0)的特征值為0,且相應(yīng)的特征子空間維數(shù)為 m ? r a n k = 1 m-rank=1 m?rank=1,唯一的(單位長度)特征向量為 e 1 \bold e_1 e1?( J m ( 0 ) e 1 = 0 J_{m}(0)\bold e_1=\bold 0 Jm?(0)e1?=0),而對于其他標準單位向量則有 J m ( 0 ) e i = e i ? 1 , i > 1 J_{m}(0)\bold e_i=\bold e_{i-1},i>1 Jm?(0)ei?=ei?1?,i>1
由②,Jordan塊的特征向量必然是標準單位向量(例如 e i \bold e_i ei?代表單位陣 E \bold E E的第 i i i列)
綜合①②可知,該Jordan塊的特征向量為 J m ( λ ) e 1 = λ e 1 J m ( λ ) e i = λ e i + e i ? 1 , i = 2 , … , m J_{m}(\lambda) \mathbf{e}_{1}=\lambda \mathbf{e}_{1} \\ J_{m}(\lambda) \mathbf{e}_{i}=\lambda \mathbf{e}_{i}+\mathbf{e}_{i-1}, \quad i=2, \ldots, m Jm?(λ)e1?=λe1?Jm?(λ)ei?=λei?+ei?1?,i=2,…,m
可以看出,每個 m m m階的Jordan塊 J m ( 0 ) J_{m}(0) Jm?(0)有且僅有一個特征向量 e 1 \mathbf{e}_{1} e1?(因此上面說“一個Jordan塊對應(yīng)一個幾何重數(shù)”),而其余的 m ? 1 m-1 m?1個標準單位向量 e 2 , e 3 , . . . , e m \mathbf{e}_{2},\mathbf{e}_{3},...,\mathbf{e}_{m} e2?,e3?,...,em?稱為廣義特征向量(generalized eigenvector)
(可對角化的矩陣,其無關(guān)特征向量可張成整個空間,而Jordan標準型的情況,其所有廣義特征向量張成整個空間),詳見Jordan 形式大解讀 (上) | 線代啟示錄
- 舉例說明:
例如
J A = b l k d i a g ( [ 2 1 0 0 0 2 1 0 0 0 2 0 0 0 0 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( [ 2 1 0 0 2 1 0 0 2 ] , [ 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( J 3 ( 2 ) , J 2 ( 2 ) , J 2 ( 3 ) ) 和 J B = b l k d i a g ( [ 2 1 0 0 0 2 0 0 0 0 2 1 0 0 0 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( [ 2 1 0 2 ] , [ 2 1 0 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( J 2 ( 2 ) , J 2 ( 2 ) , J 2 ( 3 ) ) \begin{aligned}\mathbf J_{A} &=blkdiag(\left[\begin{array}{lll|l} 2 & 1 & 0 & 0 \\0 & 2 & 1 & 0 \\0 & 0 & 2 & 0 \\\hline 0 & 0 & 0 & 2\end{array}\right],\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right])\\ &=blkdiag(\left[\begin{array}{lll}2 & 1 & 0 \\0 & 2 & 1 \\0 & 0 & 2\end{array}\right], [2], \left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right])\\ &=blkdiag(J_3(2),J_2(2),J_2(3))\end{aligned}和\begin{aligned}\mathbf J_{B}&=blkdiag(\left[\begin{array}{ll|ll} 2 & 1 & 0 & 0 \\0 & 2 & 0 & 0 \\\hline 0 & 0 & 2 & 1 \\0 & 0 & 0 & 2\end{array}\right] ,\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right]) \\ &=blkdiag(\left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right], \left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right], \left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right])\\ &=blkdiag(J_2(2),J_2(2),J_2(3))\end{aligned} JA??=blkdiag( ?2000?1200?0120?0002?? ?,[30?13?])=blkdiag( ?200?120?012? ?,[2],[30?13?])=blkdiag(J3?(2),J2?(2),J2?(3))?和JB??=blkdiag( ?2000?1200?0020?0012?? ?,[30?13?])=blkdiag([20?12?],[20?12?],[30?13?])=blkdiag(J2?(2),J2?(2),J2?(3))?
其中, J A \mathbf J_{A} JA?的特征值為 2 , 3 2,3 2,3:
特征值 2 2 2的代數(shù)重數(shù)為 4 4 4,幾何重數(shù)為 2 2 2
特征值 3 3 3的代數(shù)重數(shù)為 2 2 2,幾何重數(shù)為 1 1 1
J A \mathbf J_{A} JA?的特征值 2 2 2的兩個特征向量為 [ 2 1 0 0 2 1 0 0 2 ] → e 1 = ( 1 , 0 , 0 , 0 , 0 , 0 ) T [ 2 ] → e 4 = ( 0 , 0 , 0 , 1 , 0 , 0 ) T \begin{aligned}{\left[\begin{array}{lll}2 & 1 & 0 \\0 & 2 & 1 \\0 & 0 & 2\end{array}\right]\rightarrow \mathbf{e}_{1}=(1,0,0,0,0,0)^{T}} \\ {[2] \rightarrow \mathbf{e}_{4}=(0,0,0,1,0,0)^{T}}\end{aligned} ?200?120?012? ?→e1?=(1,0,0,0,0,0)T[2]→e4?=(0,0,0,1,0,0)T?;
J A \mathbf J_{A} JA?的特征值 3 3 3的特征向量為 [ 3 1 0 3 ] → e 5 = ( 0 , 0 , 0 , 0 , 1 , 0 ) T {\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right] \rightarrow \mathbf{e}_{5}=(0,0,0,0,1,0)^{T}} [30?13?]→e5?=(0,0,0,0,1,0)T
J B \mathbf J_{B} JB?的特征值為 2 , 3 2,3 2,3:
特征值 2 2 2的代數(shù)重數(shù)為 4 4 4,幾何重數(shù)為 2 2 2
特征值 3 3 3的代數(shù)重數(shù)為 2 2 2,幾何重數(shù)為 1 1 1
J B \mathbf J_{B} JB?的特征值 2 2 2的兩個特征向量為 [ 2 1 0 2 ] → e 1 = ( 1 , 0 , 0 , 0 , 0 , 0 ) T [ 2 1 0 2 ] → e 3 = ( 0 , 0 , 1 , 0 , 0 , 0 ) T \begin{aligned}{\left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right] \rightarrow \mathbf{e}_{1}=(1,0,0,0,0,0)^{T}} \\ {\left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right] \rightarrow \mathbf{e}_{3}=(0,0,1,0,0,0)^{T}}\end{aligned} [20?12?]→e1?=(1,0,0,0,0,0)T[20?12?]→e3?=(0,0,1,0,0,0)T?;
J B \mathbf J_{B} JB?的特征值 3 3 3的特征向量為 [ 3 1 0 3 ] → e 5 = ( 0 , 0 , 0 , 0 , 1 , 0 ) T {\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right] \rightarrow \mathbf{e}_{5}=(0,0,0,0,1,0)^{T}} [30?13?]→e5?=(0,0,0,0,1,0)T
Jordan標準型的計算方式
見Jordan 形式大解讀 (下)
Jordan標準型的應(yīng)用
Jordan標準型在數(shù)值計算上的用處不大,但是可用于分析矩陣特征值情況,另外,證明兩個矩陣相似的通用方法就是證明它們有相同的Jordan標準型文章來源:http://www.zghlxwxcb.cn/news/detail-445638.html
Reference:
Jordan 典型形式淺說 (上)
Jordan 典型形式淺說 (下)
Jordan 形式大解讀 (上)
Jordan 形式大解讀 (下)文章來源地址http://www.zghlxwxcb.cn/news/detail-445638.html
到了這里,關(guān)于矩陣理論| 基礎(chǔ):Jordan標準型(從Jordan標準型求代數(shù)重數(shù)/幾何重數(shù)/特征向量)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!