国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<style id="0df8x"></style>

【機器學(xué)習(xí)-03】矩陣方程與向量求導(dǎo)方法

2年前作者：云天徽上分類：Toy博客閱讀(19)違法舉報

這篇具有很好參考價值的文章主要介紹了【機器學(xué)習(xí)-03】矩陣方程與向量求導(dǎo)方法。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

??在鋪墊了基礎(chǔ)矩陣和線性代數(shù)的相關(guān)知識后，我們現(xiàn)在嘗試將【機器學(xué)習(xí)-01】中提到的方程組表示形式轉(zhuǎn)化為矩陣形式，并利用矩陣方法來求解相關(guān)方程。同時，在【機器學(xué)習(xí)-01】中，我們已經(jīng)初步探討了最小二乘法這一優(yōu)化算法的基本思想。最小二乘法是一個基礎(chǔ)而重要的優(yōu)化算法，其背后的數(shù)學(xué)推導(dǎo)和實際應(yīng)用都值得我們深入研究。因此，從本節(jié)開始，我們將首先從矩陣方程出發(fā)，回顧矩陣運算的相關(guān)方法，并講解矩陣求導(dǎo)的技巧。之后，我們將從更嚴謹?shù)臄?shù)學(xué)角度出發(fā)，深入討論最小二乘法的基本原理，以深化對其的理解和應(yīng)用。

1.方程組求解與矩陣方程求解

??在【機器學(xué)習(xí)-01】機器學(xué)習(xí)基本概念與建模流程中，我們曾經(jīng)利用損失函數(shù)的偏導(dǎo)函數(shù)方程組進行簡單線性回歸模型參數(shù)的求解：

【機器學(xué)習(xí)-03】矩陣方程與向量求導(dǎo)方法,機器學(xué)習(xí),機器學(xué)習(xí),矩陣,人工智能

??
盡管求解方程組有多種方法，例如【機器學(xué)習(xí)-01】機器學(xué)習(xí)基本概念與建模流程一文中所描述的，可以先通過方程變量相消法反解出一個變量（例如 w=1），然后再將這個解代入到其他方程中求解出另一個變量（例如 b=1）。這種方法確實能夠手動求出方程組的解。然而，當(dāng)想要借助編程工具來求解方程組時，就需要將原始的方程組求解問題轉(zhuǎn)化為矩陣方程的求解問題。通過這種方法，我們可以利用計算機編程的便利性和高效性來自動求解復(fù)雜的方程組。因此，了解并掌握矩陣方程的求解方法對于利用編程工具進行機器學(xué)習(xí)建模是至關(guān)重要的。

$20 w + 8 b ? 28 = 0$
$8 w + 4 b ? 12 = 0$
我們令：

$\left [\begin{array}{cccc} 20 &8 \\ 8 &4 \\ \end{array}\right]$

$\left [\begin{array}{cccc} 28 \\ 12 \\ \end{array}\right]$

$\left [\begin{array}{cccc} w \\ b \\ \end{array}\right]$

其中 $X$ 為參數(shù)向量。借助矩陣運算相關(guān)知識，上述方程組可等價表示為：
$\cdot X - B = 0$
即 $\cdot X = B$

我們已經(jīng)成功地將方程組轉(zhuǎn)化為了矩陣方程。利用矩陣運算，我們可以直接在矩陣方程中求解參數(shù)向量X。為了進行這一計算，我們借助NumPy的基礎(chǔ)知識，通過創(chuàng)建二維張量來表示上述矩陣方程中的矩陣A和向量B。這樣，我們就可以利用NumPy提供的矩陣運算功能來求解這個矩陣方程，從而得到參數(shù)向量X的解。

A = np.array([[20, 8], [8, 4]])
A
array([[20,  8],
       [ 8,  4]])

B = np.array([[28, 12]]).T
B
array([[28],
       [12]])

注，此時B也是二維張量，可以使用矩陣乘法。

B.ndim
2

然后通過行列式計算結(jié)果，簡單驗證A是否滿秩：

np.linalg.matrix_rank(A)
2

當(dāng)然，也可以通過觀察A的行列式計算結(jié)果是否為0，來判斷A是否滿秩

np.linalg.det(A)
15.999999999999991

對于滿秩矩陣，我們可以求其逆矩陣

np.linalg.inv(A)
array([[ 0.25, -0.5 ],
       [-0.5 ,  1.25]])

然后在矩陣方程左右兩端同時左乘其逆矩陣，即可解出X的取值
$A^{-1}AX=A^{-1}B$
$X=A^{-1}B$

np.matmul(np.linalg.inv(A), B)
array([[1.],
       [1.]])


# 也可以使用dot方法，對于二維數(shù)組，dot就是執(zhí)行矩陣乘法
np.linalg.inv(A).dot(B)
array([[1.],
       [1.]])

即 $\left [\begin{array}{cccc} w \\ b \\ \end{array}\right] =\left [\begin{array}{cccc} 1 \\ 1 \\ \end{array}\right]$

除了手動創(chuàng)建矩陣并進行運算，NumPy庫還為我們提供了一種便捷的函數(shù)來求解類似于 $A*X^T=B$ 這樣的矩陣方程。通過使用這個函數(shù)，我們可以直接求解出參數(shù)向量X，從而避免了繁瑣的手動計算過程。這種方法既簡單又高效，極大地簡化了矩陣方程的求解過程。

np.linalg.solve(A, B)
array([[1.],
       [1.]])

2.向量求導(dǎo)運算

??鑒于在編程實踐中，矩陣和向量的使用相較于方程組形式更為普遍和高效，因此，包括最小二乘法在內(nèi)的多種優(yōu)化方法和算法的理論闡述，我們都將采用矩陣和向量作為基本的數(shù)據(jù)結(jié)構(gòu)進行概念說明和數(shù)學(xué)公式的推導(dǎo)。在深入探討最小二乘法的數(shù)學(xué)原理之前，我們有必要先補充一些關(guān)于向量求導(dǎo)的基礎(chǔ)知識，以便為后續(xù)的分析和計算打下堅實的理論基礎(chǔ)。

2.1 向量求導(dǎo)基本方法

??首先，我們先來探討相對簡單的向量求導(dǎo)方法。通過這一過程，我們可以深入理解對結(jié)構(gòu)化變量進行求導(dǎo)運算的本質(zhì)。這不僅是數(shù)學(xué)上的重要技巧，也是后續(xù)機器學(xué)習(xí)算法推導(dǎo)的基礎(chǔ)。
??假設(shè)我們有一個二元函數(shù)，具體形式如下：

$f(x_1,x_2) = 2x_1+x_2$

為了研究這個函數(shù)隨著 $x_1、x_2$ 的變化情況，我們可以分別對這兩個變量求偏導(dǎo)數(shù)。通過求偏導(dǎo)，我們可以得到函數(shù)在每個變量上的局部變化率。

假設(shè)現(xiàn)有一個二元函數(shù)如下：
$f(x_1,x_2) = 2x_1+x_2$
并且，我們可以分別對該函數(shù)中的兩個變量 $x_1、x_2$ 依次求偏導(dǎo)，可得：
$\frac{\partial f}{\partial x_1} = 2$
$\frac{\partial f}{\partial x_2} = 1$

現(xiàn)在我們考慮將上述求偏導(dǎo)的函數(shù)組改寫為矩陣形式。則根據(jù)前述內(nèi)容介紹，我們可以將函數(shù)中的兩個變量依次排列，組成一個向量變元，即一個由多個變量所組成的向量，即
$x = [x_1, x_2]^T$

此時，如果我們按照向量變元內(nèi)部的變量排列順序，依次在每個變量位置填上該變量對應(yīng)的偏導(dǎo)函數(shù)，則就構(gòu)成了對于函數(shù) $f$ 進行向量變元 $x$ 的向量求導(dǎo)的結(jié)果，即：
$\frac{\partial f(x)}{\partial x} = \left [\begin{array}{cccc} 2 \\ 1 \\ \end{array}\right]$

其中， $x$ 為向量變元。

??至此，我們已經(jīng)完成了向量求導(dǎo)的基本步驟。關(guān)鍵在于，我們按照向量變元中變量的排列順序，逐一計算并填寫了對應(yīng)變量的偏導(dǎo)函數(shù)結(jié)果。然而，為了與方程組的矩陣/向量形式保持一致，原始的函數(shù)方程同樣需要進行相應(yīng)的改寫。因此，原方程可以轉(zhuǎn)化為向量/矩陣形式，以便進行后續(xù)的矩陣運算和向量求導(dǎo)。
$A^T \cdot x$

其中， $A = [2, 1]^T$
$x = [x_1, x_2]^T$
原方程為
$y = 2x_1+x_2$

結(jié)合函數(shù)求導(dǎo)結(jié)果，我們不難發(fā)現(xiàn)， $\frac{\partial f(x)}{\partial x}$ 最終計算結(jié)果就是 $A$ ，即
$\frac{\partial f(x)}{\partial x} = \frac{\partial(A^T \cdot x)}{\partial x} = A$

在這里， $x$ 代表向量變元，而 $A$ 是一個列向量。值得注意的是，這個結(jié)論可以推廣到更一般的情況，我們將在下一小節(jié)給出相關(guān)的證明。為了便于理解和應(yīng)用，此處我們直接給出向量變元的函數(shù)求導(dǎo)計算公式。這個公式將幫助我們更高效地處理涉及向量變元的函數(shù)求導(dǎo)問題。

很多時候，我們并不嚴格區(qū)分向量方程和矩陣方程，而是將自變量為向量或矩陣的方程統(tǒng)稱為矩陣方程。同樣地，包含向量或矩陣的表達式也被我們統(tǒng)一稱為矩陣表達式。這樣的處理方式有助于我們更靈活地運用矩陣和向量的運算規(guī)則，從而簡化問題求解過程。

向量求導(dǎo)的定義法
設(shè) $f (x)$ 是一個關(guān)于 $x$ 的函數(shù)，其中 $x$ 是向量變元，并且 $x = [x_1, x_2,...,x_n]^T$

則 $\frac{\partial f}{\partial x} = [\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, ..., \frac{\partial f}{\partial x_n}]^T$

而該表達式也被稱為向量求導(dǎo)的梯度向量形式。
$\nabla _xf(x) = \frac{\partial f}{\partial x} = [\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, ..., \frac{\partial f}{\partial x_n}]^T$

通過求得函數(shù)的梯度向量求解向量導(dǎo)數(shù)的方法，也被稱為定義法求解。

值得注意的是，對于多元函數(shù)，我們總是可以計算出其梯度向量。然而，這個梯度向量或者說向量求導(dǎo)的結(jié)果，并不總是可以由一些已經(jīng)定義的向量直接表示出來。以 $A$ 為例，雖然它表示了 $f (x)$ 的向量求導(dǎo)結(jié)果，但并非所有情況下都能如此直接地找到這樣的向量表示。

2.2 常見向量求導(dǎo)公式

??在前期的學(xué)習(xí)中，數(shù)學(xué)理論推導(dǎo)經(jīng)常涉及到向量變元的求導(dǎo)。因此，除了掌握基本的向量求導(dǎo)方法，我們還需要推導(dǎo)幾個常用的向量求導(dǎo)公式。這些公式的特點是，向量求導(dǎo)的結(jié)果能夠通過一些已經(jīng)定義的向量進行簡潔的表示。在這里，我們假設(shè)x是一個包含n個變量的列向量，即 $x = [x_1, x_2,...,x_n]^T$ 。通過掌握這些公式，我們可以更高效地處理涉及向量變元的求導(dǎo)問題。

（1） $\frac{\partial a}{\partial x} = 0$
證明：
$\frac{\partial a}{\partial x} = [\frac{\partial a}{\partial x_1}, \frac{\partial a}{\partial x_2}, ..., \frac{\partial a}{\partial x_n}]^T = [0,0,...,0]^T$
（2）
$\frac{\partial(x^T \cdot A)}{\partial x} = \frac{\partial(A^T \cdot x)}{\partial x} = A$

證明：
??此時A為擁有n個分量的常數(shù)向量，設(shè) $A = [a_1, a_2,...,a_n]^T$ ，則有

$\begin{aligned} \frac{\partial(x^T \cdot A)}{\partial x} & = \frac{\partial(A^T \cdot x)}{\partial x}\\ & = \frac{\partial(a_1 \cdot x_1 + a_2 \cdot x_2 +...+ a_n \cdot x_n)}{\partial x}\\ & = \left [\begin{array}{cccc} \frac{\partial(a_1 \cdot x_1 + a_2 \cdot x_2 +...+ a_n \cdot x_n)}{\partial x_1} \\ \frac{\partial(a_1 \cdot x_1 + a_2 \cdot x_2 +...+ a_n \cdot x_n)}{\partial x_2} \\ . \\ . \\ . \\ \frac{\partial(a_1 \cdot x_1 + a_2 \cdot x_2 +...+ a_n \cdot x_n)}{\partial x_n} \\ \end{array}\right] \\ & =\left [\begin{array}{cccc} a_1 \\ a_2 \\ . \\ . \\ . \\ a_n \\ \end{array}\right] = A \end{aligned}$

（3）
$\frac{\partial (x^T \cdot x)}{\partial x} = 2x$
證明：
$\begin{aligned} \frac{\partial(x^T \cdot x)}{\partial x} & = \frac{\partial(x_1^2+x_2^2+...+x_n^2)}{\partial x}\\ & = \left [\begin{array}{cccc} \frac{\partial(x_1^2+x_2^2+...+x_n^2)}{\partial x_1} \\ \frac{\partial(x_1^2+x_2^2+...+x_n^2)}{\partial x_2} \\ . \\ . \\ . \\ \frac{\partial(x_1^2+x_2^2+...+x_n^2)}{\partial x_n} \\ \end{array}\right] \\ & =\left [\begin{array}{cccc} 2x_1 \\ 2x_2 \\ . \\ . \\ . \\ 2x_n \\ \end{array}\right] = 2x \end{aligned}$

此處 $x^Tx$ 也被稱為向量的交叉乘積(crossprod)。

??至此，我們已經(jīng)完成了相關(guān)向量求導(dǎo)常用公式的證明。然而，從上述證明過程可以看出，使用定義法進行公式證明往往相當(dāng)繁瑣（盡管整個流程相對清晰）。因此，我們會在后續(xù)補充除了定義法之外的向量乘法常用公式的證明方法。

??此外，矩陣的求導(dǎo)方法與向量類似。當(dāng)變量以矩陣形式出現(xiàn)時，我們實際上是在按照矩陣的基本結(jié)構(gòu)，在每個位置上對相應(yīng)的變量分量求偏導(dǎo)函數(shù)。但由于矩陣比向量多了一個維度，結(jié)構(gòu)更為復(fù)雜，因此求解過程也更為繁瑣。由于我們初期接觸的大多數(shù)是向量變元的方程，關(guān)于矩陣求導(dǎo)的常用公式推導(dǎo)，我們將在后續(xù)逐步展開討論。

??最后，我們還需要簡要辨析一下矩陣函數(shù)和矩陣方程這兩個概念的區(qū)別：文章來源地址http://www.zghlxwxcb.cn/news/detail-841885.html

矩陣方程：它指的是變量為矩陣的方程。
矩陣函數(shù)：它類似于函數(shù)矩陣，指的是自變量和因變量都是n階矩陣的函數(shù)。也可以簡單理解為由函數(shù)構(gòu)成的矩陣，其中每個函數(shù)的變量都是矩陣。
通過這些辨析，我們可以更清楚地理解這兩個概念在數(shù)學(xué)和機器學(xué)習(xí)中的應(yīng)用

到了這里，關(guān)于【機器學(xué)習(xí)-03】矩陣方程與向量求導(dǎo)方法的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

人工智能基礎(chǔ)_機器學(xué)習(xí)006_有監(jiān)督機器學(xué)習(xí)_正規(guī)方程的公式推導(dǎo)_最小二乘法_凸函數(shù)的判定---人工智能工作筆記0046
我們來看一下公式的推導(dǎo)這部分比較難一些, 首先要記住公式,這個公式,不用自己理解,知道怎么用就行, 比如這個(mA)T 這個轉(zhuǎn)置的關(guān)系要知道然后我們看這個符號就是求X的導(dǎo)數(shù),X導(dǎo)數(shù)的轉(zhuǎn)置除以X的導(dǎo)數(shù),就得到單位矩陣, 可以看到下面也是,各種X的導(dǎo)數(shù),然后計算,得到對應(yīng)的矩陣
2024年02月08日
瀏覽(98)
【數(shù)值計算方法（黃明游）】解線性代數(shù)方程組的迭代法（一）：向量、矩陣范數(shù)與譜半徑【理論到程序】
?? 注意：速讀可直接跳轉(zhuǎn)至“4、知識點總結(jié)”及“5、計算例題”部分 ??當(dāng)涉及到線性代數(shù)和矩陣理論時，向量、矩陣范數(shù)以及譜半徑是非常重要的概念，下面將詳細介紹這些內(nèi)容： a. 定義及性質(zhì) ??考慮一個 n n n 維向量 x x x ，定義一個實值函數(shù) N ( x ) N(x) N ( x ) ，
2024年01月25日
瀏覽(27)
機器學(xué)習(xí) -- 矩陣和向量
在之前的knn算法和余弦算法等算法中，都有很重要的概念，叫做矩陣和向量。這個是機器學(xué)習(xí)中很重要的概念。今天來深入學(xué)習(xí)一些矩陣和向量的一些知識。向量是一個有序的數(shù)字列表，可以在幾何中表示為從原點出發(fā)的箭頭。在機器學(xué)習(xí)中，向量通常用于表示數(shù)據(jù)點或特征
2024年02月21日
瀏覽(21)
機器學(xué)習(xí)——線性代數(shù)中矩陣和向量的基本介紹
矩陣的基本概念（這里不多說，應(yīng)該都知道）而向量就是一個特殊的矩陣，即向量只有一列，是個n*1的矩陣注：一般矩陣用大寫字母表示，向量用小寫字母表示先從簡單開始，即一個矩陣和一個向量相乘的運算矩陣相乘的結(jié)果的維度為 m*k 矩陣乘法滿足結(jié)合律不滿足交換律
2024年02月21日
瀏覽(22)
矩陣、向量組與線性方程專題
1、什么是矩陣的行滿秩和列滿秩，和矩陣的秩之間的關(guān)系是什么？ ? 在線性代數(shù)中，矩陣的行滿秩和列滿秩是兩個重要的概念。一個n $times $ m 的矩陣A， ? 若其行向量線性無關(guān)，則稱A為行滿秩； ? 若其列向量線性無關(guān)，則稱A為列滿秩。 ? 而矩陣的秩代表的是其行向量
2024年02月03日
瀏覽(15)
【機器學(xué)習(xí)線性代數(shù)】03 再論矩陣：空間映射關(guān)系的描述
目錄 1.利用矩陣表示空間映射 2.矮胖矩陣對空間的降維壓縮 2.1.空間降維的原理 2.2.實
2024年03月13日
瀏覽(21)
動手學(xué)深度學(xué)習(xí)——矩陣求導(dǎo)之矩陣的跡和微分
目錄一、矩陣的跡 1. 跡的定義 2. 跡的性質(zhì) 二、微分與全微分 1. （全）微分的表達式 2. （全）微分的法則三、?矩陣的微分 1. 矩陣微分的實質(zhì) 2. 矩陣微分的意義 3. 矩陣微分的法則 4. 矩陣微分的常用公式四、矩陣求導(dǎo)實例 1. 跡在微分中的應(yīng)用 2. 利用微分求導(dǎo) 本篇博客總
2024年02月05日
瀏覽(27)
【考研數(shù)學(xué)】矩陣、向量與線性方程組解的關(guān)系梳理與討論
兩個原因讓我想寫這篇文章，一是做矩陣題目的時候就發(fā)現(xiàn)這三貨經(jīng)常綁在一起，讓人想去探尋其中奧秘；另一就是今天學(xué)了向量組的秩，讓我想起來了之前遺留下來的一個問題：到底存不存在系數(shù)矩陣的秩和增廣矩陣的秩之差比 1 大的情況？可能這個問題有點抽象，不過看
2024年02月11日
瀏覽(19)
【證明】對稱矩陣特征方程k重根恰有k個線性無關(guān)的特征向量
前置定理 1 設(shè) A boldsymbol{A} A 為 n n n 階對稱矩陣，則必有正交矩陣 P boldsymbol{P} P ，使 P ? 1 A P = P T A P = Λ boldsymbol{P}^{-1} boldsymbol{A} boldsymbol{P} = boldsymbol{P}^T boldsymbol{A} boldsymbol{P} = boldsymbol{Lambda} P ? 1 A P = P T A P = Λ ，其中 Λ boldsymbol{Lambda} Λ 是以 A boldsymbol{A} A 為 n n
2024年02月15日
瀏覽(18)
人工智能_機器學(xué)習(xí)065_SVM支持向量機KKT條件_深度理解KKT條件下的損失函數(shù)求解過程_公式詳細推導(dǎo)_---人工智能工作筆記0105
之前我們已經(jīng)說了KKT條件,其實就是用來解決如何實現(xiàn)對,不等式條件下的,目標函數(shù)的求解問題,之前我們說的拉格朗日乘數(shù)法,是用來對等式條件下的目標函數(shù)進行求解. KKT條件是這樣做的,添加了一個阿爾法平方對吧,這個阿爾法平方肯定是大于0的,那么可以結(jié)合下面的文章去
2024年02月04日
瀏覽(26)

<ul id="rok0p"></ul>

<abbr id="rok0p"><track id="rok0p"><dfn id="rok0p"></dfn></track></abbr>

<form id="rok0p"><p id="rok0p"></p></form>

<style id="rok0p"></style>