国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

機器學(xué)習(xí)&&深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN

2年前作者：布布要成為最負責的男人分類：Toy博客閱讀(25)違法舉報

這篇具有很好參考價值的文章主要介紹了機器學(xué)習(xí)&&深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

?????作者簡介：一位即將上大四，正專攻機器學(xué)習(xí)的保研er
??上期文章：機器學(xué)習(xí)&&深度學(xué)習(xí)—語言模型和數(shù)據(jù)集
??訂閱專欄：機器學(xué)習(xí)&&深度學(xué)習(xí)
希望文章對你們有所幫助

引入

在之前介紹了n元語法模型，其中單詞xt在時間步t的概率僅取決于前n-1個單詞。對于時間步t-(n-1)之前的打你，若我們想將其可能產(chǎn)生的影響合并到xt上，需要增加n，模型參數(shù)的數(shù)量也會指數(shù)增長，因為詞表V需要存儲|V|ⁿ個數(shù)字，因此我們不如使用隱變量：
$P(x_t|x_{t-1},...,x_1)≈P(x_t|h_{t-1})$
其中h表示隱藏變量，存儲到時間步t-1的序列信息。
$h_t=f(x_t,h_{t-1})$
值得注意的是，隱藏層和隱狀態(tài)指的是兩個截然不同的概念。如上所述，隱藏層是在從輸入到輸出的路徑上（以觀測角度來理解）的隱藏的層，而隱狀態(tài)則是在給定步驟所做的任何事情（以技術(shù)角度來定義）的輸入，并且這些狀態(tài)只能通過先前時間步的數(shù)據(jù)來計算。
RNN是具有隱狀態(tài)的神經(jīng)網(wǎng)絡(luò)

無隱狀態(tài)的神經(jīng)網(wǎng)絡(luò)

對于只有單隱藏層的多層感知機，其隱藏層輸出為：
$H=φ(XW_{xh}+b_h)$
將隱藏變量H用作輸出層的輸入，則其輸出層為：
$O=HW_{hq}+b_q$

有隱狀態(tài)的循環(huán)神經(jīng)網(wǎng)絡(luò)

有了隱狀態(tài)后，情況就完全不同了。與多層感知機不同的是，我們在這里保存了前一個時間步的隱藏變量：
$H_{t-1}$
并引入了一個新的權(quán)重參數(shù)：
$W_{hh}$
用來描述如何在當前時間步中使用前一個時間步的隱藏變量。
而當前時間步隱藏變量由當前時間步的輸入與前一個時間步的隱藏變量一起計算得出：
$H_t=φ(X_tW_{xh}+H_{t-1}W_{hh}+b_h)$
這些變量捕獲并保留了序列直到其當前時間步的歷史信息，就如當前時間步下神經(jīng)網(wǎng)絡(luò)的狀態(tài)或記憶，因此這樣的隱藏變量被稱為隱狀態(tài)。
由于隱狀態(tài)使用的定義與前一個時間步中使用的定義相同，因此上式是循環(huán)的，基于上式的網(wǎng)絡(luò)就稱為循環(huán)神經(jīng)網(wǎng)絡(luò)RNN，執(zhí)行上式的層就叫做循環(huán)層。
對于時間步t，輸出層的輸出類似于多層感知機：
$O_t=H_tW_{hq}+b_q$
值得一提的是，即使在不同的時間步，循環(huán)神經(jīng)網(wǎng)絡(luò)也總是使用這些模型參數(shù)。因此，循環(huán)神經(jīng)網(wǎng)絡(luò)的參數(shù)開銷不會隨著時間步的增加而增加。
下面展示了RNN計算邏輯：
機器學(xué)習(xí)&&深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,機器學(xué)習(xí)&&深度學(xué)習(xí),機器學(xué)習(xí),深度學(xué)習(xí),rnn,人工智能
在任意時間步，隱狀態(tài)的計算可以被視為：
1、拼接當前時間步t的輸入和前一時間步t-1的隱狀態(tài)
2、將拼接結(jié)果送入帶有激活函數(shù)的全連接層，全連接層的輸出是當前時間步t的隱狀態(tài)

具有循環(huán)神經(jīng)網(wǎng)絡(luò)的字符級語言模型

設(shè)小批量大小為1，批量中的文本序列為“machine”。使用字符級語言模型，將文本次元化為字符而不是單詞，如下圖演示，使用當前的和先前的字符預(yù)測下一個字符：
機器學(xué)習(xí)&&深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,機器學(xué)習(xí)&&深度學(xué)習(xí),機器學(xué)習(xí),深度學(xué)習(xí),rnn,人工智能
在訓(xùn)練過程中，我們對每個時間步的輸出層的輸出進行softmax操作，然后利用交叉熵損失計算模型輸出和標簽之間的誤差。
在實踐中，我們使用的批量大小是n＞1，每個詞元都由一個d維向量表示，因此，我們在時間步t的輸入是一個n×d的矩陣。

困惑度

讓我們討論如何度量語言模型的質(zhì)量，這將在后續(xù)部分中用于評估基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型。
我們可以通過一個序列中所有的n個詞元的交叉熵損失的平均值來衡量：
$\frac{1}{n}\sum_{t=1}^n-logP(x_t|x_{t-1},...,x_1)$
其中，P由語言模型給出，xt是在時間步t從該序列中觀察到的實際詞元。
而我們使用的是困惑度，是一個指數(shù)：
$exp(-\frac{1}{n}\sum_{t=1}^nlogP(x_t|x_{t-1},...,x_1))$
困惑度的最好的理解是“下一個詞元的實際選擇數(shù)的調(diào)和平均數(shù)”。
在接下來，我們將基于循環(huán)神經(jīng)網(wǎng)絡(luò)實現(xiàn)字符級語言模型，并使用困惑度來評估這樣的模型。

小結(jié)

1、對隱狀態(tài)使用循環(huán)計算的神經(jīng)網(wǎng)絡(luò)稱為循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）
2、循環(huán)神經(jīng)網(wǎng)絡(luò)的隱狀態(tài)可以捕獲直到當前時間步序列的歷史信息
3、循環(huán)神經(jīng)網(wǎng)絡(luò)模型的參數(shù)數(shù)量不會隨著時間步的增加而增加
4、我們可以使用循環(huán)神經(jīng)網(wǎng)絡(luò)創(chuàng)建字符級語言模型
5、我們可以使用困惑度來評價語言模型的質(zhì)量文章來源地址http://www.zghlxwxcb.cn/news/detail-642831.html

到了這里，關(guān)于機器學(xué)習(xí)&&深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

深度學(xué)習(xí)實戰(zhàn)——循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN、LSTM、GRU）
???? ? 憶如完整項目/代碼詳見github： https://github.com/yiru1225 （轉(zhuǎn)載標明出處勿白嫖 star for projects thanks）目錄系列文章目錄一、實驗綜述 1.實驗工具及內(nèi)容 2.實驗數(shù)據(jù) 3.實驗?zāi)繕?4.實驗步驟二、循環(huán)神經(jīng)網(wǎng)絡(luò)綜述 1.循環(huán)神經(jīng)網(wǎng)絡(luò)簡介 1.1 循環(huán)神經(jīng)網(wǎng)絡(luò)背景 1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2023年04月24日
瀏覽(17)
深度學(xué)習(xí)4. 循環(huán)神經(jīng)網(wǎng)絡(luò) – Recurrent Neural Network | RNN
目錄循環(huán)神經(jīng)網(wǎng)絡(luò) – Recurrent Neural Network | RNN 為什么需要 RNN ？獨特價值是什么？ RNN 的基本原理 RNN 的優(yōu)化算法 RNN 到 LSTM – 長短期記憶網(wǎng)絡(luò) 從 LSTM 到 GRU RNN 的應(yīng)用和使用場景總結(jié) 百度百科+維基百科卷積神經(jīng)網(wǎng)絡(luò)和普通的算法大部分都是輸入和輸出的一一對應(yīng)，也就是一
2024年02月11日
瀏覽(54)
深度學(xué)習(xí)-循環(huán)神經(jīng)網(wǎng)絡(luò)-RNN實現(xiàn)股價預(yù)測-LSTM自動生成文本
基于文本內(nèi)容及其前后信息進行預(yù)測基于目標不同時刻狀態(tài)進行預(yù)測基于數(shù)據(jù)歷史信息進行預(yù)測序列模型：輸入或者輸出中包含有序列數(shù)據(jù)的模型突出數(shù)據(jù)的前后序列關(guān)系兩大特點：輸入（輸出）元素之間是具有順序關(guān)系。不同的順序，得到的結(jié)果應(yīng)該是不同的，比如“
2024年01月24日
瀏覽(61)
【深度學(xué)習(xí)】——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN及實例氣溫預(yù)測、單層lstm股票預(yù)測
? ? ? ?密集連接網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)都有主要的特點，那就是它們沒有記憶。它們單獨處理每個輸入，在輸入和輸入之間沒有保存任何狀態(tài)。舉個例子：當你在閱讀一個句子的時候，你需要記住之前的內(nèi)容，我們才能動態(tài)的了解這個句子想表達的含義。生物智能已漸進的方
2023年04月24日
瀏覽(29)
【深度學(xué)習(xí)筆記】6_2 循環(huán)神經(jīng)網(wǎng)絡(luò)RNN（recurrent neural network）
注：本文為《動手學(xué)深度學(xué)習(xí)》開源內(nèi)容，部分標注了個人理解，僅為個人學(xué)習(xí)記錄，無抄襲搬運意圖上一節(jié)介紹的 n n n 元語法中，時間步 t t t 的詞 w t w_t w t ? 基于前面所有詞的條件概率只考慮了最近時間步的 n ? 1 n-1 n ? 1 個詞。如果要考慮比 t ? ( n ? 1 ) t-(n-1) t ?
2024年03月12日
瀏覽(22)
【算法小記】深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)相關(guān)原理與RNN、LSTM算法的使用
文中程序以Tensorflow-2.6.0為例部分概念包含筆者個人理解，如有遺漏或錯誤，歡迎評論或私信指正。卷積神經(jīng)網(wǎng)絡(luò)在圖像領(lǐng)域取得了良好的效果，卷積核憑借優(yōu)秀的特征提取能力通過深層的卷積操作可是實現(xiàn)對矩形張量的復(fù)雜計算處理。但是生活中除了圖像這樣天然以矩陣形
2024年01月25日
瀏覽(21)
Python深度學(xué)習(xí)026：基于Pytorch的典型循環(huán)神經(jīng)網(wǎng)絡(luò)模型RNN、LSTM、GRU的公式及簡潔案例實現(xiàn)（官方）
循環(huán)神經(jīng)網(wǎng)絡(luò)（也有翻譯為遞歸神經(jīng)網(wǎng)絡(luò)）最典型的三種網(wǎng)絡(luò)結(jié)構(gòu)是： RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)） LSTM（Long Short-Term Memory，長短期記憶網(wǎng)絡(luò)） GRU（Gate Recurrent Unit，門控循環(huán)單元）理解參數(shù)的含義非常重要，否則，你不知道準備什么維度的輸入數(shù)據(jù)送入模型先
2023年04月22日
瀏覽(25)
人工智能：CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、DNN(深度神經(jīng)網(wǎng)絡(luò))的知識梳理
卷積神經(jīng)網(wǎng)絡(luò)（CNN），也被稱為ConvNets或Convolutional Neural Networks，是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)架構(gòu)，主要用于處理和分析具有網(wǎng)格狀結(jié)構(gòu)的數(shù)據(jù)，特別是圖像和視頻數(shù)據(jù)。CNN 在計算機視覺任務(wù)中表現(xiàn)出色，因為它們能夠有效地捕獲和識別圖像中的特征，具有平移不變性（transla
2024年02月05日
瀏覽(41)
Pytorch 對比TensorFlow 學(xué)習(xí)：Day 17-18: 循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和LSTM
Day 17-18: 循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和LSTM 在這兩天的學(xué)習(xí)中，我專注于理解循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和長短期記憶網(wǎng)絡(luò)（LSTM）的基本概念，并學(xué)習(xí)了它們在處理序列數(shù)據(jù)時的應(yīng)用。 1.RNN和LSTM基礎(chǔ)： RNN：了解了RNN是如何處理序列數(shù)據(jù)的，特別是它的循環(huán)結(jié)構(gòu)可以用于處理時間序列或連續(xù)
2024年01月20日
瀏覽(20)
深度學(xué)習(xí)循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network，RNN）是一種廣泛應(yīng)用于序列數(shù)據(jù)、自然語言處理等領(lǐng)域的神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)不同，循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入不僅取決于當前輸入，還取決于之前的狀態(tài)。這使得循環(huán)神經(jīng)網(wǎng)絡(luò)可以對序列數(shù)據(jù)進行建模，具有記憶和遞歸的能力。
2024年02月13日
瀏覽(19)