国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò)

2年前作者：巖塘分類：Toy博客閱讀(24)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

RNN(Recurrent?Neural?Network)，中文稱作循環(huán)神經(jīng)網(wǎng)絡(luò)，它一般以序列數(shù)據(jù)為輸入，通過網(wǎng)絡(luò)內(nèi)部的結(jié)構(gòu)設(shè)計(jì)有效捕捉序列之間的關(guān)系特征，一般也是以序列形式進(jìn)行輸出。

因?yàn)镽NN結(jié)構(gòu)能夠很好利用序列之間的關(guān)系，因此針對(duì)自然界具有連續(xù)性的輸入序列，如人類的語言，語音等進(jìn)行很好的處理，廣泛應(yīng)用于NLP領(lǐng)域的各項(xiàng)任務(wù)，如文本分類，情感分析，意圖識(shí)別，機(jī)器翻譯等．

RNN模型的分類：

這里我們將從兩個(gè)角度對(duì)RNN模型進(jìn)行分類．第一個(gè)角度是輸入和輸出的結(jié)構(gòu)，第二個(gè)角度是RNN的內(nèi)部構(gòu)造．

按照輸入和輸出的結(jié)構(gòu)進(jìn)行分類：

N vs N-RNN

它是RNN最基礎(chǔ)的結(jié)構(gòu)形式，最大的特點(diǎn)就是：輸入和輸出序列是等長(zhǎng)的．由于這個(gè)限制的存在，使其適用范圍比較小，可用于生成等長(zhǎng)度的合轍詩句．
【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python

N vs 1-RNN

有時(shí)候我們要處理的問題輸入是一個(gè)序列，而要求輸出是一個(gè)單獨(dú)的值而不是序列，要在最后一個(gè)隱層輸出h上進(jìn)行線性變換。

大部分情況下，為了更好的明確結(jié)果，還要使用sigmoid或者softmax進(jìn)行處理．這種結(jié)構(gòu)經(jīng)常被應(yīng)用在文本分類問題上．

1?vs?N-RNN

我們最常采用的一種方式就是使該輸入作用于每次的輸出之上．這種結(jié)構(gòu)可用于將圖片生成文字任務(wù)等．【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python

N vs?M-RNN

這是一種不限輸入輸出長(zhǎng)度的RNN結(jié)構(gòu)，它由編碼器和解碼器兩部分組成，兩者的內(nèi)部結(jié)構(gòu)都是某類RNN，它也被稱為seq2seq架構(gòu)。

輸入數(shù)據(jù)首先通過編碼器，最終輸出一個(gè)隱含變量c，之后最常用的做法是使用這個(gè)隱含變量c作用在解碼器進(jìn)行解碼的每一步上，以保證輸入信息被有效利用。【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python

按照RNN的內(nèi)部構(gòu)造進(jìn)行分類：

傳統(tǒng)RNN

【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python

內(nèi)部計(jì)算函數(shù)

【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python

tanh的作用：?用于幫助調(diào)節(jié)流經(jīng)網(wǎng)絡(luò)的值，tanh函數(shù)將值壓縮在﹣1和1之間。

傳統(tǒng)RNN的優(yōu)勢(shì)：
由于內(nèi)部結(jié)構(gòu)簡(jiǎn)單，對(duì)計(jì)算資源要求低，相比之后我們要學(xué)習(xí)的RNN變體：LSTM和GRU模型參數(shù)總量少了很多，在短序列任務(wù)上性能和效果都表現(xiàn)優(yōu)異。

傳統(tǒng)rnn的缺點(diǎn)：
傳統(tǒng)RNN在解決長(zhǎng)序列之間的關(guān)聯(lián)時(shí)，通過實(shí)踐，證明經(jīng)典RNN表現(xiàn)很差，原因是在進(jìn)行反向傳播的時(shí)候，過長(zhǎng)的序列導(dǎo)致梯度的計(jì)算異常，發(fā)生梯度消失或爆炸。

LSTM

LSTM?(Long?Short-Term?Memory）也稱長(zhǎng)短時(shí)記憶結(jié)構(gòu)，它是傳統(tǒng)RNN的變體，與經(jīng)典RNN相比能夠有效捕捉長(zhǎng)序列之間的語義關(guān)聯(lián)，緩解梯度消失或爆炸現(xiàn)象，同時(shí)LSTM的結(jié)構(gòu)更復(fù)雜。

LSTM缺點(diǎn)：由于內(nèi)部結(jié)構(gòu)相對(duì)較復(fù)雜，因此訓(xùn)練效率在同等算力下較傳統(tǒng)RNN低很多．

LSTM優(yōu)勢(shì)：LSTM的門結(jié)構(gòu)能夠有效減緩長(zhǎng)序列問題中可能出現(xiàn)的梯度消失或爆炸，雖然并不能杜絕這種現(xiàn)象，但在更長(zhǎng)的序列問題上表現(xiàn)優(yōu)于傳統(tǒng)RNN.

?

【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python 它的核心結(jié)構(gòu)可以分為四個(gè)部分去解析：

遺忘門

與傳統(tǒng)RNN的內(nèi)部結(jié)構(gòu)計(jì)算非常相似，首先將當(dāng)前時(shí)間步輸入x(t）與上一個(gè)時(shí)間步隱含狀態(tài)h(t-1）拼接，?得到［x(t),?h(t-1)]，然后通過一個(gè)全連接層做變換，最后通過sigmoid函數(shù)（變化到【0，1】）進(jìn)行激活得到f(t)，我們可以將f(t）看作是門值，好比一扇門開合的大小程度，門值都將作用在通過該扇門的張量，遺忘門門值將作用的上一層的細(xì)胞狀態(tài)上，代表遺忘過去的多少信息，又因?yàn)檫z忘門門值是由x(t),?h(t-1）計(jì)算得來的，因此整個(gè)公式意味著根據(jù)當(dāng)前時(shí)間步輸入和上一個(gè)時(shí)間步隱含狀態(tài)h(t-1）來決定遺忘多少上一層的細(xì)胞狀態(tài)所攜帶的過往信息．

輸入門

輸入門的計(jì)算公式有兩個(gè)，第一個(gè)就是產(chǎn)生輸入門門值的公式，它和遺忘門公式幾乎相同，區(qū)別只是在于它們之后要作用的目標(biāo)上，這個(gè)公式意味著輸入信息有多少需要進(jìn)行過濾．輸入門的第二個(gè)公式是與傳統(tǒng)RNN的內(nèi)部結(jié)構(gòu)計(jì)算相同．對(duì)于LSTM來講，它得到的是當(dāng)前的細(xì)胞狀態(tài)，而不是像經(jīng)典RNN一樣得到的是隱含狀態(tài)．

細(xì)胞狀態(tài)

我們看到輸入門的計(jì)算公式有兩個(gè)，第一個(gè)就是產(chǎn)生輸入門門值的公式，它和遺忘門公式幾乎相同，區(qū)別只是在于它們之后要作用的目標(biāo)上．這個(gè)公式意味著輸入信息有多少需要進(jìn)行過濾．輸入門的第二個(gè)公式是與傳統(tǒng)RNN的內(nèi)部結(jié)構(gòu)計(jì)算相同．對(duì)于LSTM來講，它得到的是當(dāng)前的細(xì)胞狀態(tài)，而不是像經(jīng)典RNN一樣得到的是隱含狀態(tài)。

輸出門

輸出門部分的公式也是兩個(gè)，第一個(gè)即是計(jì)算輸出門的門值，它和遺忘門，輸入門計(jì)算方式相同．第二個(gè)即是使用這個(gè)門值產(chǎn)生隱含狀態(tài)h(t)，他將作用在更新后的細(xì)胞狀態(tài)C(t）上，并做tanh激活，最終得到h(t）作為下一時(shí)間步輸入的一部分．整個(gè)輸出門的程，就是為了產(chǎn)生隱含狀態(tài)h(t)。

Bi-LSTM

Bi-LSTM即雙向LSTM，它沒有改變LSTM本身任何的內(nèi)部結(jié)構(gòu)，只是將LSTM應(yīng)用兩次且方向不同，再將兩次得到的LSTM結(jié)果進(jìn)行拼接作為最終輸出

GRU

GRU(Gated?Recurrent?Unit）也稱門控循環(huán)單元結(jié)構(gòu)，它也是傳統(tǒng)RNN的變體，同LSTM一樣能夠有效捕捉長(zhǎng)序列之間的語義關(guān)聯(lián)，緩解梯度消失或爆炸現(xiàn)象．同時(shí)它的結(jié)構(gòu)和計(jì)算要比LSTM?更簡(jiǎn)單。

GRU的優(yōu)勢(shì)：GRU和LSTM作用相同，在捕捉長(zhǎng)序列語義關(guān)聯(lián)時(shí)，能有效抑制梯度消失或爆炸，效果都優(yōu)于傳統(tǒng)rnn且計(jì)算復(fù)雜度相比lstm要小．

GRU的缺點(diǎn)：GRU仍然不能完全解決梯度消失問題，同時(shí)其作用RNN的變體，有著RNN結(jié)構(gòu)本身的一大弊端，即不可并行計(jì)算，這在數(shù)據(jù)量和模型體量逐步增大的未來，是RNN發(fā)展的關(guān)鍵瓶頸【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò),自然語言處理,機(jī)器學(xué)習(xí),python

它的核心結(jié)構(gòu)可以分為兩個(gè)部分去解析：

更新門?

重置門

Bi-GRU

Bi-GRU與Bi-LSTM的邏輯相同，都是不改變其內(nèi)部結(jié)構(gòu)，而是將模型應(yīng)用兩次且方向不同，再將兩次得到的LSTM結(jié)果進(jìn)行拼接作為最終輸出．具體參見上小節(jié)中的Bi-LSTM。

注意力機(jī)制

注意力機(jī)制是注意力計(jì)算規(guī)則能夠應(yīng)用的深度學(xué)習(xí)網(wǎng)絡(luò)的載體，同時(shí)包括一些必要的全連接層以及相關(guān)張量處理，使其與應(yīng)用網(wǎng)絡(luò)融為一體．使自注意力計(jì)算規(guī)則的注意力機(jī)制稱為自注意力機(jī)制．

注意力計(jì)算規(guī)則

它需要三個(gè)指定的輸入Q(query),?K(key),?V(value),?然后通過計(jì)算公式得到注意力的結(jié)果，這個(gè)結(jié)果代表query在key和value作用下的注意力表示．當(dāng)輸入的Q=K=V時(shí)，稱作自注意力計(jì)算規(guī)則．

注意力機(jī)制的作用

在解碼器端的注意力機(jī)制：?能夠根據(jù)模型目標(biāo)有效的聚焦編碼器的輸出結(jié)果，當(dāng)其作為解碼器的輸入時(shí)提升效果，改善以往編碼器輸出是單一定長(zhǎng)張量，無法存儲(chǔ)過多信息的情況．

在編碼器端的注意力機(jī)制：主要解決表征問題，相當(dāng)于特征提取過程，得到輸入的注意力表示．一般使用自注意力（self-attention).

注意力機(jī)制實(shí)現(xiàn)步驟

第一步：根據(jù)注意力計(jì)算規(guī)則，對(duì)Q,K,V進(jìn)行相應(yīng)的計(jì)算．

第二步：根據(jù)第一步采用的計(jì)算方法，如果是拼接方法，則需要將Q與第二步的計(jì)算結(jié)果再進(jìn)行拼接，如果是轉(zhuǎn)置點(diǎn)積，一般是自注意力，Q與V相同，則不需要進(jìn)行與Q的拼接．

第三步：最后為了使整個(gè)attention機(jī)制按照指定尺寸輸出，使用線性層作用在第二步的結(jié)果上做一個(gè)線性變換，得到最終對(duì)Q的注意力表示．

代碼實(shí)現(xiàn)

傳統(tǒng)模型

import torch
import torch.nn as nn

"""
nn.RNN類初始化主要參數(shù)解釋
input_size：輸入張量x中特征維度的大小
hidden_size：隱層張量h中特征維度的大小
num_layers: 隱含層的數(shù)量．
nonlinearity: 激活函數(shù)的選擇，默認(rèn)是tanh.
"""
rnn=nn.RNN(input_size=5,hidden_size=6,num_layers=1)

"""
設(shè)定輸入的張量x
第一個(gè)參數(shù)：sequence_length（輸入序列的長(zhǎng)度）
第二個(gè)參數(shù)：batch_size（批次的樣本數(shù)）
第三個(gè)參數(shù)：input_size（輸入張量x的維度）
"""
input=torch.randn(1,3,5)
"""
設(shè)定初始化的h0
第一個(gè)參數(shù)：num_layers *num_directions（層數(shù)＊網(wǎng)絡(luò)方向數(shù)）
第二個(gè)參數(shù)：batch_size（批次的樣本數(shù)）
第三個(gè)參數(shù)：hiddeh_size（隱藏層的維度）
"""
h0=torch.randn(1,3,6)

"""
nn.RNN類實(shí)例化對(duì)象主要參數(shù)解釋
input: 輸入張量x
h0：初始化的隱層張量h
"""
output,hn=rnn(input,h0)

# 傳統(tǒng)RNN
class RNN(nn.Module):
    def __init__(self,input_size,hidden_size,output_size,num_layers=1):
        """
        input_size:代表輸入張量x中最后一個(gè)維度
        hidden_size: 代表隱藏層張量的最后一個(gè)維度
        output_size: 代表線性層最后的輸出維度
        num_layers:代表RNN網(wǎng)絡(luò)的層數(shù)
        """
        
        super(RNN,self).__init__()
        self.input_size=input_size
        self.hidden_size=hidden_size
        self.output_size=output_size
        self.num_layers=num_layers
        self.rnn=nn.RNN(input_size,hidden_size,num_layers)
        
        # 全連接線性層
        self.linear=nn.linear(hidden_size,output_size)
        # 預(yù)定義的softmax層
        self.softmax=nn.LogSoftmax(dim=-1)
        
    def forward(self,input1,hidden):
        input1=input1.unsqueeze(0)
        rr,hn=self.rnn(input1,hidden)
        return self.softmax(self.linear(rr)),hn
    
    def init_hidden(self):
        """初始化全零的隱藏層張量"""
        return torch.zeros(self.num_layers,1,self.hidden_size)

?

LSTM模型

import torch
import torch.nn as nn

"""
nn.LSTM類初始化主要參數(shù)解釋：
input_size: 輸入張量x中特征維度的大?。?hidden_size: 隱層張量h中特征維度的大?。?num_layers: 隱含層的數(shù)量．
bidirectional: 是否選擇使用雙向LSTM，如果為True，則使用；默認(rèn)不使用．
"""
rnn=nn.LSTM(input_size=5,hidden_size=6,num_layers=2)

"""
設(shè)定輸入的張量x
第一個(gè)參數(shù)：sequence_length（輸入序列的長(zhǎng)度）
第二個(gè)參數(shù)：batch_size（批次的樣本數(shù)）
第三個(gè)參數(shù)：input_size（輸入張量x的維度）
"""
input=torch.randn(1,3,5)
"""
設(shè)定初始化的h0,c0
第一個(gè)參數(shù)：num_layers *num_directions（層數(shù)＊網(wǎng)絡(luò)方向數(shù)）
第二個(gè)參數(shù)：batch_size（批次的樣本數(shù)）
第三個(gè)參數(shù)：hiddeh_size（隱藏層的維度）
"""
h0=torch.randn(2,3,6)
c0=torch.randn(2,3,6)

"""
nn.LSTM類實(shí)例化對(duì)象主要參數(shù)解釋
input: 輸入張量x
h0:初始化的隱層張量h.
cO:初始化的細(xì)胞狀態(tài)張量c.
"""
output,(hn,cn)=rnn(input,(h0,c0))

# LSTM型RNN
class LSTM(nn.Module):
    def __init__(self,input_size,hidden_size,output_size,num_layers=1):
        """
        input_size:代表輸入張量x中最后一個(gè)維度
        hidden_size: 代表隱藏層張量的最后一個(gè)維度
        output_size: 代表線性層最后的輸出維度
        num_layers:代表RNN網(wǎng)絡(luò)的層數(shù)
        """
        super(LSTM,self).__init__()
        self.input_size=input_size
        self.hidden_size=hidden_size
        self.output_size=output_size
        self.num_layers=num_layers
        self.lstm=nn.LSTM(input_size,hidden_size,num_layers)
        # 全連接線性層
        self.linear=nn.linear(hidden_size,output_size)
        # 預(yù)定義的softmax層
        self.softmax=nn.LogSoftmax(dim=-1)
        
    def forward(self,input1,hidden,c):
        input1=input1.unsqueeze(0)
        rr,(hn,cn)=self.lstm(input1,(hidden,c))
        return self.softmax(self.linear(hn)),hn,cn
    
    def init_hidden_and_c(self):
        c=hidden=torch=torch.zeros(self.num_layers,1,self.hidden_size)
        return hidden,c

?

GRU模型

import torch
import torch.nn as nn

"""
nn.GRU類初始化主要參數(shù)解釋
Input_size: 輸入張量x中特征維度的大小
hidden_size:隱層張量h中特征維度的大小
num_layers:隱含層的數(shù)量
bidirectional: 是否選擇使用雙向LSTM，如果為True，則使用；默認(rèn)不使用
"""
rnn=nn.GRU(input_size=5,hidden_size=6,num_layers=2)

"""
設(shè)定輸入的張量x
第一個(gè)參數(shù)：sequence_length（輸入序列的長(zhǎng)度）
第二個(gè)參數(shù)：batch_size（批次的樣本數(shù)）
第三個(gè)參數(shù)：input_size（輸入張量x的維度）
"""
input=torch.randn(1,3,5)
"""
設(shè)定初始化的h0
第一個(gè)參數(shù)：num_layers *num_directions（層數(shù)＊網(wǎng)絡(luò)方向數(shù)）
第二個(gè)參數(shù)：batch_size（批次的樣本數(shù)）
第三個(gè)參數(shù)：hiddeh_size（隱藏層的維度）
"""
h0=torch.randn(2,3,6)

"""
nn.GRU類實(shí)例化對(duì)象主要參數(shù)解釋
input: 輸入張量x.
h0:初始化的隱層張量h.
"""
output,hn=rnn(input,h0)

# GRU模型
class GRU(nn.Module):
    def __init__(self,input_size,hidden_size,output_size,num_layers=1):
        """
        input_size:代表輸入張量x中最后一個(gè)維度
        hidden_size: 代表隱藏層張量的最后一個(gè)維度
        output_size: 代表線性層最后的輸出維度
        num_layers:代表RNN網(wǎng)絡(luò)的層數(shù)
        """
        super(GRU,self).__init__()
        self.input_size=input_size
        self.hidden_size=hidden_size
        self.output_size=output_size
        self.num_layers=num_layers
        self.gru=nn.GRU(input_size,hidden_size,num_layers)
        self.linear=nn.linear(hidden_size,output_size)
        self.softmax=nn.LogSoftmax(dim=-1)
        
    def forward(self,input1,hidden):
        input1=input1.unsqueeze(0)
        output,hn=self.gru(input1,hidden)
        return self.softmax(self.linear(hidden)),hn
    
    def init_hidden(self):
        return torch.zeros(self.num_layers,1,self.hidden_size)

?文章來源地址http://www.zghlxwxcb.cn/news/detail-802324.html

注意力模型

import torch
import torch.nn as nn
import torch.nn.functional as F

#建立attn類
class Attn(nn.Module):
    def __init__(self, query_size,key_size,value_size1,value_size2,output_size):
        """_summary_

        Args:
            query_size (_type_): 代表的是Q的最后一個(gè)維度
            key_size (_type_): 代表的K的最后一個(gè)維度
            value_size1 (_type_): 代表value的導(dǎo)數(shù)第二維大小
            value_size2 (_type_): 代表value的倒數(shù)第一維大小
            output_size (_type_): 代表輸出的最后一個(gè)維度的大小
        """
        super(Attn, self).__init__()
        self.query_size = query_size
        self.key_size = key_size
        self.value_size1 = value_size1
        self.value_size2 = value_size2
        self.output_size = output_size
        
        # 初始化注意力機(jī)制
        self.attn=nn.Linear(self.query_size+self.key_size,self.value_size1)
        self.attn_combine=nn.Linear(self.query_size+self.value_size2,self.output_size)
        
    def forward(self,query,key,value):
        """_summary_

        Args:
            query (_type_): 代表Q
            key (_type_): 代表K
            value (_type_): 代表V

        Returns:
            _type_: 返回注意力機(jī)制的輸出
        """
        # 計(jì)算注意力權(quán)重
        attn_weights=F.softmax(self.attn(torch.cat((query[0],key[0]),1)),dim=1)
        attn_applied=torch.bmm(attn_weights.unsqueeze(0),value)
        
        # 計(jì)算注意力機(jī)制的輸出
        output=torch.cat((query[0],attn_applied[0]),1)
        
        output=self.attn_combine(output).unsqueeze(0)
        
        return output,attn_weights

query_size=32
key_size=32
value_size1=32
value_size2=64
output_size=64

#初始化attn
attn=Attn(query_size,key_size,value_size1,value_size2,output_size)
#使用attn實(shí)例
Q=torch.randn(1,1,32)
K=torch.randn(1,1,32)
V=torch.randn(1,32,64)
output=attn(Q,K,V)

到了這里，關(guān)于【python，機(jī)器學(xué)習(xí)，nlp】RNN循環(huán)神經(jīng)網(wǎng)絡(luò)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Python深度學(xué)習(xí)026：基于Pytorch的典型循環(huán)神經(jīng)網(wǎng)絡(luò)模型RNN、LSTM、GRU的公式及簡(jiǎn)潔案例實(shí)現(xiàn)（官方）
循環(huán)神經(jīng)網(wǎng)絡(luò)（也有翻譯為遞歸神經(jīng)網(wǎng)絡(luò)）最典型的三種網(wǎng)絡(luò)結(jié)構(gòu)是： RNN（Recurrent Neural Network，循環(huán)神經(jīng)網(wǎng)絡(luò)） LSTM（Long Short-Term Memory，長(zhǎng)短期記憶網(wǎng)絡(luò)） GRU（Gate Recurrent Unit，門控循環(huán)單元）理解參數(shù)的含義非常重要，否則，你不知道準(zhǔn)備什么維度的輸入數(shù)據(jù)送入模型先
2023年04月22日
瀏覽(25)
深度學(xué)習(xí)實(shí)戰(zhàn)——循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN、LSTM、GRU）
???? ? 憶如完整項(xiàng)目/代碼詳見github： https://github.com/yiru1225 （轉(zhuǎn)載標(biāo)明出處勿白嫖 star for projects thanks）目錄系列文章目錄一、實(shí)驗(yàn)綜述 1.實(shí)驗(yàn)工具及內(nèi)容 2.實(shí)驗(yàn)數(shù)據(jù) 3.實(shí)驗(yàn)?zāi)繕?biāo) 4.實(shí)驗(yàn)步驟二、循環(huán)神經(jīng)網(wǎng)絡(luò)綜述 1.循環(huán)神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介 1.1 循環(huán)神經(jīng)網(wǎng)絡(luò)背景 1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2023年04月24日
瀏覽(17)
深度學(xué)習(xí)4. 循環(huán)神經(jīng)網(wǎng)絡(luò) – Recurrent Neural Network | RNN
目錄循環(huán)神經(jīng)網(wǎng)絡(luò) – Recurrent Neural Network | RNN 為什么需要 RNN ？獨(dú)特價(jià)值是什么？ RNN 的基本原理 RNN 的優(yōu)化算法 RNN 到 LSTM – 長(zhǎng)短期記憶網(wǎng)絡(luò) 從 LSTM 到 GRU RNN 的應(yīng)用和使用場(chǎng)景總結(jié) 百度百科+維基百科卷積神經(jīng)網(wǎng)絡(luò)和普通的算法大部分都是輸入和輸出的一一對(duì)應(yīng)，也就是一
2024年02月11日
瀏覽(53)
【深度學(xué)習(xí)】——循環(huán)神經(jīng)網(wǎng)絡(luò)RNN及實(shí)例氣溫預(yù)測(cè)、單層lstm股票預(yù)測(cè)
? ? ? ?密集連接網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)都有主要的特點(diǎn)，那就是它們沒有記憶。它們單獨(dú)處理每個(gè)輸入，在輸入和輸入之間沒有保存任何狀態(tài)。舉個(gè)例子：當(dāng)你在閱讀一個(gè)句子的時(shí)候，你需要記住之前的內(nèi)容，我們才能動(dòng)態(tài)的了解這個(gè)句子想表達(dá)的含義。生物智能已漸進(jìn)的方
2023年04月24日
瀏覽(28)
深度學(xué)習(xí)-循環(huán)神經(jīng)網(wǎng)絡(luò)-RNN實(shí)現(xiàn)股價(jià)預(yù)測(cè)-LSTM自動(dòng)生成文本
基于文本內(nèi)容及其前后信息進(jìn)行預(yù)測(cè) 基于目標(biāo)不同時(shí)刻狀態(tài)進(jìn)行預(yù)測(cè) 基于數(shù)據(jù)歷史信息進(jìn)行預(yù)測(cè) 序列模型：輸入或者輸出中包含有序列數(shù)據(jù)的模型突出數(shù)據(jù)的前后序列關(guān)系兩大特點(diǎn)：輸入（輸出）元素之間是具有順序關(guān)系。不同的順序，得到的結(jié)果應(yīng)該是不同的，比如“
2024年01月24日
瀏覽(60)
【深度學(xué)習(xí)筆記】6_2 循環(huán)神經(jīng)網(wǎng)絡(luò)RNN（recurrent neural network）
注：本文為《動(dòng)手學(xué)深度學(xué)習(xí)》開源內(nèi)容，部分標(biāo)注了個(gè)人理解，僅為個(gè)人學(xué)習(xí)記錄，無抄襲搬運(yùn)意圖上一節(jié)介紹的 n n n 元語法中，時(shí)間步 t t t 的詞 w t w_t w t ? 基于前面所有詞的條件概率只考慮了最近時(shí)間步的 n ? 1 n-1 n ? 1 個(gè)詞。如果要考慮比 t ? ( n ? 1 ) t-(n-1) t ?
2024年03月12日
瀏覽(22)
【算法小記】深度學(xué)習(xí)——循環(huán)神經(jīng)網(wǎng)絡(luò)相關(guān)原理與RNN、LSTM算法的使用
文中程序以Tensorflow-2.6.0為例部分概念包含筆者個(gè)人理解，如有遺漏或錯(cuò)誤，歡迎評(píng)論或私信指正。卷積神經(jīng)網(wǎng)絡(luò)在圖像領(lǐng)域取得了良好的效果，卷積核憑借優(yōu)秀的特征提取能力通過深層的卷積操作可是實(shí)現(xiàn)對(duì)矩形張量的復(fù)雜計(jì)算處理。但是生活中除了圖像這樣天然以矩陣形
2024年01月25日
瀏覽(21)
Pytorch 對(duì)比TensorFlow 學(xué)習(xí)：Day 17-18: 循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和LSTM
Day 17-18: 循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和LSTM 在這兩天的學(xué)習(xí)中，我專注于理解循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和長(zhǎng)短期記憶網(wǎng)絡(luò)（LSTM）的基本概念，并學(xué)習(xí)了它們?cè)谔幚硇蛄袛?shù)據(jù)時(shí)的應(yīng)用。 1.RNN和LSTM基礎(chǔ)： RNN：了解了RNN是如何處理序列數(shù)據(jù)的，特別是它的循環(huán)結(jié)構(gòu)可以用于處理時(shí)間序列或連續(xù)
2024年01月20日
瀏覽(18)
NLP之搭建RNN神經(jīng)網(wǎng)絡(luò)
這段代碼的目的是使用TensorFlow庫來構(gòu)建一個(gè)簡(jiǎn)單的循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）模型，用于處理文本數(shù)據(jù) 。該模型的預(yù)期應(yīng)用可能是文本分類任務(wù) ，如情感分析或文本主題分類。流程描述：導(dǎo)入必要的庫和模塊 : Sequential ：Keras中用于構(gòu)建線性堆疊的模型。 Dense ：全連接層。
2024年02月06日
瀏覽(21)
【神經(jīng)網(wǎng)絡(luò)】循環(huán)神經(jīng)網(wǎng)絡(luò)RNN和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)LSTM
歡迎訪問Blog總目錄！一文看盡RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)） - 知乎 (zhihu.com) 一文搞懂RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)）基礎(chǔ)篇 - 知乎 (zhihu.com) 循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network, RNN）是一類以序列（sequence）數(shù)據(jù)為輸入，在序列的演進(jìn)方向進(jìn)行遞歸（recursion）且所有節(jié)點(diǎn)（循環(huán)單元）按鏈?zhǔn)竭B
2024年04月10日
瀏覽(25)