国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)，并計(jì)算參數(shù)Params

2年前作者：百年孤獨(dú)百年分類：Toy博客閱讀(32)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)，并計(jì)算參數(shù)Params。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)，并計(jì)算參數(shù)Params

在深度學(xué)習(xí)中，模型的參數(shù)數(shù)量是一個(gè)非常重要的指標(biāo)，通常會(huì)影響模型的大小、訓(xùn)練速度和準(zhǔn)確度等多個(gè)方面。在本教程中，我們將介紹如何計(jì)算深度學(xué)習(xí)模型的參數(shù)數(shù)量。

本教程將以PyTorch為例，展示如何計(jì)算一個(gè)包含卷積、池化、歸一化和全連接等多種層的卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量。具體來說，我們將首先介紹一個(gè)具有全連接層的神經(jīng)網(wǎng)絡(luò)的參數(shù)計(jì)算方法，然后擴(kuò)展到包含卷積、池化、歸一化和全連接等多種層的卷積神經(jīng)網(wǎng)絡(luò)。

舉例

計(jì)算具有全連接層的神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量

假設(shè)我們有一個(gè)輸入向量 $x$ ，其維度為 $d_{in}$ ，我們想將其映射到一個(gè)輸出向量 $y$ ，其維度為 $d_{out}$ 。我們可以使用一個(gè)具有 $n$ 個(gè)隱藏層的全連接神經(jīng)網(wǎng)絡(luò)來完成這個(gè)映射，其中每個(gè)隱藏層具有 $h$ 個(gè)神經(jīng)元。

在PyTorch中，我們可以通過定義一個(gè)繼承自nn.Module的類來實(shí)現(xiàn)這個(gè)神經(jīng)網(wǎng)絡(luò)。下面是一個(gè)定義了一個(gè)具有兩個(gè)隱藏層的全連接神經(jīng)網(wǎng)絡(luò)的示例代碼：

import torch
import torch.nn as nn

class Net(nn.Module):
    def __init__(self, d_in, h, d_out, n):
        super(Net, self).__init__()
        self.linear1 = nn.Linear(d_in, h)
        self.linear2 = nn.Linear(h, h)
        self.linear3 = nn.Linear(h, d_out)
        self.n = n

    def forward(self, x):
        h_relu = self.linear1(x).clamp(min=0)
        for i in range(self.n):
            h_relu = self.linear2(h_relu).clamp(min=0)
        y_pred = self.linear3(h_relu)
        return y_pred

其中，nn.Linear是PyTorch中的一個(gè)線性層，它將輸入向量乘以一個(gè)權(quán)重矩陣，并加上一個(gè)偏置向量，得到輸出向量。在這個(gè)例子中，我們定義了三個(gè)線性層，分別為self.linear1、self.linear2和self.linear3。在forward函數(shù)中，我們首先將輸入向量x傳遞給self.linear1，然后通過ReLU非線性激活函數(shù)得到一個(gè)隱藏層輸出h_relu。接下來，我們使用for循環(huán)多次將h_relu傳遞給self.linear2，再次使用ReLU非線性激活函數(shù)得到另一個(gè)隱藏層輸出。最后，我們將最后一個(gè)隱藏層的輸出傳遞給self.linear3，得到輸出向量y_pred。

現(xiàn)在讓我們計(jì)算一下這個(gè)神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量。對(duì)于每個(gè)線性層，它都有一個(gè)權(quán)重矩陣和一個(gè)偏置向量，因此總的參數(shù)數(shù)量為：

參數(shù)數(shù)量 = d_in * h + h * h * (n-1) + h * d_out + h + d_out

其中，第一項(xiàng) $d_{in} * h$ 是輸入層到第一個(gè)隱藏層的權(quán)重矩陣的參數(shù)數(shù)量；第二項(xiàng) $h ? h ? (n ? 1)$ 是每個(gè)隱藏層之間的權(quán)重矩陣的參數(shù)數(shù)量；第三項(xiàng) $h * d_{out}$ 是最后一個(gè)隱藏層到輸出層的權(quán)重矩陣的參數(shù)數(shù)量；第四項(xiàng) $h$ 和 $d_{out}$ 分別是偏置向量的參數(shù)數(shù)量。

因此，這個(gè)具有兩個(gè)隱藏層的全連接神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量取決于輸入向量的維度 $d_{in}$ ，輸出向量的維度 $d_{out}$ ，每個(gè)隱藏層的神經(jīng)元數(shù)量 $h$ 和隱藏層數(shù)量 $n$ 。

計(jì)算卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量

現(xiàn)在讓我們將上述方法擴(kuò)展到卷積神經(jīng)網(wǎng)絡(luò)中。卷積神經(jīng)網(wǎng)絡(luò)是一種常用的深度學(xué)習(xí)模型，通常用于圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域。它由多個(gè)卷積層、池化層、歸一化層和全連接層等多種層組成。

為了計(jì)算卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量，我們需要考慮每一層的參數(shù)數(shù)量。下面是一個(gè)簡(jiǎn)單的卷積神經(jīng)網(wǎng)絡(luò)的示例代碼：

import torch
import torch.nn as nn
import torch.nn.functional as F
from torchsummary import summary
from thop import profile

device = torch.device("cuda" if torch.cuda.is_available() else 'cpu')

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=16, kernel_size=3, stride=1, padding=1)
        self.bn1 = nn.BatchNorm2d(16)
        self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(in_channels=16, out_channels=32, kernel_size=3, stride=1, padding=1)
        self.bn2 = nn.BatchNorm2d(32)
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)
        self.fc1 = nn.Linear(32 * 8 * 8, 64)
        self.fc2 = nn.Linear(64, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = F.relu(x)
        x = self.pool1(x)
        x = self.conv2(x)
        x = self.bn2(x)
        x = F.relu(x)
        x = self.pool2(x)
        x = x.view(-1, 32 * 8 * 8)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        return x

net = Net().to(device)
input_shape = (3, 224, 224)
summary(net, input_shape)

input_tensor = torch.randn(1, *input_shape).to(device)

flops, params = profile(net, inputs=(input_tensor,))
print('FLOPs: {:.2f}M'.format(flops / 1e6))

在這個(gè)示例中，我們定義了一個(gè)包含兩個(gè)卷積層、兩個(gè)池化層、兩個(gè)歸一化層和兩個(gè)全連接層的卷積神經(jīng)網(wǎng)絡(luò)。我們使用nn.Conv2d定義了兩個(gè)卷積層，使用nn.BatchNorm2d定義了兩個(gè)歸一化層，使用nn.MaxPool2d定義了兩個(gè)池化層，使用nn.Linear定義了兩個(gè)全連接層。

該網(wǎng)絡(luò)結(jié)構(gòu)輸出如下：

使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)，并計(jì)算參數(shù)Params

Params計(jì)算過程

我們可以使用如下的方法計(jì)算這個(gè)卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量：

對(duì)于每個(gè)卷積層，它有一個(gè)包含卷積核參數(shù)的權(quán)重張量和一個(gè)包含偏置參數(shù)的向量。因此，卷積層的參數(shù)數(shù)量為out_channels * (in_channels * kernel_size^2 + 1)。
對(duì)于每個(gè)歸一化層，它有兩個(gè)參數(shù)：縮放因子和偏移量。因此，歸一化層的參數(shù)數(shù)量為2 * out_channels。
對(duì)于每個(gè)全連接層，它有一個(gè)包含權(quán)重參數(shù)的權(quán)重矩陣和一個(gè)包含偏置參數(shù)的向量。因此，全連接層的參數(shù)數(shù)量為(in_features + 1) * out_features。

根據(jù)上述公式，我們可以計(jì)算這個(gè)示例卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量：

參數(shù)數(shù)量 = conv1參數(shù)數(shù)量 + bn1參數(shù)數(shù)量 + conv2參數(shù)數(shù)量 + bn2參數(shù)數(shù)量 + fc1參數(shù)數(shù)量 + fc2參數(shù)數(shù)量
         = 16 * (3 * 3^2 + 1) + 16 * 2 + 32 * (16 * 3^2 + 1) + 32 * 2 + (32 * 8 * 8 + 1) * 64 + (64 + 1) * 10
         = 136,970

因此，這個(gè)示例卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量為136,970。

它計(jì)算了模型中各層的參數(shù)數(shù)量，包括卷積層、全連接層和BatchNorm層的參數(shù)數(shù)量。具體來說，公式計(jì)算了：

第一層卷積層的參數(shù)數(shù)量：輸入通道數(shù)為3，輸出通道數(shù)為16，卷積核大小為3x3，因此共有16個(gè)卷積核，每個(gè)卷積核有3x3=9個(gè)參數(shù)，另外還有16個(gè)偏置參數(shù)，因此該層參數(shù)數(shù)量為16x(3x3+1)=448。
第一層BatchNorm層的參數(shù)數(shù)量：該層有16個(gè)輸出通道，每個(gè)通道有2個(gè)參數(shù)（縮放因子和偏置項(xiàng)），因此該層參數(shù)數(shù)量為16x2=32。
第二層卷積層的參數(shù)數(shù)量：輸入通道數(shù)為16，輸出通道數(shù)為32，卷積核大小為3x3，因此共有32個(gè)卷積核，每個(gè)卷積核有16x3x3=144個(gè)參數(shù)，另外還有32個(gè)偏置參數(shù)，因此該層參數(shù)數(shù)量為32x(16x3x3+1)=4608。
第二層BatchNorm層的參數(shù)數(shù)量：該層有32個(gè)輸出通道，每個(gè)通道有2個(gè)參數(shù)，因此該層參數(shù)數(shù)量為32x2=64。
第一個(gè)全連接層的參數(shù)數(shù)量：該層輸入特征數(shù)為32x8x8=2048，輸出特征數(shù)為64，因此該層參數(shù)數(shù)量為2048x64+64=131,136。
第二個(gè)全連接層的參數(shù)數(shù)量：該層輸入特征數(shù)為64，輸出特征數(shù)為10，因此該層參數(shù)數(shù)量為64x10+10=650。

將上述各層的參數(shù)數(shù)量相加，即可得到模型的總參數(shù)數(shù)量。

另外，需要注意的是，參數(shù)數(shù)量和FLOPs是不同的概念。FLOPs是指在模型推理過程中，需要進(jìn)行的浮點(diǎn)運(yùn)算次數(shù)，而參數(shù)數(shù)量則是指模型中需要學(xué)習(xí)的參數(shù)的數(shù)量。在計(jì)算FLOPs時(shí)，需要考慮到每個(gè)卷積層、池化層和全連接層的輸入輸出形狀，以及各層的卷積核大小、步長(zhǎng)等參數(shù)信息。

總結(jié)

計(jì)算深度學(xué)習(xí)模型的參數(shù)數(shù)量是深度學(xué)習(xí)中非?；A(chǔ)的知識(shí)點(diǎn)，掌握好這一知識(shí)點(diǎn)有助于更好地理解和設(shè)計(jì)深度學(xué)習(xí)模型。

在本教程中，我們介紹了如何計(jì)算具有全連接層的神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量。對(duì)于具有全連接層的神經(jīng)網(wǎng)絡(luò)，我們可以使用簡(jiǎn)單的公式計(jì)算參數(shù)數(shù)量；對(duì)于卷積神經(jīng)網(wǎng)絡(luò)，我們需要考慮每一層的參數(shù)數(shù)量，并將它們相加得到總的參數(shù)數(shù)量。

需要注意的是，計(jì)算參數(shù)數(shù)量時(shí)需要注意每個(gè)層的超參數(shù)，例如卷積層的輸入和輸出通道數(shù)、卷積核大小等等。此外，某些特殊的層，如Dropout層或者BatchNorm層，可能需要特殊的計(jì)算方法。

在實(shí)際應(yīng)用中，我們通常使用現(xiàn)有的深度學(xué)習(xí)框架（如PyTorch、TensorFlow等）來構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型，這些框架通常會(huì)自動(dòng)計(jì)算模型的參數(shù)數(shù)量。但是，對(duì)于自己實(shí)現(xiàn)的模型或者需要手動(dòng)調(diào)整模型參數(shù)的情況，了解計(jì)算參數(shù)數(shù)量的方法仍然非常有用。

希望本教程對(duì)您有所幫助！文章來源地址http://www.zghlxwxcb.cn/news/detail-437151.html

到了這里，關(guān)于使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)，并計(jì)算參數(shù)Params的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

pytorch-構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)
構(gòu)建卷積神經(jīng)網(wǎng)絡(luò) 卷積網(wǎng)絡(luò)中的輸入和層與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)有些區(qū)別，需重新設(shè)計(jì)，訓(xùn)練模塊基本一致首先讀取數(shù)據(jù) 分別構(gòu)建訓(xùn)練集和測(cè)試集（驗(yàn)證集） DataLoader來迭代取數(shù)據(jù) 卷積網(wǎng)絡(luò)模塊構(gòu)建一般卷積層，relu層，池化層可以寫成一個(gè)套餐注意卷積最后結(jié)果還是一個(gè)特征圖
2024年02月09日
瀏覽(21)
pytorch_神經(jīng)網(wǎng)絡(luò)構(gòu)建2(數(shù)學(xué)原理)
分類基礎(chǔ)理論: 交叉熵是信息論中用來衡量?jī)蓚€(gè)分布相似性的一種量化方式之前講述二分類的loss函數(shù)時(shí)我們使用公式-(y*log(y_)+(1-y)*log(1-y_)進(jìn)行誤差計(jì)算 y表示真實(shí)值,y_表示預(yù)測(cè)值交叉熵的一般公式為: 那么二分類時(shí)公式可以寫作: 其中sigmoid(x)=y_ 這就是二分類的loss函數(shù),那么如
2024年02月07日
瀏覽(22)
[pytorch]手動(dòng)構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)并且訓(xùn)練
上一篇博客全都是說明類型的,實(shí)際代碼能不能跑起來兩說,謹(jǐn)慎觀看.本文中直接使用fashions數(shù)據(jù)實(shí)現(xiàn)softmax的簡(jiǎn)單訓(xùn)練并且完成結(jié)果輸出.實(shí)現(xiàn)一個(gè)預(yù)測(cè)并且觀測(cè)到輸出結(jié)果. 并且更重要的是,在這里對(duì)一些訓(xùn)練的過程,數(shù)據(jù)的形式,以及我們?cè)趕oftmax中主要做什么以及怎么做來進(jìn)行說
2024年02月05日
瀏覽(22)
bp神經(jīng)網(wǎng)絡(luò)參數(shù)怎么設(shè)置,神經(jīng)網(wǎng)絡(luò)參數(shù)個(gè)數(shù)計(jì)算
神經(jīng)網(wǎng)絡(luò)各個(gè)網(wǎng)絡(luò)參數(shù)設(shè)定原則：①、網(wǎng)絡(luò)節(jié)點(diǎn)? 網(wǎng)絡(luò)輸入層神經(jīng)元節(jié)點(diǎn)數(shù)就是系統(tǒng)的特征因子(自變量)個(gè)數(shù)，輸出層神經(jīng)元節(jié)點(diǎn)數(shù)就是系統(tǒng)目標(biāo)個(gè)數(shù)。隱層節(jié)點(diǎn)選按經(jīng)驗(yàn)選取，一般設(shè)為輸入層節(jié)點(diǎn)數(shù)的75%。如果輸入層有7個(gè)節(jié)點(diǎn)，輸出層1個(gè)節(jié)點(diǎn)，那么隱含層可暫設(shè)為5個(gè)節(jié)點(diǎn)
2024年02月06日
瀏覽(23)
PyTorch 初級(jí)教程：構(gòu)建你的第一個(gè)神經(jīng)網(wǎng)絡(luò)
PyTorch 是一個(gè)在研究領(lǐng)域廣泛使用的深度學(xué)習(xí)框架，提供了大量的靈活性和效率。本文將向你介紹如何使用 PyTorch 構(gòu)建你的第一個(gè)神經(jīng)網(wǎng)絡(luò)。首先，我們需要安裝 PyTorch。PyTorch 的安裝過程很簡(jiǎn)單，你可以根據(jù)你的環(huán)境（操作系統(tǒng)，Python 版本，是否使用 GPU 等）在 PyTorch 的官方
2024年02月14日
瀏覽(91)
pytorch學(xué)習(xí)——如何構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)——以手寫數(shù)字識(shí)別為例
目錄一.概念介紹 1.1神經(jīng)網(wǎng)絡(luò)核心組件 1.2神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖 1.3使用pytorch構(gòu)建神經(jīng)網(wǎng)絡(luò)的主要工具二、實(shí)現(xiàn)手寫數(shù)字識(shí)別 2.1環(huán)境 2.2主要步驟 2.3神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 2.4準(zhǔn)備數(shù)據(jù) 2.4.1導(dǎo)入模塊 2.4.2定義一些超參數(shù) 2.4.3下載數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理 2.4.4可視化數(shù)據(jù)集中部分元素 ?2
2024年02月14日
瀏覽(48)
深度學(xué)習(xí)基礎(chǔ)——通過PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)1維/2維序列分類
通過PyTorch構(gòu)建前饋神經(jīng)網(wǎng)絡(luò)，并對(duì)二維數(shù)據(jù)點(diǎn)進(jìn)行分類。在該例子當(dāng)中，所有的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)都是通過高斯混合模型GMM生成的：更換使用循環(huán)神經(jīng)網(wǎng)絡(luò)RNN模型，進(jìn)行1維序列分類任務(wù)。為了簡(jiǎn)化問題，我們假定：序列的長(zhǎng)度是固定的。我們將其長(zhǎng)度設(shè)為T=4。我們只有
2024年02月11日
瀏覽(32)
Pytorch學(xué)習(xí)第二周--Day 12-13: 構(gòu)建你的第一個(gè)神經(jīng)網(wǎng)絡(luò)
Day 12-13: 構(gòu)建你的第一個(gè)神經(jīng)網(wǎng)絡(luò) 在這兩天里，我動(dòng)手實(shí)踐構(gòu)建了我的第一個(gè)神經(jīng)網(wǎng)絡(luò)，目的是解決一個(gè)基本的分類問題。使用了兩個(gè)主流的深度學(xué)習(xí)框架：PyTorch和TensorFlow，以對(duì)比和理解它們?cè)谏窠?jīng)網(wǎng)絡(luò)構(gòu)建方面的不同。目標(biāo)：構(gòu)建一個(gè)全連接的神經(jīng)網(wǎng)絡(luò)來處理分類問題。
2024年01月20日
瀏覽(39)
如何計(jì)算神經(jīng)網(wǎng)絡(luò)參數(shù)的個(gè)數(shù)？
目錄 1. 卷積層 2. 分類層 3. 計(jì)算 LeNet 網(wǎng)絡(luò)的參數(shù)個(gè)數(shù) 神經(jīng)網(wǎng)絡(luò)隨著層數(shù)的加深，網(wǎng)絡(luò)參數(shù)的個(gè)數(shù)會(huì)越來越多，小的網(wǎng)絡(luò)有成千上萬個(gè)參數(shù)，大的可以達(dá)到千萬個(gè)網(wǎng)絡(luò)參數(shù)。所以應(yīng)該如何計(jì)算神經(jīng)網(wǎng)絡(luò)參數(shù)的個(gè)數(shù)？圖像分類的神經(jīng)網(wǎng)絡(luò)，包含兩個(gè)部分：特征提取層+ 分類層
2024年02月06日
瀏覽(28)
計(jì)算機(jī)視覺：深層卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)建
上一節(jié)課程中我們學(xué)習(xí)了單卷積層的前向傳播，本次課程我們構(gòu)建一個(gè)具有三個(gè)卷積層的卷積神經(jīng)網(wǎng)絡(luò)，然后從輸入（39*39*3）開始進(jìn)行三次卷積操作，我們來看一下每次卷積的輸入和輸出維度的變化。第一層使用3*3*3的過濾器來提取特征，那么f[1]=3，然后步長(zhǎng)s[1]=1,填充p[1]
2024年02月10日
瀏覽(30)

<code id="knwlo"></code>

<td id="knwlo"><tbody id="knwlo"></tbody></td>

<small id="knwlo"><pre id="knwlo"></pre></small>