国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【PyTorch】使用PyTorch創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)并在CIFAR-10數(shù)據(jù)集上進(jìn)行分類

2年前作者：精英的英分類：Toy博客閱讀(32)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【PyTorch】使用PyTorch創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)并在CIFAR-10數(shù)據(jù)集上進(jìn)行分類。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

前言

在深度學(xué)習(xí)的世界中，圖像分類任務(wù)是一個(gè)經(jīng)典的問題，它涉及到識別給定圖像中的對象類別。CIFAR-10數(shù)據(jù)集是一個(gè)常用的基準(zhǔn)數(shù)據(jù)集，包含了10個(gè)類別的60000張32x32彩色圖像。在本博客中，我們將探討如何使用PyTorch框架創(chuàng)建一個(gè)簡單的卷積神經(jīng)網(wǎng)絡(luò)（CNN）來對CIFAR-10數(shù)據(jù)集中的圖像進(jìn)行分類。

在下一篇博客中，我們將嘗試不斷優(yōu)化模型結(jié)構(gòu)和訓(xùn)練過程，以達(dá)到更高的準(zhǔn)確率和性能。

引用

關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的原理，感興趣的請參閱我的另一篇博客，里面只使用numpy和基礎(chǔ)函數(shù)組建了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型，并完成訓(xùn)練和測試
【手搓深度學(xué)習(xí)算法】從頭創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)

背景

卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中用于圖像識別和分類的一種強(qiáng)大工具。它們能夠自動從圖像中提取特征，并通過一系列卷積層、池化層和全連接層來學(xué)習(xí)圖像的復(fù)雜模式。

CIFAR-10數(shù)據(jù)集包含了飛機(jī)、汽車、鳥類、貓、鹿、狗、青蛙、馬、船和卡車等10個(gè)類別的圖像。每個(gè)類別有6000張圖像，其中50000張用于訓(xùn)練，10000張用于測試。
【PyTorch】使用PyTorch創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)并在CIFAR-10數(shù)據(jù)集上進(jìn)行分類,天網(wǎng)計(jì)劃,pytorch,cnn,分類

代碼解析

我們的目標(biāo)是構(gòu)建一個(gè)能夠處理CIFAR-10數(shù)據(jù)集的CNN模型。以下是我們的模型結(jié)構(gòu)和數(shù)據(jù)處理流程的簡要概述：

數(shù)據(jù)預(yù)處理

我們首先定義了unpickle函數(shù)來加載CIFAR-10數(shù)據(jù)集的批次文件。read_data函數(shù)用于讀取數(shù)據(jù)，將其轉(zhuǎn)換為適合卷積網(wǎng)絡(luò)輸入的格式，并進(jìn)行歸一化處理。我們還提供了一個(gè)選項(xiàng)來將圖像轉(zhuǎn)換為灰度。

def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dict = pickle.load(fo, encoding='bytes')
    return dict

def read_data(file_path, gray = False, percent = 0, normalize = True):
    data_src = unpickle(file_path)
    np_data = np.array(data_src["data".encode()]).astype("float32")
    np_labels = np.array(data_src["labels".encode()]).astype("float32").reshape(-1,1)
    single_data_length = 32*32 
    image_ret = None
    if (gray):
        np_data = (np_data[:, :single_data_length] + np_data[:, single_data_length:(2*single_data_length)] + np_data[:, 2*single_data_length : 3*single_data_length])/3
        image_ret = np_data.reshape(len(np_data),32,32)
    else:
        image_ret = np_data.reshape(len(np_data),32,32,3)
    
    if(normalize):
        mean = np.mean(np_data)
        std = np.std(np_data)
        np_data = (np_data - mean) / std
    
    if (percent != 0):
        np_data = np_data[:int(len(np_data)*percent)]
        np_labels = np_labels[:int(len(np_labels)*percent)]
        image_ret = image_ret[:int(len(image_ret)*percent)]
    num_classes = len(np.unique(np_labels))
    np_data, np_labels = convert_to_conv_input(np_data, np_labels)
    return np_data, np_labels, num_classes, image_ret

網(wǎng)絡(luò)結(jié)構(gòu)

Conv類定義了我們的CNN模型，它包含一個(gè)卷積層、一個(gè)最大池化層、一個(gè)ReLU激活函數(shù)和一個(gè)全連接層。在forward方法中，我們指定了數(shù)據(jù)通過網(wǎng)絡(luò)的流程。

class Conv(th.nn.Module):
    def __init__(self, *args, **kwargs) -> None:
        super(Conv, self).__init__()
        self.conv = th.nn.Conv2d(in_channels=3, out_channels=16, kernel_size=3)
        self.pool = th.nn.MaxPool2d(kernel_size=2,stride=2)
        self.relu = th.nn.ReLU()
        self.linear = th.nn.Linear(16*15*15, 10)
        self.softmax = th.nn.Softmax(dim=1)
        
    def forward(self, x):
        x = self.conv(x) #32，16，30，30
        x = self.pool(x) #32，16，15，15
        x = self.relu(x)
        x = x.view(x.size(0), -1)
        x = self.linear(x)
        return x
    
    # 在predict函數(shù)中，額外調(diào)用了softmax，將線性層的10個(gè)特征值轉(zhuǎn)化為概率，在前向傳播中不用是因?yàn)閜ytorch中交叉熵函數(shù)自帶了softmax
    def predict(self,x):
        x = self.forward(x)
        x = self.softmax(x)
        return x

卷積層、池化層、線性層的輸入特征數(shù)量的計(jì)算方法

線性層的輸入特征個(gè)數(shù)取決于前面層的輸出。
具體來說，線性層的輸入特征個(gè)數(shù)是卷積層和池化層處理后的輸出特征圖的總元素?cái)?shù)量。

卷積層定義如下：

self.conv = th.nn.Conv2d(in_channels=3, out_channels=16, kernel_size=3)

這里，in_channels=3 表示輸入圖像有3個(gè)顏色通道（RGB），out_channels=16 表示卷積層將輸出16個(gè)特征圖。

接下來是池化層：

self.pool = th.nn.MaxPool2d(kernel_size=2, stride=2)

kernel_size=2，表示池化窗口的大小是2x2。stride=2 表示池化操作的步長是2。

為了計(jì)算線性層的輸入特征個(gè)數(shù)，我們需要知道卷積層和池化層之后的輸出特征圖的大小。這可以通過計(jì)算公式得到，或者通過在實(shí)際數(shù)據(jù)上運(yùn)行網(wǎng)絡(luò)的前向傳播來確定。

計(jì)算公式如下：

對于卷積層，輸出特征圖的大小可以通過以下公式計(jì)算：

H_out = (H_in + 2 * padding - dilation * (kernel_size - 1) - 1) / stride + 1
W_out = (W_in + 2 * padding - dilation * (kernel_size - 1) - 1) / stride + 1

對于池化層，輸出特征圖的大小也可以通過類似的公式計(jì)算。

由于沒有指定padding和dilation，查看函數(shù)定義可知它們的默認(rèn)值分別是0和1。因此，如果輸入圖像的大小是32x32，卷積層之后的大小將是：

H_out = (32 - 1 * (3 - 1) - 1) / 1 + 1 = 30
W_out = (32 - 1 * (3 - 1) - 1) / 1 + 1 = 30

因此，卷積層的輸出將有16個(gè)30x30的特征圖。

然后，池化層將這些特征圖的大小減半（因?yàn)?code>kernel_size=2和stride=2），所以輸出將是16個(gè)15x15的特征圖。

最后，線性層的輸入特征個(gè)數(shù)將是這些特征圖的總元素?cái)?shù)量：

num_features = out_channels * H_out_pool * W_out_pool = 16 * 15 * 15 = 3600

因此，線性層的正確定義應(yīng)該是：

self.linear = th.nn.Linear(3600, num_classes)

訓(xùn)練過程

在main函數(shù)中，我們初始化了模型、損失函數(shù)和優(yōu)化器。我們使用隨機(jī)梯度下降（SGD）作為優(yōu)化算法，并設(shè)置了學(xué)習(xí)率。接著，我們進(jìn)入了訓(xùn)練循環(huán)，其中包括前向傳播、損失計(jì)算、反向傳播和權(quán)重更新。

loss_function = th.nn.CrossEntropyLoss()
optimizer = th.optim.SGD(conv_model.parameters(), lr = lr)

測試和評估

訓(xùn)練完成后，我們使用訓(xùn)練好的模型對測試數(shù)據(jù)進(jìn)行評估，并計(jì)算準(zhǔn)確率。我們還提供了一個(gè)predict方法，它在給定輸入數(shù)據(jù)后返回模型的預(yù)測概率。

def predict(self,x):
        x = self.forward(x)
        x = self.softmax(x)
        return x

softmax激活函數(shù)

Softmax 激活函數(shù)是一種廣泛使用的函數(shù)，它將一個(gè)實(shí)數(shù)向量轉(zhuǎn)換為概率分布。在深度學(xué)習(xí)中，它常常用于多類別分類問題的輸出層。

Softmax 函數(shù)的定義如下：

$\text{softmax}(z)_i = \frac{e^{z_i}}{\sum_{j} e^{z_j}}$

其中 $z$ 是輸入向量， $z_i$ 是 $z$ 的第 $i$ 個(gè)元素， $\text{softmax}(z)_i$ 是輸出向量的第 $i$ 個(gè)元素。

Softmax 函數(shù)的主要特性是它的輸出是一個(gè)概率分布，即所有輸出元素的值都在 $(0, 1)$ 區(qū)間內(nèi)，且所有輸出元素的值之和為 1。這使得 Softmax 函數(shù)非常適合用于表示概率。

Softmax 函數(shù)的一個(gè)重要性質(zhì)是它是連續(xù)的，且其導(dǎo)數(shù)容易計(jì)算。這使得 Softmax 函數(shù)在深度學(xué)習(xí)中的反向傳播過程中非常有用。

Softmax 函數(shù)的導(dǎo)數(shù)如下：

$\frac{\partial}{\partial z_i}\text{softmax}(z)_i = \text{softmax}(z)_i(1 - \text{softmax}(z)_i)$

這個(gè)導(dǎo)數(shù)表達(dá)式表明，對于 Softmax 函數(shù)的輸出 $y_i$ ，其對輸入 $z_i$ 的導(dǎo)數(shù)等于 $y_i(1 - y_i)$ 。這個(gè)導(dǎo)數(shù)表達(dá)式在反向傳播過程中非常有用，因?yàn)樗梢灾苯佑糜谟?jì)算梯度。

訓(xùn)練過程中沒有使用softmax層，是應(yīng)為torch的交叉熵?fù)p失函數(shù)已經(jīng)包含了softmax的操作，如果疊加使用，可能得到錯(cuò)誤的結(jié)果。

運(yùn)行結(jié)果

作為一個(gè)簡單的卷積模型，在測試集上得到了60%的準(zhǔn)確率
【PyTorch】使用PyTorch創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)并在CIFAR-10數(shù)據(jù)集上進(jìn)行分類,天網(wǎng)計(jì)劃,pytorch,cnn,分類

完整代碼

本文不提供完整代碼，因?yàn)殡S著我的微調(diào)優(yōu)化過程，已經(jīng)沒有這個(gè)版本的基線代碼了，想要最終代碼的歡迎閱讀下一篇博客 “記一次卷積網(wǎng)絡(luò)調(diào)優(yōu)的過程”
【PyTorch】使用PyTorch創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)并在CIFAR-10數(shù)據(jù)集上進(jìn)行分類,天網(wǎng)計(jì)劃,pytorch,cnn,分類

注意點(diǎn)

數(shù)據(jù)預(yù)處理：確保數(shù)據(jù)被正確地加載和歸一化，這對模型的訓(xùn)練效果至關(guān)重要。
模型結(jié)構(gòu)：模型的層數(shù)和參數(shù)需要根據(jù)任務(wù)的復(fù)雜性來調(diào)整。過于簡單的模型可能無法捕捉到數(shù)據(jù)中的復(fù)雜特征，而過于復(fù)雜的模型可能會導(dǎo)致過擬合。
損失函數(shù)：我們使用交叉熵?fù)p失函數(shù)，它適用于多類別分類問題。
優(yōu)化器：在每次迭代前，記得清除累積的梯度，以避免錯(cuò)誤的梯度更新。

可能的優(yōu)化點(diǎn)

學(xué)習(xí)率調(diào)整：可以嘗試使用學(xué)習(xí)率調(diào)度器來在訓(xùn)練過程中調(diào)整學(xué)習(xí)率，以改善模型的收斂速度和性能。
權(quán)重初始化：嘗試不同的權(quán)重初始化方法，以幫助模型更快地收斂。
正則化技術(shù)：使用如Dropout、L2正則化等技術(shù)來減少過擬合。
數(shù)據(jù)增強(qiáng)：通過對訓(xùn)練圖像進(jìn)行隨機(jī)變換（如旋轉(zhuǎn)、縮放、裁剪等），可以增加模型的泛化能力。
更深的網(wǎng)絡(luò)：考慮增加更多的卷積層和池化層來提取更復(fù)雜的特征。
批量歸一化：在卷積層之后添加批量歸一化層，以穩(wěn)定訓(xùn)練過程并加速收斂。

結(jié)論

通過本博客，我們展示了如何使用PyTorch框架構(gòu)建一個(gè)簡單的CNN模型，并在CIFAR-10數(shù)據(jù)集上進(jìn)行訓(xùn)練和測試。雖然我們的模型結(jié)構(gòu)相對簡單，但它為理解深度學(xué)習(xí)和圖像分類提供了一個(gè)很好的起點(diǎn)。在下一篇博客中，我們將嘗試不斷優(yōu)化模型結(jié)構(gòu)和訓(xùn)練過程，以達(dá)到更高的準(zhǔn)確率和性能。文章來源地址http://www.zghlxwxcb.cn/news/detail-819989.html

到了這里，關(guān)于【PyTorch】使用PyTorch創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)并在CIFAR-10數(shù)據(jù)集上進(jìn)行分類的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

PyTorch實(shí)戰(zhàn)：卷積神經(jīng)網(wǎng)絡(luò)詳解+Python實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)Cifar10彩色圖片分類
目錄前言一、卷積神經(jīng)網(wǎng)絡(luò)概述二、卷積神經(jīng)網(wǎng)絡(luò)特點(diǎn) 卷積運(yùn)算單通道，二維卷積運(yùn)算示例單通道，二維，帶偏置的卷積示例帶填充的單通道，二維卷積運(yùn)算示例 Valid卷積 Same卷積多通道卷積計(jì)算 1.局部感知域 2.參數(shù)共享 3.池化層 4.層次化提取 ?三、卷積網(wǎng)絡(luò)組成結(jié)構(gòu)
2024年02月07日
瀏覽(37)
卷積神經(jīng)網(wǎng)絡(luò)——上篇【深度學(xué)習(xí)】【PyTorch】
5.1.1、理論部分全連接層后，卷積層出現(xiàn)的意義？一個(gè)足夠充分的照片數(shù)據(jù)集，輸入，全連接層參數(shù)，GPU成本，訓(xùn)練時(shí)間是巨大的。（convolutional neural networks，CNN）是機(jī)器學(xué)習(xí)利用自然圖像中一些已知結(jié)構(gòu)的創(chuàng)造性方法，需要更少的參數(shù)，在處理圖像和其他類型的結(jié)構(gòu)化數(shù)據(jù)
2024年02月12日
瀏覽(25)
[PyTorch][chapter 33][卷積神經(jīng)網(wǎng)絡(luò)]
前言 ? ?參考：?《數(shù)字圖像處理與機(jī)器視覺》第五章空間域圖像增強(qiáng)， ? ? ?圖像卷積：空間域圖像增強(qiáng) ? ? ?圖像增強(qiáng)是根據(jù)特定需要突出一副圖像中的某些信息，同時(shí)削弱或去除某些不需要信息的處理方法,其主要目的是是的處理后的圖像對某種特定的應(yīng)用來說比原
2024年02月05日
瀏覽(18)
【深入了解pytorch】PyTorch卷積神經(jīng)網(wǎng)絡(luò)（CNN）簡介
卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種在計(jì)算機(jī)視覺任務(wù)中廣泛應(yīng)用的深度學(xué)習(xí)模型。它通過卷積層、池化層和全連接層等組件，能夠有效地提取圖像特征并實(shí)現(xiàn)高準(zhǔn)確率的圖像分類、目標(biāo)檢測和語義分割等任務(wù)。本文將詳細(xì)介紹CNN的原理，并演示如何使用PyTor
2024年02月16日
瀏覽(31)
PyTorch入門學(xué)習(xí)（八）：神經(jīng)網(wǎng)絡(luò)-卷積層
目錄一、數(shù)據(jù)準(zhǔn)備二、創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)模型三、可視化卷積前后的圖像一、數(shù)據(jù)準(zhǔn)備首先，需要準(zhǔn)備一個(gè)數(shù)據(jù)集來演示卷積層的應(yīng)用。在這個(gè)示例中，使用了CIFAR-10數(shù)據(jù)集，該數(shù)據(jù)集包含了10個(gè)不同類別的圖像數(shù)據(jù)，用于分類任務(wù)。使用PyTorch的 torchvision 庫來加載CIFAR-1
2024年02月07日
瀏覽(30)
【PyTorch】記一次卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化過程
在深度學(xué)習(xí)的世界中，圖像分類任務(wù)是一個(gè)經(jīng)典的問題，它涉及到識別給定圖像中的對象類別。CIFAR-10數(shù)據(jù)集是一個(gè)常用的基準(zhǔn)數(shù)據(jù)集，包含了10個(gè)類別的60000張32x32彩色圖像。在上一篇博客中，我們已經(jīng)探討如何使用PyTorch框架創(chuàng)建一個(gè)簡單的卷積神經(jīng)網(wǎng)絡(luò)（CNN）來對CIFAR-10數(shù)
2024年01月24日
瀏覽(24)
【Pytorch】基于卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的面部表情識別
作者：何翔學(xué)院：計(jì)算機(jī)學(xué)院學(xué)號：04191315 班級：軟件1903 轉(zhuǎn)載請標(biāo)注本文鏈接： https://blog.csdn.net/HXBest/article/details/121981276 面部表情識別 (Facial Expression Recognition ) 在日常工作和生活中，人們情感的表達(dá)方式主要有：語言、聲音、肢體行為（如手勢）、以及面部表情等。在這
2024年02月04日
瀏覽(56)
Pytorch：搭建卷積神經(jīng)網(wǎng)絡(luò)完成MNIST分類任務(wù)：
2023.7.18 MNIST百科： MNIST數(shù)據(jù)集簡介與使用_bwqiang的博客-CSDN博客數(shù)據(jù)集官網(wǎng)：MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges 數(shù)據(jù)集將按以圖片和文件夾名為標(biāo)簽的形式保存： ?代碼：下載mnist數(shù)據(jù)集并轉(zhuǎn)還為圖片 ?訓(xùn)練代碼：測試代碼：分類正確率不錯(cuò)：
2024年02月17日
瀏覽(31)
pytorch集智-5手寫數(shù)字識別器-卷積神經(jīng)網(wǎng)絡(luò)
簡稱：CNN，convolutional neural network 應(yīng)用場景：圖像識別與分類（CNN），看圖說話（CNN+RNN）等優(yōu)越性：和多層感知機(jī)相比，cnn可以識別獨(dú)特的模式，可以自動從數(shù)據(jù)中提取特征。一般機(jī)器學(xué)習(xí)需要特征工程，cnn可以自動識別，極大代替或取代了特征工程和多層感知機(jī)原理不同
2024年01月19日
瀏覽(24)
卷積神經(jīng)網(wǎng)絡(luò)——上篇【深度學(xué)習(xí)】【PyTorch】【d2l】
5.1.1、理論部分全連接層后，卷積層出現(xiàn)的意義？一個(gè)足夠充分的照片數(shù)據(jù)集，輸入，全連接層參數(shù)，GPU成本，訓(xùn)練時(shí)間是巨大的。（convolutional neural networks，CNN）是機(jī)器學(xué)習(xí)利用自然圖像中一些已知結(jié)構(gòu)的創(chuàng)造性方法，需要更少的參數(shù)，在處理圖像和其他類型的結(jié)構(gòu)化數(shù)據(jù)
2024年02月12日
瀏覽(23)

<legend id="ramb0"></legend>

<object id="ramb0"></object>

<legend id="ramb0"><tr id="ramb0"></tr></legend>

<tr id="ramb0"></tr>

^{<legend id="ramb0"></legend>}