国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

^{<center id="ljz5v"><ul id="ljz5v"></ul></center>}

6.5 池化層

2年前作者：computer_vision_chen分類：Toy博客閱讀(15)違法舉報

這篇具有很好參考價值的文章主要介紹了6.5 池化層。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

是什么：池化層跟卷積層類似有個滑動窗口，用來取一個區(qū)域內的最大值或者平均值。

作用：卷積神經(jīng)網(wǎng)絡的最后的部分應該要看到整個圖像的全局，通過池化(匯聚)操作，逐漸匯聚要取的像素，最終實現(xiàn)學習全局表示的目標。同時，卷積層的所有優(yōu)勢也被保留在了中間層。

特點：
1.降低卷積層讀對位置的敏感性。(優(yōu)點)
2.降低對空間降采樣表示的敏感性。(優(yōu)點)
3.池化層的輸入通道和輸出通道相同，如X的形狀為[1,2,4,4]，1代表樣本數(shù)，第二個值：2，代表通道為2，所以輸出的結果通道仍然為2，輸出結果應該為[1,2,計算后的w,計算后的H]
4.使用最大匯聚層以及大于1的步幅，可以減少輸出結果的空間維度(如高度和寬度)。

解釋：因為池化是選出一個區(qū)域的作最大值或平均值，所以取池化區(qū)域內的像素時不依賴像素的位置。因為池化層往往在卷積層的后面，所以池化層可以降低卷積層對位置的敏感性。同樣也可以降低空間降采樣的敏感性。

池化后的輸出形狀

W = (行數(shù) - 池化行數(shù) + 池化行方向步長) / 池化行方向步長 + 1
H = (列數(shù) - 池化列數(shù) + 池化列方向步長) / 池化列方向步長 + 1文章來源地址http://www.zghlxwxcb.cn/news/detail-630630.html

一.單通道池化

import torch
from torch import nn
from d2l import torch as d2l

池化層的前向傳播函數(shù)

def pool2d(X,pool_size,mode='max'):
    p_h,p_w = pool_size
    # 池化層與卷積層類似，池化后的輸出形狀計算方法根卷積一樣
    Y = torch.zeros((X.shape[0] - p_h + 1,X.shape[1]-p_w+1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            if mode=='max':
                Y[i,j] = X[i:i+p_h,j:j+p_w].max()
            elif mode=='avg':
                Y[i,j] = X[i:i+p_h,j:j+p_w].mean()
    return Y

X = torch.tensor([[0.0, 1.0, 2.0],
                  [3.0, 4.0, 5.0],
                  [6.0, 7.0, 8.0]])
print(pool2d(X, (2, 2)))
print(pool2d(X, (2, 2),'avg'))

tensor([[4., 5.],
        [7., 8.]])
tensor([[2., 3.],
        [5., 6.]])

池化層的填充和步幅

X = torch.arange(16,dtype=torch.float32)
print(X)

tensor([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 12., 13.,
        14., 15.])

#(樣本數(shù)，通道數(shù)，行數(shù)，列數(shù))
X = X.reshape((1,1,4,4))
print(X)

tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]]]])

默認步幅與池化窗口相同，當使用3x3的池化窗口，步幅也是3x3

pool2d = nn.MaxPool2d(3)
pool2d(X)

tensor([[[[10.]]]])

手動設置池化尺寸

pool2d = nn.MaxPool2d((2,3),stride=(2,3),padding=(0,1))
pool2d(X)

tensor([[[[ 5.,  7.],
          [13., 15.]]]])

二.多通道池化

手動設置池化尺寸

pool2d = nn.MaxPool2d((2,3),stride=(2,3),padding=(0,1))
pool2d(X)

輸出：
tensor([[[[ 5.,  7.],
          [13., 15.]]]])

多通道池化,X的原shape = (1,1,4,4)，下句是在第二個維度上增加一個4x4的矩陣形狀變成 (1,2,4,4)

X = torch.cat((X,X+1),1)
print(X)
print(X.shape)

tensor([[[[ 0.,  1.,  2.,  3.],
          [ 4.,  5.,  6.,  7.],
          [ 8.,  9., 10., 11.],
          [12., 13., 14., 15.]],

         [[ 1.,  2.,  3.,  4.],
          [ 5.,  6.,  7.,  8.],
          [ 9., 10., 11., 12.],
          [13., 14., 15., 16.]]]])
torch.Size([1, 2, 4, 4])

pool2d = nn.MaxPool2d(3,padding=1,stride=2)
X = pool2d(X)
print(X)
print(X.shape) # 池化不像卷積那樣每個通道的結果要合在一起，所以池化層的輸入通道和輸出通道相同

tensor([[[[ 5.,  7.],
          [13., 15.]],

         [[ 6.,  8.],
          [14., 16.]]]])
# 池化層的輸入通道和輸出通道相同，X的通道為2，所以輸出的結果通道仍然為2，下面第一個1是樣本數(shù)，第二個值是通道數(shù)
torch.Size([1, 2, 2, 2])

到了這里，關于6.5 池化層的文章就介紹完了。如果您還想了解更多內容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉載，請注明出處：如若內容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

【深度學習：計算機視覺】如何改進計算機視覺數(shù)據(jù)集
機器學習算法需要大量數(shù)據(jù)集來訓練、提高性能并生成組織所需的結果。數(shù)據(jù)集是計算機視覺應用程序和模型運行的燃料。數(shù)據(jù)越多越好。這些數(shù)據(jù)應該是高質量的，以確保人工智能項目獲得最佳的結果和產(chǎn)出。獲取訓練機器學習模型所需數(shù)據(jù)的最佳方法之一是使用開源數(shù)
2024年02月20日
瀏覽(33)
深度學習與計算機視覺
目錄 1 深度學習 1.1?人工智能 1.2?機器學習 1.3?深度學習 1.3.1 深度學習發(fā)展歷程 1.3.2 深度學習中的核心因素 1.3.3 深度學習模型分類 1.3.4?深度學習框架 2?計算機視覺人工智能、機器學習、深度學習這三者的關系：在實現(xiàn)人工智能的眾多算法中，機器學習是發(fā)展較為快速的
2024年02月06日
瀏覽(28)
深度學習｜10.1 深度學習在計算機視覺的應用
圖像中的每一個像素點都是輸入層的一部分。而最終最后只有一個輸出點，也就是說需要通過乘上中間層/隱藏層內部的矩陣，從而實現(xiàn)降維。直觀上，信息越多，分析的效果應該越好，但也意味著分析的量會越來越大，考慮到分析所需要的時間和空間，往往采用卷積的方式
2024年02月03日
瀏覽(32)
機器學習——池化層
池化層是深度學習中常用的一種層級結構，它可以對輸入數(shù)據(jù)進行降采樣，減少數(shù)據(jù)量，同時保留重要的特征信息。池化層通常緊跟在卷積層之后，可以有效地減少數(shù)據(jù)量和計算復雜度，提高模型的訓練速度和泛化能力。池化層的結構與卷積層類似，它也由多個濾波器組成，
2024年02月15日
瀏覽(22)
計算機視覺（五）深度學習基礎
深度學習與神經(jīng)網(wǎng)絡的區(qū)別選擇合適的目標函數(shù) Softmax層梯度消失的直觀解釋激活函數(shù) 學習步長 SGD的問題存在馬鞍面，使我們的訓練卡住，于是提出下面方法： Momentum動量 Nesterov Momentum 先利用“慣性”，“走”一步。避免一開始，就被當前梯度帶偏。 Adagrad 為不同的參數(shù)
2024年02月14日
瀏覽(36)
【學習筆記】計算機視覺深度學習網(wǎng)絡模型
這是本人學習計算機視覺CV領域深度學習模型的學習的一點點學習筆記，很多片子沒有完成，可以作為學習的參考~
2024年04月10日
瀏覽(40)
計算機視覺（三）未有深度學習之前
把圖像劃分成若干互不相交的區(qū)域。經(jīng)典的數(shù)字圖像分割算法一般是基于灰度值的兩個基本特征之一：不連續(xù)性和相似性。基于閾值：基于圖像灰度特征計算一個或多個灰度閾值。將灰度值與閾值比較，最后將比較結果分到合適的類別中。大津法基于邊緣：邊界線上連續(xù)的
2024年02月15日
瀏覽(45)
深度學習與計算機視覺的創(chuàng)新
深度學習和計算機視覺是現(xiàn)代人工智能領域的兩個重要分支。深度學習是一種通過多層神經(jīng)網(wǎng)絡來處理大規(guī)模數(shù)據(jù)的機器學習方法，而計算機視覺則是利用計算機程序來模仿人類視覺系統(tǒng)對圖像進行分析和理解的技術。在過去的幾年里，深度學習與計算機視覺的融合已經(jīng)取得
2024年04月09日
瀏覽(22)
計算機競賽深度學習乳腺癌分類
?? 優(yōu)質競賽項目系列，今天要分享的是 ?? 深度學習乳腺癌分類該項目較為新穎，適合作為競賽課題方向，學長非常推薦！ ??學長這里給一個題目綜合評分(每項滿分5分) 難度系數(shù)：3分工作量：3分創(chuàng)新點：4分 ?? 更多資料, 項目分享： https://gitee.com/dancheng-senior/postgradu
2024年02月07日
瀏覽(31)
PyTorch深度學習實戰(zhàn)（5）——計算機視覺
計算機視覺是指通過計算機系統(tǒng)對圖像和視頻進行處理和分析，利用計算機算法和方法，使計算機能夠模擬和理解人類的視覺系統(tǒng)。通過計算機視覺技術，計算機可以從圖像和視頻中提取有用的信息，實現(xiàn)對環(huán)境的感知和理解，從而幫助人們解決各種問題和提高效率。本節(jié)中
2024年02月15日
瀏覽(25)

<optgroup id="pxzgc"><listing id="pxzgc"></listing></optgroup>