本文重點(diǎn)
在前面的課程中,我們學(xué)習(xí)了使用3*3的過濾器去卷積一個(gè)5*5的圖像,那么最終會得到一個(gè)3*3的輸出。那是因?yàn)?3×3 過濾器在 5×5 矩陣中,只可能有 3×3 種可能的位置。
這背后的數(shù)學(xué)解釋是,如果我們有一個(gè)n×n的圖像,用f×f的過濾器做卷積,那么輸出的維度就是(n?f+1)×(n?f+1)。在這個(gè)例子里是5?3+1=3,因此得到了一個(gè) 3×3 的輸出。
兩個(gè)問題
第一個(gè):每次做卷積操作,圖像就會縮小??赡茏隽藥状尉矸e之后,圖像就會變得很小了,可能會縮小到只有 1×1 的大小。
第二個(gè):原始圖片的邊緣位置在卷積核卷積的時(shí)候可能只被卷到一次。但中間位置可能會被卷積多次。所以那些在角落或者邊緣區(qū)域的像素點(diǎn)在輸出中采用較少,意味著卷積過程中丟掉了圖像邊緣位置的許多信息。
解決兩個(gè)問題的方式——填充
卷積神經(jīng)網(wǎng)絡(luò)中的填充操作是指在輸入數(shù)據(jù)周圍填充一定數(shù)量的虛擬數(shù)據(jù),以便在卷積操作時(shí)可以保持輸出數(shù)據(jù)的大小不變或者減少數(shù)據(jù)的尺寸損失。
?文章來源:http://www.zghlxwxcb.cn/news/detail-471438.html
為了解決這個(gè)問題,我們可以使用填充padding(填充),比如本例中,我們可以沿著圖像邊緣再填充一層像素(我們用p表示幾層,這里p=1)。那么5×5 的圖像就被填充成了一個(gè)7×7 的圖像。如果你用 3×3 的卷積核對這個(gè) 7×7 的圖像卷積,你得到的輸出就不是 3×3 的&#x文章來源地址http://www.zghlxwxcb.cn/news/detail-471438.html
到了這里,關(guān)于計(jì)算機(jī)視覺:填充(padding)技術(shù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!