先看卷積是啥,url: https://www.bilibili.com/video/BV1JX4y1K7Dr/?spm_id_from=333.337.search-card.all.click&vd_source=7a1a0bc74158c6993c7355c5490fc600
下面這個(gè)式子就是卷積
看完了,感覺似懂非懂
下一個(gè)參考視頻:https://www.youtube.com/watch?v=E5Z7FQp7AQQ&list=PLuhqtP7jdD8CD6rOWy20INGM44kULvrHu
視頻1:簡(jiǎn)單介紹卷積神經(jīng)網(wǎng)絡(luò)的意義,以及它的大概原理
先講一個(gè)簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域里缺點(diǎn)
如上圖,一個(gè) 1000 * 1000 的 RGB 圖像,這里一共需要 1000 * 1000 * 3 = 三百萬 個(gè)輸入神經(jīng)元
隨后,它的第一個(gè)隱藏層包含 1000 個(gè)神經(jīng)元。這樣來看,輸入層和第一個(gè)隱藏層之間的邊(連接)一共有 三百萬 * 1000 = 三十億
這是一個(gè)非常大的數(shù)字,如果我們要去訓(xùn)練這樣的一個(gè) 權(quán)重矩陣,將會(huì)耗費(fèi)巨大的時(shí)間
此外,過量的參數(shù)和過大的權(quán)重矩陣通常也意味著 過擬合
這就是為什么需要卷積神經(jīng)網(wǎng)絡(luò),它在圖像識(shí)別和視頻識(shí)別領(lǐng)域要遠(yuǎn)強(qiáng)于簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)的思想如下:
使用 filters(滑動(dòng)窗口) 去提取圖像中的特征。
圖像有一個(gè)特性,就是它會(huì)有邊、形狀、顏色。
CNN 的 filters 的任務(wù)就是檢測(cè)圖像里的上述特征,如下圖
上圖使用兩個(gè)filter 去提取圖像特征,分別是提取水平邊 和 垂直邊。filter(滑動(dòng)窗口)的大小僅僅為 3* 3 = 9 像素
卷積神經(jīng)網(wǎng)絡(luò)中的 單層神經(jīng)元 會(huì)使用大量這樣的 filters
這些 filters 可能會(huì)檢測(cè)我們圖像里的邊,隨后這些邊傳給 更深的隱藏層,這些隱藏層可能會(huì)檢測(cè)出 人臉的局部特征。、
再更深層的神經(jīng)網(wǎng)絡(luò)則可能會(huì)檢測(cè)出整張人臉。接著這些人臉特征可以和一個(gè) label “人類” 聯(lián)系起來,從而幫助我們檢測(cè)到人類。
這里減少的開銷:三十億參數(shù) -> 很少的參數(shù) 增加的開銷:sliding window
視頻2:CNN 中的卷積操作到底是什么?
如上圖,卷積其實(shí)就是拿一個(gè) 3*3 的矩陣去乘以圖像矩陣,具體請(qǐng)看視頻 3:35
為什么卷積操作能夠提取圖像特征?如圖所示,棕色的卷積矩陣可以提取灰度圖中的 垂直邊,具體請(qǐng)看 5:05
相應(yīng)的,提取垂直邊的是上面的卷積矩陣,提取水平邊的是下面的卷積矩陣 (或者叫做 filter)
遇到 RGB 圖怎么辦呢?簡(jiǎn)單,我們也用一個(gè) 乘以3 的 filter (也就是一共 27 個(gè)值) 去做卷積,隨后產(chǎn)出一個(gè)特征圖
我們用多少個(gè) filter 就會(huì)產(chǎn)出多少個(gè) 特征圖。
這里提示一下,filter 里的值實(shí)際上就是 卷積神經(jīng)網(wǎng)絡(luò) 里的 參數(shù),它們通常由訓(xùn)練得來。
視頻3:卷積神經(jīng)網(wǎng)絡(luò)中的 padding ,為什么需要 padding?
之前介紹的 CNN 有兩個(gè)限制。
限制1:經(jīng)過卷積操作后,圖像會(huì)變小,也就說經(jīng)過了很多層卷積后,圖像可能變得非常小,丟掉很多信息。如下圖
限制2:角落的像素沒有收到足夠多的關(guān)注。如下圖。
左上角的 pixel 在做卷積操作的時(shí)候只會(huì)參與一次,而中心的 pixel 則會(huì)參與多次
解決方案就是給圖像加上 padding,我們可以加一層 padding,也可以加兩層三層,下圖展示加一層 padding 的情形
從上圖可以看到,加了 padding 之后,產(chǎn)出的圖像是 6*6,尺寸和原圖一樣
此外,左上角的 pixel 也參與了多次卷積操作
如上圖,一般來說,卷積操作有兩種選擇:文章來源:http://www.zghlxwxcb.cn/news/detail-716012.html
- Valid 。不使用任何 padding
- Same。卷積后產(chǎn)出的特征圖,尺寸和原圖一樣。
一般而言,filter滑動(dòng)窗口的邊長(zhǎng)會(huì)使用奇數(shù),否則,padding 需要使用非對(duì)稱 padding文章來源地址http://www.zghlxwxcb.cn/news/detail-716012.html
到了這里,關(guān)于什么是 CNN? 卷積神經(jīng)網(wǎng)絡(luò)? 怎么用 CNN 進(jìn)行分類?(1)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!