參考論文:Very Deep Convolutional Networks for Large-Scale Image Recognition
結(jié)構(gòu)組成
論文中提供的6種網(wǎng)絡(luò)配置:
整個(gè)網(wǎng)絡(luò)有5個(gè)vgg-block塊和5個(gè)maxpool層逐個(gè)相連,然后進(jìn)入FC層,直到最后1000個(gè)softmax輸出。多種VGG網(wǎng)絡(luò)設(shè)計(jì)都很統(tǒng)一,都有相同的224×224×3的input層+5個(gè)maxpool層+3層fc全連接層,區(qū)別在于中間的Vgg-block塊的設(shè)計(jì)不同。
以上圖D列的vgg16為例:
input:
224×224×3 三通道(RGB)的圖像;
vgg-block:
輸入224×224×3,經(jīng)過(guò)64個(gè)filter(kernelsize=(3,3,3)),stride = 1,padding=same后,得224×224×64;
Max-pooling:
輸入224×224×64,經(jīng)過(guò)pool size=2,stride=2后,得112×112×64;
vgg-block:
輸入112×112×64,經(jīng)128個(gè)filter(kernelsize=(3,3,64)),得到112×112×128;
Max-pooling:
輸入112×112×128,經(jīng)pool size = 2,stride = 2后,得56×56×128;
vgg-block
輸入56×56×128,經(jīng)過(guò)256個(gè)filter(kernelsize=(3,3,128))后,得56×56×256;
Max-pooling
輸入56×56×256,經(jīng)pool size = 2,stride = 2后,得28×28×256;
vgg-block:
輸入28×28×256,經(jīng)過(guò)512個(gè)filter(kernelsize=(3,3,256))后,得28×28×512;
Max-pooling
輸入28×28×512,經(jīng)pool size = 2,stride = 2后,得14×14×512;
vgg-block:
輸入14×14×256,經(jīng)過(guò)512個(gè)filter(kernelsize=(3,3,512))后,得14×14×512;
Max-pooling
輸入14×14×512,經(jīng)pool size = 2,stride = 2后,得7×7×512,展平(Flattern)得25088個(gè)參數(shù);
Dense
輸入(25088,),經(jīng)過(guò)4096個(gè)神經(jīng)元,得(4096,);
Dense
輸入(4096,),經(jīng)過(guò)4096個(gè)神經(jīng)元,得(4096,);文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-470059.html
Dense
輸入(4096,),經(jīng)過(guò)1000個(gè)神經(jīng)元,得(1000,)。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-470059.html
其中前兩層全連接層在使用relu后還使用了Dropout(rate=0.5)對(duì)神經(jīng)元隨機(jī)失活,最后一層全連接層用softmax輸出1000個(gè)分類(lèi)。
特點(diǎn)
論文提出,通過(guò)堆疊2個(gè) 3*3 的卷積核來(lái)代替 5*5 的卷積核;堆疊3個(gè) 3*3 的卷積核來(lái)代替 7*7 的卷積核。雖然用了小的卷積核來(lái)替換大的卷積核,但并不會(huì)影響感受野,即感受野是相同的,但減少了參數(shù)。
到了這里,關(guān)于VGG網(wǎng)絡(luò)結(jié)構(gòu)詳解的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!