? ? ? 大家好,我是帶我去滑雪!
? ? ? 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種基于深度學(xué)習(xí)的前饋神經(jīng)網(wǎng)絡(luò),主要用于圖像和視頻識(shí)別、分類、分割和標(biāo)注等計(jì)算機(jī)視覺(jué)任務(wù)。它主要由卷積層、池化層、全連接層和激活函數(shù)層等組成。其中,卷積層通過(guò)一組卷積核(權(quán)值矩陣)提取輸入圖像的不同特征、對(duì)其進(jìn)行特征提取和抽象;池化層則通過(guò)降采樣的方式減小特征圖的大小,提高模型的泛化能力;全連接層則負(fù)責(zé)將卷積層和池化層的輸出映射到模型最后的分類結(jié)果上。最后,激活函數(shù)層利用非線性變換使模型更加具有表達(dá)能力和擬合能力。下面依次學(xué)習(xí)關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)知識(shí)。
目錄
1、認(rèn)識(shí)圖像數(shù)據(jù)
2、卷積運(yùn)算與池化運(yùn)算
(1)卷積運(yùn)算? ? ??
(2)池化運(yùn)算
3、卷積神經(jīng)網(wǎng)絡(luò)的處理過(guò)程
4、卷積層
(1)局部連接
(2)權(quán)重共享
5、多維數(shù)據(jù)的卷積層輸入與輸出
6、Dropout層
1、認(rèn)識(shí)圖像數(shù)據(jù)
? ? ? 位圖是一種圖像文件格式,也叫做柵格圖像(Raster Image),它是由象素組成的圖像。簡(jiǎn)單來(lái)說(shuō),一個(gè)位圖就是由很多個(gè)像素點(diǎn)組成的。每個(gè)像素點(diǎn)可以保存圖像中的顏色信息和位置信息,其大小和位數(shù)決定著位圖的清晰度和占用的存儲(chǔ)空間。 在位圖圖像中,每個(gè)像素點(diǎn)只能表示一種顏色,且顏色深度是固定的。由于是由固定數(shù)量的像素點(diǎn)組成的,所以縮放、旋轉(zhuǎn)等圖像變換會(huì)使圖像出現(xiàn)鋸齒等失真現(xiàn)象。位圖通常用于存儲(chǔ)比較簡(jiǎn)單的圖形、圖標(biāo)、照片等,常見(jiàn)的位圖格式有BMP、JPEG、GIF、PNG等。
? ? ?卷積神經(jīng)網(wǎng)絡(luò)處理的就是位圖,位圖類似矩陣,每一個(gè)像素是矩陣中的一個(gè)元素,依據(jù)像素色彩分為兩種:
- 黑白圖:每一個(gè)像素的元素值為0~255的灰度值;
- 彩色圖:每一個(gè)像素的元素值為RGB紅藍(lán)綠三原色值的向量,稱為通道,三個(gè)值的范圍均為0~255,其中黑色為[0,0,0],白色為[255,255,255],紅色為[255,0,0],綠色為[0,255,0],藍(lán)色為[0,0,255]。
? ? ? 卷積神經(jīng)網(wǎng)絡(luò)是模仿人腦視覺(jué),使用特征來(lái)識(shí)別圖片,下面學(xué)習(xí)卷積運(yùn)算和池化運(yùn)算。
2、卷積運(yùn)算與池化運(yùn)算
(1)卷積運(yùn)算? ? ??
? ? ? 卷積運(yùn)算(Convolutional operation):卷積運(yùn)算是指利用卷積核在圖像或特征圖上進(jìn)行卷積操作,得到一系列新的卷積特征圖。卷積核通常是一個(gè)小的矩陣,它在原始圖像上按照步長(zhǎng)移動(dòng),并與圖片像素一一對(duì)應(yīng)地相乘并求和,最終將卷積核的所有結(jié)果匯總在一起形成一個(gè)新的特征圖。卷積運(yùn)算通過(guò)不斷地提取特征,將圖像或特征圖逐漸壓縮和減小,使得后續(xù)的神經(jīng)網(wǎng)絡(luò)處理更加高效。
(2)池化運(yùn)算
? ? ? ?池化運(yùn)算(Pooling operation):池化運(yùn)算是對(duì)卷積特征圖進(jìn)行壓縮或減小的一種操作,通常使用的是最大池化或平均池化,即在每個(gè)小的窗口內(nèi)求取最大值或平均值,并將這個(gè)值作為該窗口的池化結(jié)果,池化運(yùn)算一樣采用滑動(dòng)窗格。池化運(yùn)算可以降低特征圖的數(shù)據(jù)量,減少運(yùn)算量,防止過(guò)擬合,同時(shí)能保留特征圖的主要特征,使得神經(jīng)網(wǎng)絡(luò)更加易于訓(xùn)練和泛化。
? ? ? 卷積和池化在卷積神經(jīng)網(wǎng)絡(luò)中頻繁使用,它們相輔相成,相互配合,共同完成圖像特征的提取和抽取。
3、卷積神經(jīng)網(wǎng)絡(luò)的處理過(guò)程
? ? ?卷積神經(jīng)網(wǎng)絡(luò)的處理過(guò)程:
? ? ? 卷積神經(jīng)網(wǎng)絡(luò)到底學(xué)習(xí)什么呢?卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)卷積層的權(quán)重,即濾波器,首先使用隨機(jī)數(shù)初始化濾波器的矩陣內(nèi)容,然后使用正向和反向傳播學(xué)習(xí)權(quán)重后,濾波器可以自動(dòng)識(shí)別圖片所需提取的特征。
4、卷積層
? ? ? ?卷積神經(jīng)網(wǎng)絡(luò)的卷積層,是卷積神經(jīng)網(wǎng)絡(luò)的主要組成部分之一,也是卷積神經(jīng)網(wǎng)絡(luò)中最核心的層之一。卷積層的操作是將位圖原來(lái)點(diǎn)對(duì)點(diǎn)的全域比對(duì),轉(zhuǎn)換為濾波器較小范圍的局部對(duì)比,通過(guò)局部小范圍一塊一塊的特征研判來(lái)綜合出識(shí)別的結(jié)果。
? ? ? 卷積層和全連接層有合不同:
- 在卷積神經(jīng)網(wǎng)絡(luò)中,使用全連接層,神經(jīng)網(wǎng)絡(luò)的參數(shù)量過(guò)大;
- 卷積層相比于全連接層,可以實(shí)現(xiàn)局部連接與權(quán)重共享;
(1)局部連接
? ? ? ?卷積神經(jīng)網(wǎng)絡(luò)使用局部連接,從局部擴(kuò)展至全域,一個(gè)一個(gè)小區(qū)域去認(rèn)識(shí),通過(guò)從各個(gè)小區(qū)域得到局部特征后,然后匯總局部特征得到完整的全域信息。
(2)權(quán)重共享
? ? ? ?權(quán)重共享是指每一個(gè)局部連接的神經(jīng)元都使用相同的權(quán)重,使用權(quán)重共享后神經(jīng)網(wǎng)絡(luò)的參數(shù)個(gè)數(shù)將會(huì)大大下降。
5、多維數(shù)據(jù)的卷積層輸入與輸出
(1)卷積層的輸入通道數(shù)根據(jù)圖片而定,彩色圖的通道數(shù)為3,灰度圖的通道數(shù)為1。
(2)濾波器的通道數(shù)和卷積層的輸入通道數(shù)相同。
(3)卷積層的輸出通道數(shù)需根據(jù)濾波器的數(shù)量而定,而卷積層的輸出通道就是下一層卷積層的輸入通道數(shù)。
6、Dropout層
? ? ?? Dropout層是神經(jīng)網(wǎng)絡(luò)的一種優(yōu)化方法,可以在不增加訓(xùn)練數(shù)據(jù)集的情況下,對(duì)抗過(guò)擬合問(wèn)題。Dropout層的目的是在損失函數(shù)中加入隨機(jī)性,破壞各層神經(jīng)元之間的共適性來(lái)修正前一層神經(jīng)層學(xué)習(xí)方向的錯(cuò)誤,能夠讓預(yù)測(cè)模型更加強(qiáng)壯,并提升預(yù)測(cè)模型的泛化性。
更多優(yōu)質(zhì)內(nèi)容持續(xù)發(fā)布中,請(qǐng)移步主頁(yè)查看。
若有問(wèn)題可郵箱聯(lián)系:1736732074@qq.com?
博主的WeChat:TCB1736732074文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-451603.html
? ?點(diǎn)贊+關(guān)注,下次不迷路!文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-451603.html
到了這里,關(guān)于深度學(xué)習(xí)之卷積神經(jīng)網(wǎng)絡(luò)(CNN)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!