摘 要:
目前中國貨運鐵路和既有線鐵路采用的仍是司機通過瞭望鐵路沿線信號燈來指導行駛。本文介紹了一種基于卷積神經(jīng)網(wǎng)絡(CNN)的鐵路信號“三顯示”通過信號機識別方法,為司機二次甄別信號燈顏色。本文制作“三顯示”信號燈數(shù)據(jù)集,在 TensorFlow 平臺搭建卷積神經(jīng)網(wǎng)絡,建立以卷積層數(shù)、數(shù)據(jù)集大小以及迭代次數(shù)為變量的對比實驗。在樣本條件下,4 層卷積網(wǎng)絡特征提取效果最優(yōu),進一步進行卷積層中卷積核的深度對網(wǎng)絡收斂性和收斂速度與識別精度的影響的實驗,最終,最優(yōu)網(wǎng)絡下識別率可
達 99.16%。
1 引言
鐵路運輸是我國交通運輸領域的重要組成部分,目前,我國既有線鐵路仍有部分線路需司機瞭望以獲取信號燈顏色。為保障鐵路運輸安全,同時為司機提供準確參考信息,本文采用卷積神經(jīng)網(wǎng)絡對鐵路信號色燈進行識別。
本文著重闡述在以下兩種卷積神經(jīng)網(wǎng)絡的基礎上自行設計的網(wǎng)絡結構提出、進展和最終效果。隨著Hinton 等[1]人解決了深度學習模型優(yōu)化問題,深度學習得到迅速發(fā)展?;?1998 年 LeCun 等[2]提出并首先成功應用于數(shù)字識別問題的卷積神經(jīng)網(wǎng)絡 LeNet-5和 2014 年由牛津大學提出并準確進行圖像分類和目標 檢 測 的 卷 積 神 經(jīng) 網(wǎng) 絡 VGG (Visual geometrygroup)[3]設計出能夠準確識別信號燈信號卷積神經(jīng)網(wǎng)絡。其中,LeNet-5 由以 32321 的單通道圖像像素作為輸入,經(jīng) 2 層卷積 3 層全連接組成,并在小規(guī)模手寫數(shù)字識別中取得較好結果。VGG以 2242243的三通道圖像像素作為輸入,經(jīng) 13 層卷積 3 層全連接組成,并在 2014 年的 ILSVRC 比賽中,在 Top-5中取得了 92.3%的正確率。不同于其他深度學習框架,卷積神經(jīng)網(wǎng)絡具有位移、畸變魯棒性,并行性等特點,是基于深度學習理論的人工神經(jīng)網(wǎng)絡,其中的卷積結構既可減少深層網(wǎng)絡占用空間,也可減少網(wǎng)絡參數(shù)數(shù)量,緩解模型過擬合。本文通過制作“三顯示”信號燈數(shù)據(jù)集,在TensorFlow 平臺搭建多層卷積神經(jīng)網(wǎng)絡,建立以卷積層數(shù)(4、5、6 層)、卷積層中不同卷積核個數(shù)為變量的對比實驗,最終找到最優(yōu)卷積神經(jīng)網(wǎng)絡結構并完成對鐵路信號色燈的正確識別。
2 卷積神經(jīng)網(wǎng)絡模型
2.1 卷積神經(jīng)網(wǎng)絡結構
卷積神經(jīng)網(wǎng)絡由多個神經(jīng)網(wǎng)絡層構成,每層神經(jīng)網(wǎng)絡由多個神經(jīng)元組成,其結構如圖 1 所示。
卷積神經(jīng)網(wǎng)絡可分為:輸入層、卷積層、池化層、全連接層和輸出層。具體介紹如下:
(1)輸入層:通過對輸入圖像進行讀寫操作,將原圖轉化成像素值傳入到輸入層。
(2)卷積層:卷積核滑動進行卷積運算,提取輸入層圖像特征。卷積核維度和個數(shù)均會對輸入特征提取量產生影響。
(3)池化層:同樣有與卷積核相似的池化核對卷積層圖像進行子抽樣,在保證了有用信息不降低的前提下,減少數(shù)據(jù)處理量。
(4)全連接層:可含有多個全連接層,代表神經(jīng)網(wǎng)絡中的隱藏層部分,第一層與上一層池化層輸出相連。
(5)輸出層:輸出層的設計取決于卷積神經(jīng)網(wǎng)絡所需結果,一般為分類器。
2.2.1 卷積層
通過一個可學習卷積核和一個激活函數(shù),即可得
到一個輸出特征圖。卷積核的維度和個數(shù)不同使得特
征圖不同,卷積層計算公式為
2.2.2 池化層
池化的原理是將上一層輸出特征圖進行縮小,即
2.2.3 全連接層
全連接層中,將上一層所得特征圖數(shù)據(jù)拉伸為一維特征作為全連接層輸入。全連接層輸出通過對輸入加權求和并通過激活函數(shù)的響應得到
3 卷積神經(jīng)網(wǎng)絡算法實現(xiàn)
3.1 數(shù)據(jù)集制作
本文信號燈數(shù)據(jù)集來源于鐵路信號實驗室,拍攝鐵路信號燈視頻,運用 AdobePremiere Pro CC 2015 分幀得到大量圖片。將數(shù)據(jù)集中信號燈圖片分為紅色、綠色、黃色共 3 類。每類選出 300 張圖片作為訓練集,100 張圖片作為測試集。該數(shù)據(jù)集包含不同視角的鐵路信號燈圖片,
3.2 卷積神經(jīng)網(wǎng)絡的訓練過程
3.2.1 前向傳播過程
本實驗卷積層網(wǎng)絡初始化主要采取兩種方式,分別為 Xavier 方式和正則化方式,偏置初始化為0.00001。全連接層權重初始化采取 Xavier 方式,偏
置初始化為 0. 1。本 實 驗 前 向 傳 播 訓 練 過 程 中 , 卷 積 層 采 用
Softmax 分類輸出,loss 采用交叉熵求平均,優(yōu)化器采用梯度下降 GDO 優(yōu)化器,并使用最小 minimize 取出損失。其中,全連接層使用 Dropout 隨機損失函數(shù)可避免網(wǎng)絡過擬合,學習率固定,未采用自適應學習率。輸入圖片數(shù)據(jù)時,批尺寸的圖片輸入采用訓練樣本隨機抽取形式。3.2.2 反向傳播過程在反向傳播算法中,主要訓練的網(wǎng)絡參數(shù)為:卷積層、全連接層網(wǎng)絡權重和各層網(wǎng)絡偏置參數(shù)。反向傳播算法主要基于梯度下降法,網(wǎng)絡參數(shù)被初始化后通過梯度下降法向訓練誤差 loss 減小方向調整。通過所有網(wǎng)絡層的靈敏度建立總誤差對所有網(wǎng)絡參數(shù)的偏導數(shù),進而得到使訓練誤差減小的方向。訓練流程圖如圖 4 所示。
4 實驗
針對 4 層卷積神經(jīng)網(wǎng)絡的結構,進一步修改網(wǎng)絡參數(shù),對比不同卷積層卷積核的個數(shù)對測試精度的影響,對卷積網(wǎng)絡訓練過程中收斂速度,測試精度進行對比試驗。
表 1 是我們設計出的幾組卷積核對比組,前面 6組按每個池化層分界組,按比例增加卷積核的個數(shù),后面 3 組對比不同層卷積核的排列順序,由少到多、由多到少的順序和均勻分布順序對實驗結果的影響, 由于選取的初始化方式可能導致的出現(xiàn)擬合現(xiàn)象,每個數(shù)量經(jīng)過多次的對比,可能存在實驗上的讀取數(shù)據(jù)出現(xiàn)誤差,以下網(wǎng)絡數(shù)量的選擇提供出了網(wǎng)絡收斂及穩(wěn)定性的比較。上表顯示了上述網(wǎng)絡經(jīng)過迭代以后最終趨于穩(wěn)定時我們用測試集測出的精度結果,由于迭代到后期訓練 loss 損失很小接近于 0,所以我們選取
的是迭代次數(shù)在25000次以內的測試精度趨于不變時的網(wǎng)絡的轉折點作為網(wǎng)絡的穩(wěn)定時測試精度,其中網(wǎng)絡隨著迭代次數(shù)的增加測試精度增加,逐漸趨于不變。
由上述實驗對比發(fā)現(xiàn),1-6 類的對比中隨著網(wǎng)絡中卷積核的增加收斂速度變慢,由于計算量的增加以及深度的增加網(wǎng)絡中參數(shù)的更新變得緩慢卷積核個
數(shù)為 80 個時可見針對本數(shù)據(jù)集大小與特征,網(wǎng)絡存在最優(yōu)值如圖 4 所示。其中網(wǎng)絡結構為均勻分布總數(shù)為 68 個的卷積核排列得到最快的收斂,倒敘排列的網(wǎng)絡在 25000 次迭代次數(shù)內,沒有收斂,而且網(wǎng)絡的個數(shù)增加的過程中,需要迭代次數(shù)增大才能達到相同收斂結果,同時前期訓練過程中網(wǎng)絡訓練精度波動增大,多次訓練同一網(wǎng)絡出現(xiàn)過擬合現(xiàn)象次數(shù)增多,表
明網(wǎng)絡損失未能按梯度進行下降。
第 7 類卷積核個數(shù)按照增序變化,網(wǎng)絡訓練過程中前期訓練中損失下降較少,中期過程時,有一階躍變化如圖 4,后期 loss 接近于 0。第 8 類時卷積核個數(shù)按照降序變化,網(wǎng)絡訓練過程中損失下降較快,在4400 輪迭代次數(shù)時,網(wǎng)絡陷入局部最優(yōu),此時損失已經(jīng)接近于0,網(wǎng)絡的測試精度在25000次時徘徊在0.5,可知網(wǎng)絡訓練采用降序影響網(wǎng)絡收斂較大,較難得到較高的測試精度。第 9 類卷積核選擇的是均勻順序,網(wǎng)絡收斂速度較為理想在 2500 輪迭代時已經(jīng)達到了0.89 的測試精度,并在 25000 輪時測試精度達到0.9324。由于卷積網(wǎng)絡層數(shù)多、訓練數(shù)據(jù)較少、訓練模型結構復雜及 Overtraining 擬合訓練數(shù)據(jù)中噪聲和訓練樣例沒有代表性特征等原因,導致網(wǎng)絡易出現(xiàn)過擬合現(xiàn)象。為更好的避免這種現(xiàn)象,可在原數(shù)據(jù)集基礎上
進行圖像銳化、明暗度調整等操作隨機加入噪聲;可采用合適的卷積模型卷積預處理后的數(shù)據(jù)集;也可添加正則項將權值大小加入損失函數(shù)以減少過度擬合。文章來源:http://www.zghlxwxcb.cn/news/detail-701180.html
5 結語
本文建立卷積神經(jīng)網(wǎng)絡對鐵路信號色燈圖片進行神經(jīng)網(wǎng)絡訓練,使用卷積神經(jīng)網(wǎng)絡提取鐵路信號色燈特征,通過目標特征提取池化,最終在信號燈樣本
圖片集下經(jīng)過對比試驗,在最優(yōu)范圍內的 4 層卷積神經(jīng)網(wǎng)絡,卷積核個數(shù)為 80 時,按照增序排布、分布較均勻的方式測試最高識別率為 99.16%,可通過在小范圍內進一步優(yōu)化得到更高的識別率。CNN 網(wǎng)絡在鐵路信號色燈識別上的應用將為鐵路司機提供信號燈信息參考,同時更大程度的保障鐵路行車安全。文章來源地址http://www.zghlxwxcb.cn/news/detail-701180.html
到了這里,關于【深度學習】基于卷積神經(jīng)網(wǎng)絡的鐵路信號燈識別方法的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!