目錄
前言
課題背景和意義
實(shí)現(xiàn)技術(shù)思路
一、?吸煙檢測(cè)方法
1.1?網(wǎng)絡(luò)總體結(jié)構(gòu)
1.2 CotNet Transformer 模塊
二、?數(shù)據(jù)集
三、實(shí)驗(yàn)及結(jié)果分析
3.1?實(shí)驗(yàn)環(huán)境搭建
3.2?結(jié)果分析
實(shí)現(xiàn)效果圖樣例
最后
前言
? ? ??大四是整個(gè)大學(xué)期間最忙碌的時(shí)光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準(zhǔn)備,一邊要為畢業(yè)設(shè)計(jì)耗費(fèi)大量精力。近幾年各個(gè)學(xué)校要求的畢設(shè)項(xiàng)目越來(lái)越難,有不少課題是研究生級(jí)別難度的,對(duì)本科同學(xué)來(lái)說(shuō)是充滿挑戰(zhàn)。為幫助大家順利通過(guò)和節(jié)省時(shí)間與精力投入到更重要的就業(yè)和考試中去,學(xué)長(zhǎng)分享優(yōu)質(zhì)的選題經(jīng)驗(yàn)和畢設(shè)項(xiàng)目與技術(shù)思路。
??對(duì)畢設(shè)有任何疑問(wèn)都可以問(wèn)學(xué)長(zhǎng)哦!
?? ?選題指導(dǎo):
? ? ? ? 最新最全計(jì)算機(jī)專業(yè)畢設(shè)選題精選推薦匯總
? ? ? ??大家好,這里是海浪學(xué)長(zhǎng)畢設(shè)專題,本次分享的課題是
? ? ? ???基于深度學(xué)習(xí)的吸煙檢測(cè)識(shí)別系統(tǒng)
課題背景和意義
近年來(lái),隨著深度學(xué)習(xí)技術(shù)的迅速崛起,基于煙支目標(biāo)檢測(cè)的吸煙行為檢測(cè)逐漸成為了吸煙行為檢測(cè)領(lǐng)域的研究熱點(diǎn)。這種方法利用深度學(xué)習(xí)技術(shù)提取具有強(qiáng)魯棒性的煙支物體特征,能夠更加準(zhǔn)確地判斷圖像中是否存在吸煙行為。
實(shí)現(xiàn)技術(shù)思路
一、?吸煙檢測(cè)方法
1.1?網(wǎng)絡(luò)總體結(jié)構(gòu)
? ? ? ?作為目前YOLO系列最成熟的目標(biāo)檢測(cè)算法,YOLOv5是一種端到端的深度學(xué)習(xí)模型,可以直接從原始圖像中檢測(cè)和定位目標(biāo)。它使用CNN來(lái)學(xué)習(xí)圖像中物體的特征,并使用多尺度預(yù)測(cè)和網(wǎng)格分割來(lái)檢測(cè)和定位目標(biāo),其優(yōu)勢(shì)在于它可以在高速運(yùn)行,并且可以在不同的圖像分辨率上很好地工作。YOLOv5的網(wǎng)絡(luò)結(jié)構(gòu)分為Backbone、Neck以及Head部分,其中Backbone主要使用新穎的CSP-Darknet53結(jié)構(gòu)。
? ? ? ?Backbone部分:YOLOv5最新版本的Backbone去除了Focus模塊(便于模型導(dǎo)出部署),Backbone主要由CBS、Bottleneck CSP以及SPPF等組成,CBS模塊,即Conv、Batch-Norm、SiLU組成,可以很好的輔助C3層進(jìn)行特征提取。在Backbone網(wǎng)絡(luò)的最后將SPP層換成了SPPF層,SPPF結(jié)構(gòu)是將輸入串行通過(guò)多個(gè)5x5大小的MaxPool層,相比較SPP結(jié)構(gòu),SPPF的計(jì)算量減少到原來(lái)的2倍左右,并且能夠更好的增強(qiáng)了Backbone特征表達(dá)能力。
? ? ? ?FPN主要是通過(guò)融合高低層特征提升目標(biāo)檢測(cè)的效果,尤其可以提高小尺寸目標(biāo)的檢測(cè)效果。在FPN的基礎(chǔ)上加了一個(gè)自底向上方向的增強(qiáng),使得頂層feature map也可以享受到底層帶來(lái)的豐富的位置信息,從而提升了大目標(biāo)物體的檢測(cè)效果。
1.2 CotNet Transformer 模塊
? ? ? ?傳統(tǒng)的自注意力很好地觸發(fā)了不同空間位置的特征交互,具體取決于輸入本身。然而,在傳統(tǒng)的自注意力機(jī)制中,所有成對(duì)的查詢和鍵的關(guān)系都是通過(guò)孤立的查詢和鍵對(duì)獨(dú)立學(xué)習(xí)得到的,而無(wú)需探索其間的豐富上下文。這嚴(yán)重限制了自注意力學(xué)習(xí)在2D特征圖上進(jìn)行視覺(jué)表示學(xué)習(xí)的能力。Contextual Transformer (COT)模塊,它將上下文信息挖掘和自我注意學(xué)習(xí)集成到一個(gè)統(tǒng)一的體系結(jié)構(gòu)中,有效地促進(jìn)自注意學(xué)習(xí),增強(qiáng)輸出聚合特征圖的代表能力。
? ? ? ?為了提高特征提取能力,在視覺(jué)識(shí)別過(guò)程中使用了COT模塊,修改YOLOv5的Backbone部分,將原始C3模塊改為COT3模塊,充分利用輸入按鍵之間的上下文信息來(lái)指導(dǎo)動(dòng)態(tài)注意矩陣的學(xué)習(xí),從而增強(qiáng)視覺(jué)表示能力,達(dá)到增強(qiáng)特征提取的能力。
? ? ? ?CBAM是一種輕量的注意機(jī)制模塊,它包括CAM(Channel Attention Module)和SAM(Spatial Attention Module),即通道注意模塊和空間注意模塊,兩個(gè)注意力模塊采用串聯(lián)的方式,可以在空間和通道上進(jìn)行注意力機(jī)制,沿著通道和空間兩個(gè)維度推斷出注意力權(quán)重系數(shù),然后再與feature map相乘。
? ? ? ?為了增強(qiáng)特征提取能力的同時(shí)保證模型輕量化的目的,將CBAM注意力機(jī)制模塊插入到COT3模塊和SPPF中間,利用通道注意力機(jī)制加空間注意力增強(qiáng)輸入特征,來(lái)提高后續(xù)的檢測(cè)精度。
二、?數(shù)據(jù)集
? ? ? ?由于吸煙檢測(cè)目前沒(méi)有相關(guān)的公開(kāi)視頻數(shù)據(jù)集和圖像數(shù)據(jù)集,為了更好的驗(yàn)證提出的算法改進(jìn)的有效性和合理性,使用人工標(biāo)記的吸煙檢測(cè)數(shù)據(jù)集,首先收集了4860張含有吸煙行為的圖像,其中包括室內(nèi)、室外不同場(chǎng)景下的不同吸煙動(dòng)作,并對(duì)每張圖片使用labelimg進(jìn)行人工標(biāo)注,統(tǒng)一標(biāo)簽為"smoking",最后按照8:2的比例隨機(jī)分為訓(xùn)練集和驗(yàn)證集。
? ? ? ?為了解決數(shù)據(jù)集圖片中小目標(biāo)較少的問(wèn)題,將數(shù)據(jù)輸入YOLOv5檢測(cè)器之前先對(duì)其進(jìn)行數(shù)據(jù)預(yù)處理,如Mosaic數(shù)據(jù)增強(qiáng)、旋轉(zhuǎn)、平移等操作。首先將圖片進(jìn)行隨機(jī)裁剪,并將四張經(jīng)過(guò)旋轉(zhuǎn)角度或平移后的圖片拼接在一起,變相提高了batch_size,同時(shí)圖片中小目標(biāo)數(shù)量增多,可以有效提高模型的泛化能力,防止由于數(shù)據(jù)集過(guò)于簡(jiǎn)單出現(xiàn)的模型過(guò)擬合現(xiàn)象。
三、實(shí)驗(yàn)及結(jié)果分析
3.1?實(shí)驗(yàn)環(huán)境搭建
? ? ? ?此次實(shí)驗(yàn)代碼基于 Python3.9,使用版本號(hào)為 1.11 的 Pytorch 深度學(xué)習(xí)框架構(gòu)建網(wǎng)絡(luò)模型。在小樣本條件下,由于訓(xùn)練樣本圖片較少,訓(xùn)練和驗(yàn)證時(shí)間較短,但深度學(xué)習(xí)模型的訓(xùn)練和推理的過(guò)程中將會(huì)占用大量的顯存。
3.2?結(jié)果分析
? ? ? ?使用常用的目標(biāo)檢測(cè)評(píng)估指標(biāo)對(duì)本文實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)估,包括mAP_0.5、mAP_0.5:0.95、Precision、Recall和F1-score。
? ? ? ?將選用的基準(zhǔn)模型YOLOv5s和YOLOv3tiny算法模型進(jìn)行實(shí)驗(yàn)對(duì)比,將預(yù)處理的數(shù)據(jù)輸入改進(jìn)后的模型中進(jìn)行訓(xùn)練并測(cè)試,其次在訓(xùn)練過(guò)程中Batch_size設(shè)置為20,迭代次數(shù)設(shè)置為200輪,使用隨機(jī)梯度下降算法完成訓(xùn)練過(guò)程中的反向傳播,并使用Adam優(yōu)化器自適應(yīng)的調(diào)整學(xué)習(xí)率,幫助模型可以快速收斂。
? ? ? ?首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,使得訓(xùn)練數(shù)據(jù)可以幫助模型獲得更強(qiáng)的泛化能力。隨后對(duì)模型結(jié)構(gòu)進(jìn)行改進(jìn),使用CotNet Transformer結(jié)構(gòu)替換原YOLOv5s骨干網(wǎng)絡(luò)中的C3模塊,提升了骨干網(wǎng)絡(luò)的特征提取能力;同時(shí)在YOLOv5s的特征融合部分引入CBAM注意力機(jī)制,使得模型可以充分利用空間信息和通道信息,進(jìn)一步加強(qiáng)對(duì)特征圖有用信息的提取。
? ? ? ?使用改進(jìn)的吸煙檢測(cè)算法對(duì)吸煙場(chǎng)景進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法可以有效提取出不同場(chǎng)景中存在的吸煙行為,其中場(chǎng)景包括室內(nèi)室外、遠(yuǎn)距離采集與近距離采集及各種復(fù)雜動(dòng)作和遮擋問(wèn)題。
實(shí)現(xiàn)效果圖樣例
最后
我是海浪學(xué)長(zhǎng),創(chuàng)作不易,歡迎點(diǎn)贊、關(guān)注、收藏。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-809387.html
畢設(shè)幫助,疑難解答,歡迎打擾!文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-809387.html
到了這里,關(guān)于畢業(yè)設(shè)計(jì)選題-基于深度學(xué)習(xí)的吸煙檢測(cè)識(shí)別系統(tǒng) 人工智能 機(jī)器學(xué)習(xí) YOLO的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!