B. Fu, S. Li, J. Wei, Q. Li, Q. Wang and J. Tu, “A Novel Intelligent Garbage Classification System Based on Deep Learning and an Embedded Linux System,” in IEEE Access, vol. 9, pp. 131134-131146, 2021, doi: 10.1109/ACCESS.2021.3114496.
摘要
垃圾數(shù)量的急劇增加和垃圾中物質(zhì)的復(fù)雜多樣性帶來了嚴(yán)重的環(huán)境污染和資源浪費(fèi)問題。回收可以減少廢物,但手工管道垃圾分揀工作環(huán)境惡劣,勞動強(qiáng)度大,分揀效率低。本文提出了一種基于深度學(xué)習(xí)和嵌入式Linux系統(tǒng)的智能垃圾分類系統(tǒng)。本系統(tǒng)分為三個部分。首先,采用樹莓派4B作為硬件系統(tǒng)的主控板。該系統(tǒng)的外圍設(shè)備由觸摸屏、傳感器、二自由度伺服系統(tǒng)和攝像機(jī)組成。其次,提出了一種基于遷移學(xué)習(xí)和改進(jìn)的MobileNetV3模型的垃圾分類GNet模型。第三,采用基于Python和QT的GUI構(gòu)建了人機(jī)交互系統(tǒng),便于系統(tǒng)操作和觀察。在華為垃圾分類挑戰(zhàn)杯數(shù)據(jù)集上進(jìn)行了一系列垃圾分類實(shí)驗(yàn)。該分類系統(tǒng)的預(yù)測準(zhǔn)確率為92.62%,效率為0.63 s。實(shí)驗(yàn)結(jié)果表明,本文提出的智能垃圾分類系統(tǒng)在準(zhǔn)確性和效率方面都具有較高的性能。
introduction
全球產(chǎn)生的垃圾數(shù)量正在增長,尤其是在發(fā)展中國家;并與人口增長和經(jīng)濟(jì)發(fā)展[1]有關(guān)。大量的垃圾造成了嚴(yán)重的環(huán)境污染和資源浪費(fèi)。解決這一垃圾問題的一個基本策略與固體廢物的“分類”和“回收”有關(guān)。近年來,越來越多的國家開始探索可持續(xù)發(fā)展的新型循環(huán)經(jīng)濟(jì)循環(huán)策略,以提高環(huán)境質(zhì)量。手工垃圾分類是應(yīng)用最廣泛的垃圾分類方式方法是目前最準(zhǔn)確的方法。不幸的是,這是耗時(shí)的,需要訓(xùn)練有素的操作人員,這嚴(yán)重限制了垃圾的分類。因此,迫切需要一種自動化的垃圾分類方法來解決這一日益嚴(yán)峻的挑戰(zhàn),并已成為世界范圍內(nèi)的研究熱點(diǎn)。
目前,各種自動化的垃圾分類方法已經(jīng)被提出。這些方法可以分為以下三組:機(jī)械方法(MAs)、物聯(lián)網(wǎng)方法(ITAs)和人工智能方法(AIAs)。垃圾自動分類系統(tǒng)采用微處理器、外部傳感器和機(jī)械傳動,有效替代人工垃圾分類。然而,現(xiàn)有的分類算法運(yùn)行在高性能的服務(wù)器或pc上,不能滿足垃圾分類系統(tǒng)的實(shí)際需求。因此,實(shí)現(xiàn)一個滿足現(xiàn)實(shí)世界需求的高度精確和高效的分類系統(tǒng)仍然是一個尚未解決的挑戰(zhàn)。
在本文中,我們將專注于嵌入式系統(tǒng)和深度學(xué)習(xí)來應(yīng)對這一挑戰(zhàn)。首先,在初步工作的基礎(chǔ)上,我們觀察到智能垃圾分類系統(tǒng)的成本和可維護(hù)性決定了該系統(tǒng)能否在實(shí)際應(yīng)用中得到應(yīng)用。嵌入式系統(tǒng)是一種特殊用途的計(jì)算系統(tǒng),用于應(yīng)用程序環(huán)境或在其他計(jì)算系統(tǒng)中提供專門的支持。嵌入式系統(tǒng)降低了垃圾分類系統(tǒng)的復(fù)雜性,簡化了安裝和維護(hù)任務(wù),從而降低了成本。其次,現(xiàn)有的垃圾分類圖像分類算法計(jì)算復(fù)雜度較高,通常需要大規(guī)模的標(biāo)記數(shù)據(jù)集。不幸的是,由于目前還不存在公共垃圾數(shù)據(jù)集,我們只能依賴于通過互聯(lián)網(wǎng)進(jìn)行圖像搜索,因此可用的數(shù)據(jù)有限[14]。因此,我們應(yīng)用遷移學(xué)習(xí)[15],并在大規(guī)模ImageNet數(shù)據(jù)集[17]上預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型[16],這有助于在沒有訓(xùn)練數(shù)據(jù)的情況下將知識從一個注解良好的數(shù)據(jù)集轉(zhuǎn)移到現(xiàn)實(shí)世界的應(yīng)用程序。遷移學(xué)習(xí)在[18]-[20]圖像分類的各個領(lǐng)域得到了廣泛的應(yīng)用。該策略可以有效地提高系統(tǒng)的精度和魯棒性。此外,還需要一個輕量級的網(wǎng)絡(luò)來匹配嵌入式Linux系統(tǒng)的計(jì)算能力。利用華為垃圾分類挑戰(zhàn)杯數(shù)據(jù)集進(jìn)行了一系列垃圾分類實(shí)驗(yàn),結(jié)果表明,所提出的垃圾分類系統(tǒng)預(yù)測準(zhǔn)確率為92.62%,效率為0.63 s。實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的智能垃圾分類系統(tǒng)具有較好的性能。
C. Zhihong, Z. Hebin, W. Yanbo, L. Binyan and L. Yu, “A vision-based robotic grasping system using deep learning for garbage sorting,” 2017 36th Chinese Control Conference (CCC), Dalian, China, 2017, pp. 11223-11226, doi: 10.23919/ChiCC.2017.8029147.
摘要
本文提出了一種基于機(jī)器視覺的垃圾自動分類機(jī)器人抓取系統(tǒng)。該系統(tǒng)在復(fù)雜背景中實(shí)現(xiàn)目標(biāo)物體的識別和定位,然后使用機(jī)械手自動抓取分揀對象。復(fù)雜背景中的物體識別是機(jī)器視覺算法試圖解決的關(guān)鍵問題。本文利用深度學(xué)習(xí)方法實(shí)現(xiàn)復(fù)雜背景中目標(biāo)對象的真實(shí)性識別。為了實(shí)現(xiàn)目標(biāo)對象的準(zhǔn)確抓取,我們應(yīng)用區(qū)域建議生成(RPN)和VGG-16模型進(jìn)行目標(biāo)識別和姿態(tài)估計(jì)。機(jī)器視覺系統(tǒng)將目標(biāo)物體的幾何中心坐標(biāo)和長邊角度的信息發(fā)送給機(jī)械手,機(jī)械手完成對目標(biāo)物體的分類和抓取。垃圾瓶子分揀實(shí)驗(yàn)結(jié)果表明,所提系統(tǒng)的視覺算法和機(jī)械手控制方法能夠高效實(shí)現(xiàn)垃圾分揀。
Fei Song, Ying Zhang, and Jing Zhang. 2020. Optimization of CNN-based Garbage Classification Model. In Proceedings of the 4th International Conference on Computer Science and Application Engineering (CSAE '20). Association for Computing Machinery, New York, NY, USA, Article 107, 1–5. https://doi.org/10.1145/3424978.3425089
摘要
本研究提出了一種新的城市垃圾垃圾自動分類算法,命名為DSCR-Net。該研究構(gòu)建了一個具有大樣本量的開源數(shù)據(jù)集。數(shù)據(jù)集的分類依據(jù)《上海市生活垃圾管理?xiàng)l例》,是首個采用這種分類方法的開源數(shù)據(jù)集。該研究提出的新算法借鑒了Inception-V4和ResNet網(wǎng)絡(luò),以方便遷移,并對模型的某些層進(jìn)行了調(diào)整。新算法在數(shù)據(jù)集上進(jìn)行了優(yōu)化和測試,準(zhǔn)確率為94.38%。
G. Yang et al., “Garbage Classification System with YOLOV5 Based on Image Recognition,” 2021 IEEE 6th International Conference on Signal and Image Processing (ICSIP), Nanjing, China, 2021, pp. 11-18, doi: 10.1109/ICSIP52628.2021.9688725.
摘要
目前,垃圾識別和分類的主要技術(shù)是利用傳統(tǒng)的機(jī)器視覺算法或利用傳感器對垃圾進(jìn)行篩選和識別,在垃圾分類中,首先對垃圾進(jìn)行準(zhǔn)確的識別和分類是非常必要的。通過采集各類垃圾圖片和建筑檢測數(shù)據(jù)集,采用基于YOLO-V5的垃圾識別檢測算法,利用數(shù)據(jù)增強(qiáng)提高模型的魯棒性,實(shí)現(xiàn)對不同類型垃圾的快速準(zhǔn)確識別。實(shí)驗(yàn)結(jié)果表明,該方法精度高,耗時(shí)短,魯棒性好。
CAO, Li; XIANG, Wei. Application of convolutional neural network based on transfer learning for garbage classification. In: 2020 IEEE 5th Information Technology and Mechatronics Engineering Conference (ITOEC). IEEE, 2020. p. 1032-1036.
摘要
針對推行全民垃圾分類的號召,本文提出了一種基于改進(jìn)的MobileNetV3-Large的智能垃圾分類系統(tǒng),通過軟硬件結(jié)合,提高全民垃圾分類意識。軟件模塊基于微信小程序,提供了圖像識別、文本識別、語音識別、積分測驗(yàn)等功能。硬件模塊基于樹莓派,包括圖像拍攝、圖像識別、自動分類和自動公告等功能。用于圖像分類的算法模型采用了基于MobileNetV3-Large的網(wǎng)絡(luò)模型。該網(wǎng)絡(luò)模型通過深度可分離卷積、逆殘差結(jié)構(gòu)、輕量級注意結(jié)構(gòu)和硬swish激活函數(shù)對垃圾圖像進(jìn)行分類。文本分類模型采用基于LSTM的網(wǎng)絡(luò)模型,通過詞嵌入提取文本特征,增強(qiáng)垃圾文本分類效果。經(jīng)過測試,該系統(tǒng)可以利用深度學(xué)習(xí)實(shí)現(xiàn)垃圾智能分類。結(jié)果表明,該算法模型的圖像識別準(zhǔn)確率可達(dá)81%,文本識別準(zhǔn)確率可達(dá)97.61%。
通常,當(dāng)神經(jīng)網(wǎng)絡(luò)更深入時(shí),模型可以適應(yīng)更復(fù)雜的結(jié)果。但在實(shí)際訓(xùn)練過程中,模型越深,結(jié)果不一定越好,很可能會產(chǎn)生較差的擬合效果和梯度消失。但是ResNet的網(wǎng)絡(luò)結(jié)構(gòu)龐大,操作多,對硬件支持要求高。在本研究中,我們選擇MobieNetV3作為圖像識別模型的基礎(chǔ),該模型調(diào)用了深度分離卷積和1 × 1提升維度層。它還提供了較高的精度和較少的參數(shù)和操作,可以輕松部署在硬件不足的環(huán)境中,如樹莓派。同時(shí)引入了注意機(jī)制,對不同層的輸出權(quán)重具有較高的自適應(yīng)能力,在一定程度上提高了模型的精度。
FATHURRAHMAN, Haris Imam Karim; MA’ARIF, Alfian; CHIN, Li-Yi. The Development of Real-Time Mobile Garbage Detection Using Deep Learning. Jurnal Ilmiah Teknik Elektro Komputer dan Informatika (JITEKI), 2022, 7.3: 472.
摘要
世界上的垃圾問題是一個必須解決的嚴(yán)重問題。無論是現(xiàn)在還是將來,良好的垃圾管理都是必須的。良好的垃圾管理伴隨著垃圾類型的分類和分類系統(tǒng)。本研究旨在創(chuàng)建一個基于手機(jī)的應(yīng)用程序,可以選擇垃圾類型,并將垃圾數(shù)據(jù)輸入數(shù)據(jù)庫。所使用的數(shù)據(jù)庫是一個谷歌電子表格,它將容納垃圾檢測移動應(yīng)用程序發(fā)出的輸出數(shù)據(jù)。本研究使用的圖像數(shù)據(jù)共計(jì)10108張,被分為6個不同的垃圾類。本研究使用了準(zhǔn)確率為99.6%的深度學(xué)習(xí)平臺densenet121來訓(xùn)練圖像數(shù)據(jù)。對DenseNet121進(jìn)行了改進(jìn),并增加了基于遺傳算法的優(yōu)化。應(yīng)用于優(yōu)化的遺傳算法采用四代遺傳算法。通過訓(xùn)練這兩種方法得到的模型被轉(zhuǎn)換為移動應(yīng)用程序可以訪問的模型?;谏疃葘W(xué)習(xí)模型的移動應(yīng)用程序容納了垃圾類型、檢測精度水平和垃圾的GPS位置的檢測數(shù)據(jù)。在移動應(yīng)用程序的最終實(shí)驗(yàn)中,發(fā)送數(shù)據(jù)的延遲時(shí)間非??欤∮?秒(0.86s)。
JIANG, Xiangkui, et al. A real-time rural domestic garbage detection algorithm with an improved YOLOv5s network model. Scientific Reports, 2022, 12.1: 16802.
摘要
越來越多的研究人員正在利用深度學(xué)習(xí)技術(shù)對農(nóng)村垃圾進(jìn)行分類和處理,并取得了一定的成果。然而,現(xiàn)有的垃圾檢測模型仍然存在復(fù)雜度高、小目標(biāo)漏檢、檢測精度低、實(shí)時(shí)性差等問題。為了解決這些問題,我們訓(xùn)練了一個模型,并將其應(yīng)用于農(nóng)村地區(qū)的垃圾分類和檢測??偟膩碚f,我們在YOLOv5算法的基礎(chǔ)上提出了一種注意力組合機(jī)制來構(gòu)建更好的骨干網(wǎng)絡(luò)結(jié)構(gòu),在頭部網(wǎng)絡(luò)中增加新的小目標(biāo)檢測層來增強(qiáng)模型對小目標(biāo)的檢測能力,采用CIoU損失函數(shù)來優(yōu)化輸出預(yù)測包圍框,并選擇Adam優(yōu)化算法來訓(xùn)練模型。我們提出的YOLOv5s - CSS模型在0.021秒內(nèi)檢測出單個垃圾圖像,檢測精度為96.4%。與YOLOv5算法和經(jīng)典檢測算法相比,改進(jìn)算法具有更好的檢測速度和檢測精度。同時(shí),在一定程度上降低了網(wǎng)絡(luò)模型的復(fù)雜性,能夠滿足農(nóng)村生活垃圾實(shí)時(shí)檢測的要求。
Ma等人10提出了一種改進(jìn)的Faster R-CNN (Faster Regions with CNN features)算法。首先,將Faster R-CNN算法與VGG (Visual Geometry Group Network)-16和ResNet (Residual Network)-50卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,提高了小目標(biāo)的檢測精度。其次,采用SoftNMS算法替代傳統(tǒng)的非最大抑制算法,并對參數(shù)進(jìn)行分析,確定參數(shù)范圍;最后實(shí)現(xiàn)了垃圾檢測。檢測單幅圖像仍然需要4.103 s,檢測速度有待提高。王浩11構(gòu)建了VGG-16卷積神經(jīng)網(wǎng)絡(luò)來解決生活垃圾檢測分類問題。首先,利用計(jì)算機(jī)視覺庫對識別目標(biāo)進(jìn)行定位和選擇,并對圖像進(jìn)行預(yù)處理;其次,利用ReLU (Rectified Linear Unit)激活函數(shù)增加BN (Batch Normalization)層,提高模型的識別精度,加快模型的收斂速度。最后,生活垃圾的檢測準(zhǔn)確率僅為75.2%,檢測準(zhǔn)確率有待加強(qiáng)。吳涵12開發(fā)了一個輕量級垃圾檢測模型MobileNetV3_Lite。首先,分析了MobileNetV3模塊輕量化結(jié)構(gòu)的特點(diǎn)。其次,在YOLO (Y ou Only Look Once) v3檢測算法的基礎(chǔ)上,在算法的骨干網(wǎng)中嵌入MobileNetV3模塊,構(gòu)建輕量級垃圾檢測模型。最后,對模型的實(shí)時(shí)性進(jìn)行了測試,只有每秒25幀。該模型雖然輕量級,但不能滿足實(shí)時(shí)檢測的要求。
Wu等13設(shè)計(jì)了GC-YOLOv5垃圾檢測模型。首先,對垃圾圖像進(jìn)行預(yù)處理以獲得垃圾數(shù)據(jù)集。其次,基于YOLOv5算法對模型進(jìn)行訓(xùn)練。最后,只能檢測到5種類型的生活垃圾。該模型的局限性在于檢測到的垃圾類別較少,實(shí)用性有待提高Rabano等14基于TensorFlow框架開發(fā)了一種MigeNet檢測模型。首先,他們收集并創(chuàng)建一個垃圾圖像數(shù)據(jù)集。其次,使用遷移學(xué)習(xí)技術(shù)對模型進(jìn)行500次訓(xùn)練。最后,對模型進(jìn)行了測試和分析。模型的準(zhǔn)確率僅為87.2%,有必要繼續(xù)優(yōu)化模型的準(zhǔn)確率以檢測垃圾。Rismiyati等人15使用遷移學(xué)習(xí)技術(shù)來關(guān)注預(yù)先訓(xùn)練的模型,如VGG-16、ResNet-50和Xception。Xception在數(shù)據(jù)集上的驗(yàn)證準(zhǔn)確率為88%。Kumar等16提出了一種基于yolov3的方法來有效地分離處理和回收垃圾。采用YOLOv3算法對自制數(shù)據(jù)集進(jìn)行訓(xùn)練。僅使用六種對象類型就成功地訓(xùn)練了模型。此外,在檢測過程中,利用YOLOv3-tiny來驗(yàn)證YOLOv3的能力。由于檢測到的垃圾類型很少,因此在實(shí)際使用中存在一定的局限性。首先,Seredkin等人在基于CNN(卷積神經(jīng)網(wǎng)絡(luò))模型的近13000張罐裝垃圾圖像上訓(xùn)練了一個模型。其次,將罐裝垃圾輸送到傳送帶上。最后,基于cnn的模型對目標(biāo)對象進(jìn)行分類,分類準(zhǔn)確率僅為64%。雖然該模型使用了大量的垃圾圖像進(jìn)行訓(xùn)練,但基于CNN模型的學(xué)習(xí)效果較差。
Wieczorek等人18開發(fā)了一種輕量級CNN架構(gòu),通過使用最少數(shù)量的處理層來實(shí)現(xiàn)對模型的輕量級改進(jìn),并設(shè)計(jì)了一種新的滑動窗口過程。但是,該方法在執(zhí)行檢測任務(wù)時(shí)存在檢測目標(biāo)對象過程繁瑣的問題。
Marcin等19提出了一種用于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的新型相關(guān)學(xué)習(xí)機(jī)制(CLM),該機(jī)制將卷積神經(jīng)網(wǎng)絡(luò)(CNN)與經(jīng)典架構(gòu)相結(jié)合。所提出的相關(guān)學(xué)習(xí)機(jī)制模型由卷積神經(jīng)網(wǎng)絡(luò)與經(jīng)典神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中協(xié)同工作組成。這種學(xué)習(xí)機(jī)制需要研究者的經(jīng)驗(yàn)來選擇濾波器大小,并不斷調(diào)整參數(shù),以獲得最佳的擬合過程,從而獲得更好的學(xué)習(xí)效率和準(zhǔn)確性。文章來源:http://www.zghlxwxcb.cn/news/detail-501431.html
因此,該學(xué)習(xí)機(jī)制缺乏一定的自適應(yīng)更新功能。Hussain等人20提出了一種修正網(wǎng)絡(luò)模型,該模型使用二進(jìn)制交叉熵、相似指數(shù)和交集在像素、補(bǔ)丁和地圖級別的聯(lián)合損失的組合有效地對邊界像素進(jìn)行分類,從而有效地分割圖像中的顯著性對象。因此,revision - net模型僅用于圖像分割,將目標(biāo)對象從當(dāng)前圖像的背景中分離出來,無法檢測視頻中的目標(biāo)對象。
上述方法在垃圾分類領(lǐng)域做出了一定的貢獻(xiàn),但仍有三個問題需要解決:
(1)面對復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),需要大量的計(jì)算資源和高成本的模型訓(xùn)練;(2)檢測小物體;(3)在實(shí)際應(yīng)用中,既要滿足高檢測精度的要求,又要考慮實(shí)時(shí)性的原則。對于第一個問題,我們采用YOLOv5s模型作為基線,并引入CBAM (Convolutional Block Attention Module)注意模塊。YOLOv5s模型結(jié)構(gòu)簡單,模型大小只有14.4 MB。同時(shí),CBAM注意模塊沒有大量的卷積結(jié)構(gòu);因此,避免了由卷積乘法引起的大量計(jì)算量,使得模型復(fù)雜度低,計(jì)算量小。對于第二個問題,我們在YOLOv5s模型的輸出預(yù)測部分增加了一個小的對象檢測層,構(gòu)建一個新的輸出預(yù)測網(wǎng)絡(luò)。通過添加一組新的錨框值,提取小目標(biāo)的特征,構(gòu)建四層輸出預(yù)測網(wǎng)絡(luò),以滿足小目標(biāo)檢測的需要。針對第三個問題,我們提出了一種注意力組合機(jī)制來增強(qiáng)模型提取特征的能力,并優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)來提高檢測的實(shí)時(shí)性。模型在訓(xùn)練過程中存在收斂速度慢、損失值波動等問題。為了解決這一問題,我們引入了Adam (Adaptive Moment Estimate)優(yōu)化算法。在輸出預(yù)測結(jié)果時(shí),存在預(yù)測包圍框與ground truth包圍框差距過大的問題。我們通過改變損失函數(shù)類型來優(yōu)化輸出預(yù)測邊界框,使其更接近于ground truth邊界框。
我們提出的模型是一個實(shí)時(shí)輕量級YOLOv5架構(gòu),用于快速檢測農(nóng)村地區(qū)的生活垃圾。該模型能有效檢測復(fù)雜場景下的生活垃圾。在這些場景下,垃圾圖像可能由于模糊或其他條件而難以檢測,本文提出的模型可以很好地應(yīng)用于類似的場景。該模型的新穎之處在于提出了YOLOv5架構(gòu),在YOLOv5架構(gòu)中引入了注意力組合機(jī)制,增強(qiáng)了模型提取特征的能力,優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),提高了檢測的實(shí)時(shí)性。在模型的輸出預(yù)測部分構(gòu)造了新的輸出預(yù)測網(wǎng)絡(luò),以滿足小目標(biāo)物體檢測的需要。整個模型通過使用Adam算法進(jìn)行訓(xùn)練,因?yàn)樵谖覀兊难芯繙y試中,Adam算法是最有效的。最后,通過改變模型的損失函數(shù)對輸出預(yù)測包圍框進(jìn)行優(yōu)化。因此,本文以典型農(nóng)村生活垃圾為研究對象,收集了十三種垃圾,并制作了垃圾數(shù)據(jù)集來解決以上三個問題。結(jié)果表明,YOLOv5s-CSS模型計(jì)算量減少45.3%,檢測精度提高4.6%,推理時(shí)間縮短7.4 ms,幀數(shù)高達(dá)47.6幀/s。可以同時(shí)識別多種類型的垃圾,為農(nóng)村垃圾智能處置提供技術(shù)解決方案,實(shí)現(xiàn)實(shí)時(shí)檢測。文章來源地址http://www.zghlxwxcb.cn/news/detail-501431.html
到了這里,關(guān)于論文閱讀——基于深度學(xué)習(xí)智能垃圾分類的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!