前言
YOLOv6 是美團(tuán)視覺(jué)智能部研發(fā)的一款目標(biāo)檢測(cè)框架,致力于工業(yè)應(yīng)用。論文題目是《YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications》。
和YOLOv4、YOLOv5等不同的是,YOLOv6對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的改動(dòng)較大。
除了模型的結(jié)構(gòu)之外,YOLOv6的數(shù)據(jù)增強(qiáng)和YOLOv5的保持一致;而標(biāo)簽分配上則是和YOLOX一樣,采用了SimOTA;并且引入了新的邊框回歸損失:SIOU。
提示:以下是本篇文章正文內(nèi)容,下面內(nèi)容可供參考
一、YOLOv6的網(wǎng)絡(luò)結(jié)構(gòu)和流程
YOLOv6給出了5個(gè)版本:YOLOv6-N
、YOLOv6-T
、YOLOv6-S
、YOLOv6-M
、YOLOv6-L
YOLOv6的網(wǎng)絡(luò)結(jié)構(gòu)圖如下,可以看出改進(jìn)在于:
- Backbone:基于RepVGG設(shè)計(jì)了一個(gè)高效的Backbone–EfficientRep。相比于 YOLOv5 采用的 CSP-Backbone,該 Backbone 能夠高效利用硬件(如 GPU)算力的同時(shí),還具有較強(qiáng)的表征能力
ps:
- YOLOv5/YOLOX 使用的 Backbone 和 Neck 都基于 CSPNet搭建,采用了多分支的方式和殘差結(jié)構(gòu)。對(duì)于 GPU 等硬件來(lái)說(shuō),這種結(jié)構(gòu)會(huì)一定程度上增加延時(shí),同時(shí)減小內(nèi)存帶寬利用率。
- EfficientRep基于RepVGG Style 結(jié)構(gòu),這種結(jié)構(gòu)是一種在訓(xùn)練時(shí)具有多分支拓?fù)洌趯?shí)際部署時(shí)可以等效融合為單個(gè) 3x3 卷積的一種可重參數(shù)化的結(jié)構(gòu)。通過(guò)融合成的 3x3 卷積結(jié)構(gòu),可以有效利用計(jì)算密集型硬件計(jì)算能力(比如 GPU),同時(shí)也可獲得 GPU/CPU 上已經(jīng)高度優(yōu)化的 NVIDIA cuDNN 和 Intel MKL 編譯框架的幫助。
- 簡(jiǎn)而言之,就是僅在訓(xùn)練時(shí)使用多路徑拓?fù)?,在推理時(shí)使用單路徑拓?fù)?br>
![]()
- Neck:基于RepBlock設(shè)計(jì)了Rep-PAN,實(shí)質(zhì)上是將PAN中的CSP-Block替換為RepBlock
ps:用 RepBlock 替換了 YOLOv5 中使用的 CSP-Block,同時(shí)對(duì)整體 Neck 中的算子進(jìn)行了調(diào)整,目的是在硬件上達(dá)到高效推理的同時(shí),保持較好的多尺度特征融合能力
- 設(shè)計(jì)了更加高效的Decoupled head,YOLOX的解耦頭中,新增了兩個(gè)額外的3x3卷積,這樣也會(huì)一定程度增加運(yùn)算的復(fù)雜度。YOLOv6基于Hybrid Channels的策略重新設(shè)計(jì)出了一個(gè)更高效的解耦頭結(jié)構(gòu)(即將中間的3×3卷積層的數(shù)量減少到只有一個(gè)。Head的寬度由backbone和neck的寬度乘數(shù)共同縮放)。在不怎么改變精度的情況下降低延時(shí),達(dá)到了速度與精度的均衡。
二、YOLOv6的創(chuàng)新點(diǎn)
- 結(jié)合Rep算子改進(jìn)了Backbone和Neck,使其更適于GPU
- 簡(jiǎn)化了Decoupled head,在保證精度的情況下降低延時(shí)
- 結(jié)合了一些先進(jìn)的tricks:Anchor-free、SimOTA 、SIoU loss
ps:關(guān)于IoU loss的進(jìn)化史可以參考IoU Loss綜述,SIoU重新考慮關(guān)于距離和形狀的考慮,并加入了Angle和IoU成本
總結(jié)
YOLOv6達(dá)成新SOTA,在MS COCO數(shù)據(jù)集test-dev 2017上進(jìn)行評(píng)估,YOLOv6-L在NVIDIA Tesla T4上實(shí)現(xiàn)了52.5%的AP和70%的AP50 ,速度約為50 FPS文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-816570.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-816570.html
到了這里,關(guān)于目標(biāo)檢測(cè)-One Stage-YOLOv6的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!