国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【論文閱讀】YOLO系列論文:YOLO v5

這篇具有很好參考價值的文章主要介紹了【論文閱讀】YOLO系列論文:YOLO v5。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

代碼:https://github.com/ultralytics/yolov5github.com

優(yōu)缺點/總結

優(yōu)點

  • 擁有四種模型,可以靈活部署

缺點

  • 在性能上稍弱于YOLO V4

模型的改進

  • 增加了Focus切片、自適應錨框、自適應圖片縮放結構,保留信息,加快推理速度

解決的問題

模型

有4個版本,分別是Yolov5s,Yolov5m,Yolov5l,yolov5x四個模型,其中Yolov5s網(wǎng)絡是該系列中深度最小,寬度最小的網(wǎng)絡

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

主要結構分為四個模塊:輸入端、Backbone主干網(wǎng)絡、Neck、Prediction

  • 輸入端:Mosaic數(shù)據(jù)增強、自適應錨框計算、自適應圖片縮放
  • Backbone主干網(wǎng)絡:Focus結構,CSP結構
  • Neck:FPN+PAN結構
  • Prediction:GIoU Loss

結構

輸入端

Mosaic數(shù)據(jù)增強

采用4張圖片,隨機縮放,隨即裁剪、隨機排布的方式進行拼接,解決數(shù)據(jù)集中小、中、大目標占比不均衡的問題

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • 豐富數(shù)據(jù)集:隨機使用4張圖片,隨機縮放,再隨機分布進行拼接,大大豐富了檢測數(shù)據(jù)集,特別是隨機縮放增加了很多小目標,讓網(wǎng)絡的魯棒性更好。
  • 減少GPU:Mosaic增強訓練時,可以直接計算4張圖片的數(shù)據(jù),使得Mini-batch大小并不需要很大,一個GPU就可以達到比較好的效果。

自適應錨框計算

  • 在Yolo算法中,針對不同的數(shù)據(jù)集,都會有初始設定長寬的錨框。
  • 在網(wǎng)絡訓練中,網(wǎng)絡在初始錨框的基礎上輸出預測框,進而和真實框groundtruth進行比對,計算兩者差距,再反向更新,迭代網(wǎng)絡參數(shù)
  • Yolov5將此功能嵌入到代碼中,每次訓練時,自適應的計算不同訓練集中的最佳錨框值(也可以關閉此功能)

自適應圖片縮放

  • 在常用的目標檢測算法中,不同的圖片長寬都不相同,因此常用的方式是將原始圖片統(tǒng)一縮放到一個標準尺寸,再送入檢測網(wǎng)絡中。

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • 在項目實際使用時,很多圖片的長寬比不同,因此縮放填充后,兩端的黑邊大小都不同,而如果填充的比較多,則存在信息冗余,影響推理速度。
  • Yolov5的代碼中datasets.py的letterbox函數(shù)中進行了修改,對原始圖像自適應的添加最少的黑邊
    • 計算縮放比例:縮放尺寸除以原始圖像尺寸,選擇小的縮放系數(shù)
    • 計算縮放后的尺寸:原始圖片的長寬都乘以最小的縮放系數(shù)
    • 計算黑邊填充數(shù)值:用縮放尺寸減去第二步縮放后的尺寸,得到需要填充的數(shù)值
  • 圖像高度上兩端的黑邊變少了,在推理時,計算量也會減少,即目標檢測速度會得到提升
  • 訓練時沒有采用縮減黑邊的方式,還是采用傳統(tǒng)填充的方式。只是在測試,使用模型推理時,才采用縮減黑邊的方式,提高目標檢測,推理的速度

Backbone主干網(wǎng)絡

Focus結構

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • Fcous: 圖片進行切片操作
    • 在一張圖片中每隔一個像素拿到一個值,類似于鄰近下采樣,這樣就拿到了四張圖片,四張圖片互補,長的差不多,但是沒有信息丟失
    • 將W、H信息就集中到了通道空間,輸入通道擴充了4倍,即拼接起來的圖片相對于原先的RGB三通道模式變成了12個通道
    • 最后將得到的新圖片再經(jīng)過卷積操作,最終得到了沒有信息丟失情況下的二倍下采樣特征圖
  • Focus的作用:
    • 使圖片在下采樣的過程中,不帶來信息丟失的情況下
    • 將W、H的信息集中到通道上,再使用3 × 3的卷積對其進行特征提取,使得特征提取得更加的充分
    • 雖然增加了一點點的計算量,但是為后續(xù)的特征提取保留了更完整的圖片下采樣信息

CSP結構

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • Yolov4中只有主干網(wǎng)絡使用了CSP結構
  • Yolov5中設計了兩種CSP結構,以Yolov5s網(wǎng)絡為例,CSP1_X結構應用于Backbone主干網(wǎng)絡,另一種CSP2_X結構則應用于Neck中。

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • CSPNet的作者認為推理計算過高的問題是由于網(wǎng)絡優(yōu)化中的梯度信息重復導致的。
  • 采用CSP模塊先將基礎層的特征映射劃分為兩部分,然后通過跨階段層次結構將它們合并,在減少了計算量的同時可以保證準確率。
    • 優(yōu)點一:增強CNN的學習能力,使得在輕量化的同時保持準確性。
    • 優(yōu)點二:降低計算瓶頸
    • 優(yōu)點三:降低內存成本

Neck

FPN+PAN

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • FPN結構,自頂向下,將高層的特征信息通過上采樣的方式進行傳遞融合
  • PAN結構,自下向上,將底層的位置信息通過下采樣的方式進行傳遞融合
  • FPN層自頂向下傳遞強語義特征,PAN層自底向上傳遞強定位特征
  • PAN結構中兩個特征圖結合采用的是concat操作,特征圖融合后張量發(fā)生了變化

特征融合

  • Yolov4的Neck結構中,采用的都是普通的卷積操作。
  • Yolov5的Neck結構中,采用借鑒CSPnet設計的CSP2結構,加強網(wǎng)絡特征融合的能力。

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

Prediction

Loss函數(shù)

Yolov5中采用CIoU Loss做bounding box的損失函數(shù)

  • CIoU Loss

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

    • 在DIoU Loss的基礎上增加一個影響因子,將預測框和目標框的長寬比都考慮進去
    • yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

  • 總結四種Loss函數(shù):
    • IOU_Loss:主要考慮檢測框和目標框重疊面積。
    • GIOU_Loss:在IOU的基礎上,解決邊界框不重合時的問題。
    • DIOU_Loss:在IOU和GIOU的基礎上,考慮邊界框中心點距離的信息。
    • CIOU_Loss:在DIOU的基礎上,考慮邊界框寬高比的尺度信息。

NMS

  • 采用加權nms方式,不同于yolov4采用的DIoU nms方式

Tricks

1、Yolov5中四種網(wǎng)絡的文件內容基本相同,不同的是depth_multiple和width_multiple兩個參數(shù)

  • 四種結構就是通過上面的兩個參數(shù),來進行控制網(wǎng)絡的深度寬度。其中depth_multiple控制網(wǎng)絡的深度,width_multiple控制網(wǎng)絡的寬度
  • Yolov5中,網(wǎng)絡的不斷加深,也在不斷增加網(wǎng)絡特征提取特征融合的能力
  • 卷積核的數(shù)量越多,特征圖的厚度,即寬度越寬,網(wǎng)絡提取特征的學習能力也越強

Prediction

Objective Function/Loss Function

Yolov4中采用了CIOU_Loss的回歸方式,使得預測框回歸的速度和精度更高一些

  • CIoU Loss

yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測

    • 在DIoU Loss的基礎上增加一個影響因子,將預測框和目標框的長寬比都考慮進去
    • yolov5論文引用,YOLO系列,論文閱讀,YOLO,目標檢測文章來源地址http://www.zghlxwxcb.cn/news/detail-594593.html

到了這里,關于【論文閱讀】YOLO系列論文:YOLO v5的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 【YOLO系列】YOLOv5超詳細解讀(源碼詳解+入門實踐+改進)

    【YOLO系列】YOLOv5超詳細解讀(源碼詳解+入門實踐+改進)

    吼吼!終于來到了YOLOv5啦! 首先,一個熱知識:YOLOv5沒有發(fā)表正式論文哦~ 為什么呢?可能YOLOv5項目的作者Glenn Jocher還在吃帽子吧,hh 前言 一、YOLOv5的網(wǎng)絡結構 ?二、輸入端 (1)Mosaic數(shù)據(jù)增強 (2)自適應錨框計算 (3)自適應圖片縮放 三、Backbone (1)Focus結構 (2)CSP結構

    2024年02月07日
    瀏覽(26)
  • 【YOLO系列】YOLOv5、YOLOX、YOOv6、YOLOv7網(wǎng)絡模型結構

    【YOLO系列】YOLOv5、YOLOX、YOOv6、YOLOv7網(wǎng)絡模型結構

    【注】: 本文為YOLOv5、YOLOX、YOLOv6、YOLOv7模型結構圖,作圖軟件為drawio。因精力有限暫時不做結構的詳細闡述和具體的代碼講解,后續(xù)有機會再做補充。如有需要可以查閱其他博主的文章了解學習。 【另】:希望模型結構圖可以幫助到有需要的人,如模型中有錯誤的地方,歡

    2024年02月07日
    瀏覽(40)
  • 改進YOLO系列 | YOLOv5/v7 引入谷歌 Lion 優(yōu)化器

    改進YOLO系列 | YOLOv5/v7 引入谷歌 Lion 優(yōu)化器

    論文地址:https://arxiv.org/pdf/2302.06675.pdf 代碼地址:https://github.com/google/automl/tree/master/lion 我們提出了一種將算法發(fā)現(xiàn)作為程序搜索的方法,并將其應用于發(fā)現(xiàn)用于深度神經(jīng)網(wǎng)絡訓練的優(yōu)化算法。我們利用高效的搜索技術來探索一個無限且稀疏的程序空間。為了彌補代理任務和

    2024年02月09日
    瀏覽(30)
  • 改進YOLO系列:YOLOv5結合轉置卷積,實現(xiàn)小目標漲點

    該函數(shù)是用來進行轉置卷積的,它主要做了這幾件事:首先,對輸入的feature map進行padding操作,得到新的feature map;然后,隨機初始化一定尺寸的卷積核;最后,用隨機初始化的一定尺寸的卷積核在新的feature map上進行卷積操作。 補充一下,卷積核確實是隨機初始的,但是后

    2023年04月09日
    瀏覽(26)
  • 《基于改進YOLOv5的無人機圖像檢測算法》論文閱讀

    原文鏈接:UAV Recognition and Tracking Method Based on YOLOv5 | IEEE Conference Publication | IEEE Xplore 《基于改進YOLOv5的無人機圖像檢測算法》論文閱讀 ? ? ? ?基于深度學習的目標檢測算法通常對傳統(tǒng)目標檢測效果較好,但對小目標的檢測精度較低。針對該問題,該文通過對無人機采集圖像

    2024年02月14日
    瀏覽(37)
  • 改進YOLO系列 | YOLOv5/v7 引入 Dynamic Snake Convolution | 動態(tài)蛇形卷積

    改進YOLO系列 | YOLOv5/v7 引入 Dynamic Snake Convolution | 動態(tài)蛇形卷積

    準確分割拓撲管狀結構,如血管和道路,在各個領域中至關重要,可以確保下游任務的準確性和效率。然而,許多因素使任務復雜化,包括細小的局部結構和可變的全局形態(tài)。在這項工作中,我們注意到管狀結構的特殊性,并利用這一知識來引導我們的DSCNet,以在三個階段同

    2024年02月07日
    瀏覽(23)
  • 目標檢測YOLO實戰(zhàn)應用案例100講-基于深度學習的航拍圖像YOLOv5目標檢測(論文篇)(續(xù))

    目錄 基礎理論及相關技術? 2.1 深度學習基礎理論?

    2024年04月16日
    瀏覽(27)
  • 漲點神器:Yolov5 加入ODConv+ConvNeXt提升小目標檢測能力,適用yolo各個系列

    漲點神器:Yolov5 加入ODConv+ConvNeXt提升小目標檢測能力,適用yolo各個系列

    論文:Omni-Dimensional Dynamic Convolution 論文地址:Omni-Dimensional Dynamic Convolution | OpenReview ODConv通過并行策略引入一種多維注意力機制以對卷積核空間的四個維度學習更靈活的注意力。上圖給出CondConv、DyConv以及ODConv的差異圖。延續(xù)動態(tài)卷積的定義,ODConv可以描述成如下形式:其中

    2024年02月04日
    瀏覽(26)
  • YOLO Air:YOLO科研改進論文推薦 | 改進組合上千種搭配,包括Backbone,Neck,Head,注意力機制,適用于YOLOv5、YOLOv7、YOLOX等算法

    YOLO Air:YOLO科研改進論文推薦 | 改進組合上千種搭配,包括Backbone,Neck,Head,注意力機制,適用于YOLOv5、YOLOv7、YOLOX等算法

    ??????YOLOAir開源算法庫?。?! ??統(tǒng)一使用 YOLOv5、YOLOv7 代碼框架, 結合不同模塊來構建不同的YOLO目標檢測模型。 ??本項目包含大量的改進方式,降低改進難度,改進點包含 【Backbone特征主干】 、 【Neck特征融合】 、 【Head檢測頭】 、 【注意力機制】 、 【IoU損失函數(shù)】

    2024年02月01日
    瀏覽(40)
  • 【YOLO系列】YOLOv3論文超詳細解讀(翻譯 +學習筆記)

    【YOLO系列】YOLOv3論文超詳細解讀(翻譯 +學習筆記)

    YOLOv3(《Yolov3:An incremental improvement》)是Joseph Redmon大佬關于YOLO系列的最后一篇,由于他反對將YOLO用于軍事和隱私窺探,2020年2月宣布停止更新YOLO。 ?YOLOv3在YOLOv2的基礎上改良了網(wǎng)絡的主干,利用多尺度特征圖進行檢測,改進了多個獨立的Logistic regression分類器來取代softmax來

    2024年02月07日
    瀏覽(32)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包