眾所周知,深度學習里的卷積運算是具有平移等變性的,這樣可以在圖像的不同位置共享統(tǒng)一的卷積核參數(shù),但是這樣卷積學習過程中是不能感知當前特征在圖像中的坐標的,論文中的實驗證明如下圖所示。通過該實驗,作者證明了傳統(tǒng)卷積在卷積核進行局部運算時,僅僅能感受到局部信息,并且是無法感受到位置信息的。CoordConv就是通過在卷積的輸入特征圖中新增對應的通道來表征特征圖像素點的坐標,讓卷積學習過程中能夠一定程度感知坐標來提升檢測精度。文章來源:http://www.zghlxwxcb.cn/news/detail-432704.html
反方向和第三個發(fā)現(xiàn):監(jiān)督式回歸對CNN同樣很難
所以為什么網(wǎng)絡很難定位一個像素呢?是因為從小空間到大空間的所以為什么網(wǎng)絡很難定位一個像素呢?是因為從小空間到大空間的轉(zhuǎn)換文章來源地址http://www.zghlxwxcb.cn/news/detail-432704.html
到了這里,關(guān)于改進YOLOv5:結(jié)合位置編碼CoordConv,提升行人目標等預測能力 | 卷積加上坐標,從而使其具備了空間感知能力的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!