前 言:作為當(dāng)前先進的深度學(xué)習(xí)目標(biāo)檢測算法YOLOv5、v7系列算法,已經(jīng)集合了大量的trick,但是在處理一些復(fù)雜背景問題的時候,還是容易出現(xiàn)錯漏檢的問題。此后的系列文章,將重點對YOLO系列算法的如何改進進行詳細(xì)的介紹,目的是為了給那些搞科研的同學(xué)需要創(chuàng)新點或者搞工程項目的朋友需要達到更好的效果提供自己的微薄幫助和參考。
具體改進辦法請關(guān)注后私信留言!關(guān)注即免費獲取深度學(xué)習(xí)資料!
解決問題:ICLR2022前段時間已經(jīng)放榜,涌現(xiàn)了大量優(yōu)秀的工作。動態(tài)卷積的工作:ODConv,其通過并行策略采用多維注意力機制沿核空間的四個維度學(xué)習(xí)互補性注意力。作為一種“即插即用”的操作,它可以輕易的嵌入到現(xiàn)有CNN網(wǎng)絡(luò)中。并且實驗結(jié)果表明它可提升大模型的性能,又可提升輕量型模型的性能
主要原理:
論文:Omni-Dimensional Dynamic Convolution | OpenReview
? ? ? ODConv可以視作CondConv的延續(xù),將CondConv中一個維度上的動態(tài)特性進行了擴展,同時了考慮了空域、輸入通道、輸出通道等維度上的動態(tài)性,故稱之為全維度動態(tài)卷積。ODConv通過并行策略采用多維注意力機制沿核空間的四個維度學(xué)習(xí)互補性注意力。作為一種“即插即用”的操作,它可以輕易的嵌入到現(xiàn)有CNN網(wǎng)絡(luò)中。ImageNet分類與COCO檢測任務(wù)上的實驗驗證了所提ODConv的優(yōu)異性:即可提升大模型的性能,又可提升輕量型模型的性能,實乃萬金油是也!值得一提的是,受益于其改進的特征提取能力,ODConv搭配一個卷積核時仍可取得與現(xiàn)有多核動態(tài)卷積相當(dāng)甚至更優(yōu)的性能。
?
添加方法:?
第一步:common.py構(gòu)建ODConv模塊。部分代碼示例如下。
class ODConv2d(nn.Module):
def __init__(self, in_planes, out_planes, kernel_size, stride=1, padding=0, dilation=1, groups=1,
reduction=0.0625, kernel_num=4):
super(ODConv2d, self).__init__()
self.in_planes = in_planes
self.out_planes = out_planes
self.kernel_size = kernel_size
self.stride = stride
self.padding = padding
self.dilation = dilation
self.groups = groups
self.kernel_num = kernel_num
self.attention = Attention(in_planes, out_planes, kernel_size, groups=groups,
reduction=reduction, kernel_num=kernel_num)
self.weight = nn.Parameter(torch.randn(kernel_num, out_planes, in_planes//groups, kernel_size, kernel_size),
requires_grad=True)
self._initialize_weights()
if self.kernel_size == 1 and self.kernel_num == 1:
self._forward_impl = self._forward_impl_pw1x
else:
self._forward_impl = self._forward_impl_common
第二步:yolo.py中注冊O(shè)DConv模塊。部分代碼示例如下。
第三步:修改yaml文件,需要修改。
第四步:將train.py中改為本文的yaml文件即可,開始訓(xùn)練。
結(jié) 果:本人在多個數(shù)據(jù)集上做了大量實驗,針對不同的數(shù)據(jù)集效果不同,需要大家進行實驗。有效果有提升的情況占大多數(shù)。
預(yù)告一下:繼續(xù)分享深度學(xué)習(xí)相關(guān)內(nèi)容。有興趣的朋友可以關(guān)注一下我,有問題可以留言或者私聊我哦
PS:系列改進算法不僅僅是可以添加進YOLOv5,也可以添加進任何其他的深度學(xué)習(xí)網(wǎng)絡(luò),不管是分類還是檢測還是分割,主要是計算機視覺領(lǐng)域,都可能會有不同程度的提升效果。文章來源:http://www.zghlxwxcb.cn/news/detail-451066.html
最后,希望能互粉一下,做個朋友,一起學(xué)習(xí)交流。關(guān)注即免費獲取深度學(xué)習(xí)資料!文章來源地址http://www.zghlxwxcb.cn/news/detail-451066.html
到了這里,關(guān)于YOLOv5、v7改進之二十八:ICLR 2022漲點神器——即插即用的動態(tài)卷積ODConv的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!