引言
如圖1所示,視覺(jué)模式在自然場(chǎng)景中以多尺度出現(xiàn)。首先,對(duì)象可以在單個(gè)圖像中以不同的尺寸出現(xiàn),例如,沙發(fā)和杯子具有不同的尺寸。其次,對(duì)象的基本上下文信息可能比對(duì)象本身占據(jù)更大的區(qū)域。例如,我們需要依靠大桌子作為上下文,以更好地判斷放置在桌子上的黑色小球是杯子還是筆筒。第三,感知來(lái)自不同尺度的信息對(duì)于理解諸如細(xì)粒度分類和語(yǔ)義分割之類的任務(wù)的部分和對(duì)象至關(guān)重要。因此,為視覺(jué)認(rèn)知任務(wù)設(shè)計(jì)多尺度的良好特征至關(guān)重要,包括圖像分類 [444] 、物體檢測(cè) [53] 、注意力預(yù)測(cè) [55] 、目標(biāo)跟蹤 [76] 、動(dòng)作識(shí)別 [56] 、語(yǔ)義分割 [6] 、顯著物體檢測(cè) [2],[29],物體提議 [12],[53],骨架提取 [80],立體匹配 [52] 和邊緣檢測(cè) [45],[69]。
多尺度特征已廣泛用于常規(guī)特征設(shè)計(jì) [1],[48] 和深度學(xué)習(xí) [10],[61]。在視覺(jué)任務(wù)中獲得多尺度表示需要特征提取器使用大范圍的感受域來(lái)描述不同尺度的對(duì)象/部分/上下文。卷積神經(jīng)網(wǎng)絡(luò) (CNNs) 通過(guò)一堆卷積算子自然地學(xué)習(xí)從粗到細(xì)的多尺度特征。CNNs固有的多尺度特征提取能力導(dǎo)致解決眾多視覺(jué)任務(wù)的有效表示。如何設(shè)計(jì)更高效的網(wǎng)絡(luò)架構(gòu)是進(jìn)一步提高CNNs性能的關(guān)鍵。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-536696.html
在過(guò)去的幾年中,幾個(gè)骨干網(wǎng),例如,[10],[15],[27],[30],[31]&#x文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-536696.html
到了這里,關(guān)于Res2Net: 一種新的多尺度主干體系結(jié)構(gòu)(Res2Net: A New Multi-scale Backbone Architecture )的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!