摘要
本文嘗試使用Mamba的VSSBlock替換YoloV8的Bottleneck,打造最新的Yolo-Mamba網(wǎng)絡(luò)。
論文:《Mamba-UNet:用于醫(yī)學(xué)圖像分割的類似UNet的純視覺Mamba網(wǎng)絡(luò)》
在醫(yī)學(xué)圖像分析的最新進(jìn)展中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)和視覺轉(zhuǎn)換器(ViT)都取得了顯著的基準(zhǔn)成績。前者通過其卷積操作在捕獲局部特征方面表現(xiàn)出色,而后者則通過利用自注意力機(jī)制實現(xiàn)了出色的全局上下文理解。然而,這兩種架構(gòu)在有效建模醫(yī)學(xué)圖像中的長距離依賴關(guān)系時都存在局限,這對于精確分割至關(guān)重要。受到Mamba架構(gòu)的啟發(fā),該架構(gòu)因其處理長序列和全局上下文信息的能力以及作為國家空間模型(SSM)的增強(qiáng)計算效率而著稱,我們提出了Mamba-UNet,這是一種將U-Net在醫(yī)學(xué)圖像分割中的能力與Mamba的能力相結(jié)合的新型架構(gòu)。
Mamba-UNet采用了一種純視覺Mamba(VMamba)基礎(chǔ)的編碼器-解碼器結(jié)構(gòu),其中融入了跳躍連接,以在網(wǎng)絡(luò)的不同尺度上保留空間信息。這種設(shè)計促進(jìn)了全面的特征學(xué)習(xí)過程,能夠捕獲醫(yī)學(xué)圖像中的復(fù)雜細(xì)節(jié)和更廣泛的語義上下文。我們在VMamba塊內(nèi)引入了一種新型集成機(jī)制,以確保編碼器和解碼器路徑之間的無縫連接和信息流動,從而提高分割性能。
我們在公開可用的MRI心臟多結(jié)構(gòu)分割數(shù)據(jù)集上進(jìn)行了實驗。結(jié)果表明,在相同的超參數(shù)設(shè)置下,Mamba-UNet在醫(yī)學(xué)圖像分割方面優(yōu)于UNet和SwinUNet。源代碼和基線實現(xiàn)可在https://github.com/ziyangwang007/Mamba-UNet上找到。文章來源:http://www.zghlxwxcb.cn/news/detail-830456.html
關(guān)鍵詞:醫(yī)學(xué)圖像分割 - 卷積 - 轉(zhuǎn)換器 - Mamba - 狀態(tài)空間模型文章來源地址http://www.zghlxwxcb.cn/news/detail-830456.html
到了這里,關(guān)于YoloV8改進(jìn)策略:Block改進(jìn)|Mamba-UNet改進(jìn)YoloV8,打造全新的Yolo-Mamba網(wǎng)絡(luò)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!