国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

《VM-UNet: Vision Mamba UNet for Medical Image Segmentation》論文閱讀及代碼復(fù)現(xiàn)

這篇具有很好參考價值的文章主要介紹了《VM-UNet: Vision Mamba UNet for Medical Image Segmentation》論文閱讀及代碼復(fù)現(xiàn)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

論文地址:[2402.02491] VM-UNet: Vision Mamba UNet for Medical Image Segmentation (arxiv.org)

代碼地址:JCruan519/VM-UNet: (ARXIV24) This is the official code repository for "VM-UNet: Vision Mamba UNet for Medical Image Segmentation". (github.com)

摘要

在醫(yī)學(xué)圖像分割領(lǐng)域,基于細胞神經(jīng)網(wǎng)絡(luò)和基于變換器的模型都得到了廣泛的探索。然而,細胞神經(jīng)網(wǎng)絡(luò)在長期建模能力方面表現(xiàn)出局限性,而變壓器則受到其二次計算復(fù)雜性的阻礙。最近,以曼巴為例的狀態(tài)空間模型(SSM)已成為一種很有前途的方法。它們不僅擅長對長程相互作用進行建模,而且保持線性計算復(fù)雜性。在本文中,利用狀態(tài)空間模型,我們提出了一種用于醫(yī)學(xué)圖像分割的Ushape架構(gòu)模型,稱為Vision Mamba UNet(VM UNet)。具體地,引入視覺狀態(tài)空間(VSS)塊作為基礎(chǔ)塊來捕獲廣泛的上下文信息,并構(gòu)建了一種不對稱的編碼器-解碼器結(jié)構(gòu)。我們在ISIC17、ISIC18和Synapse數(shù)據(jù)集上進行了全面的實驗,結(jié)果表明,VM UNet在醫(yī)學(xué)圖像分割任務(wù)中具有競爭力。據(jù)我們所知,這是第一個基于純SSM模型構(gòu)建的醫(yī)學(xué)圖像分割模型。我們的目標(biāo)是建立一個基線,并為未來開發(fā)更高效、更有效的基于SSM的分割系統(tǒng)提供有價值的見解。

技術(shù)現(xiàn)狀

近年來,狀態(tài)空間模型(State Space Models)引起了研究者的極大興趣。在經(jīng)典SSM研究的基礎(chǔ)上,現(xiàn)代SSM(例如Mamba)不僅建立了長距離依賴關(guān)系,而且在輸入大小方面表現(xiàn)出線性復(fù)雜性。此外,基于SSM的模型在許多領(lǐng)域得到了大量研究,包括語言理解、一般視覺等。特別是,U-Mamba最近推出了一種新的SSM-CNN混合模型,標(biāo)志著它首次應(yīng)用于醫(yī)學(xué)圖像分割任務(wù)。SegMamba在編碼器部分結(jié)合了SSM,同時在解碼器部分仍然使用CNN,這提出了用于3D腦腫瘤分割任務(wù)的SSM-CNN混合模型。盡管上述工作已經(jīng)將SSM用于醫(yī)學(xué)圖像分割任務(wù),但純基于SSM的模型的性能仍有待探索。

文章貢獻

1)提出了VM-UNet,這標(biāo)志著首次探索了純基于SSM的模型在醫(yī)學(xué)圖像分割中的潛在應(yīng)用。

2) 在三個數(shù)據(jù)集上進行了綜合實驗,結(jié)果表明VM UNet表現(xiàn)出相當(dāng)大的競爭力。

3) 在醫(yī)學(xué)圖像分割任務(wù)中為純基于SSM的模型建立了基線,提供了有價值的見解,為開發(fā)更高效、更有效的基于SSM分割方法鋪平了道路。

整體結(jié)構(gòu)vm-unet:vision mamba unet for medical image segmentation,論文閱讀

① Vision Mamba UNet (VM-UNet)

VM-UNet包括Patch Embedding layer, an encoder, a decoder, a Final Projection layer, and skip connections。采用了不對稱結(jié)構(gòu)設(shè)計。Patch Embedding layer將輸入圖像劃分為4*4的不重疊補丁,隨后將圖像的維度映射到C(默認96),該過程得到嵌入圖像H4×W/4×C,然后編碼器的4個stage進行特征提取,前3個stage結(jié)束時應(yīng)用補丁合并操作以減少輸入特征的高度和寬度,同時增加通信數(shù)量。每個stage使用2個VSS塊。解碼器部分與編碼器類似。

② VSS block

輸入數(shù)據(jù)通過層歸一化后,被拆分為兩個分支。在第一個分支中,輸入通過線性層和激活函數(shù);第二個分支通過線性層、深度可分離卷積和激活函數(shù)、2D選擇性掃描模塊2D-Selective-Scan(SS2D)。隨后進行層歸一化,與第一個分支的輸出執(zhí)行逐元素生成。最后進行一個殘差連接操作得到VSS block的輸出。結(jié)構(gòu)中的損失函數(shù)選擇的SiLU

SS2D由3部分組成,a scan expanding operation, an S6 block, and a scan merging operation

scan expanding operation將輸入圖像沿著四個不同的方向(從左上到右下、從右下到左上、從右上到左下、從左下到右上)展開為序列。然后S6塊對這些序列進行處理,以進行特征提取,確保對來自各個方向的信息進行徹底的掃描,從而獲取不同的特征。隨后,合并序列,將輸入圖像恢復(fù)到與輸入相同的大小。vm-unet:vision mamba unet for medical image segmentation,論文閱讀

S6塊源自Mamba,通過根據(jù)輸入調(diào)整SSM的參數(shù),在S4之上引入了一種選擇性機制。這使得模型能夠區(qū)分和保留相關(guān)信息,同時過濾掉不相關(guān)的信息。算法1中給出了S6塊的偽代碼vm-unet:vision mamba unet for medical image segmentation,論文閱讀

結(jié)論

vm-unet:vision mamba unet for medical image segmentation,論文閱讀vm-unet:vision mamba unet for medical image segmentation,論文閱讀

在本文中,我們首次引入了一種純的基于SSM的醫(yī)學(xué)圖像分割模型,將VM-UNet作為基線。為了利用基于SSM的模型的能力,我們使用VSS塊構(gòu)建VM UNet,并使用預(yù)訓(xùn)練的VMamba-S初始化其權(quán)重。在皮膚損傷和多器官分割數(shù)據(jù)集上進行的綜合實驗表明,純基于SSM模型在醫(yī)學(xué)圖像分割任務(wù)中具有很強的競爭力,值得在未來進行深入探索。

代碼復(fù)現(xiàn)

注意目前只支持linux系統(tǒng)復(fù)現(xiàn)

conda create -n vmunet python=3.8
conda activate vmunet
pip install torch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0 --extra-index-url https://download.pytorch.org/whl/cu117
pip install packaging
pip install timm==0.4.12
pip install pytest chardet yacs termcolor
pip install submitit tensorboardX
pip install triton==2.0.0
pip install causal_conv1d==1.0.0  # causal_conv1d-1.0.0+cu118torch1.13cxx11abiFALSE-cp38-cp38-linux_x86_64.whl
pip install mamba_ssm==1.0.1  
# 如果安不上按下面步驟
# 點擊報錯中鏈接
# pip install mamba_ssm-1.0.1+cu118torch1.13cxx11abiFALSE-cp38-cp38-linux_x86_64.whl
pip install scikit-learn matplotlib thop h5py SimpleITK scikit-image medpy yacs
#預(yù)訓(xùn)練權(quán)重下載地址:https://pan.baidu.com/s/144nc45k28NBB_8k9hf_OeQ?pwd=xuns

vm-unet:vision mamba unet for medical image segmentation,論文閱讀文章來源地址http://www.zghlxwxcb.cn/news/detail-842959.html

到了這里,關(guān)于《VM-UNet: Vision Mamba UNet for Medical Image Segmentation》論文閱讀及代碼復(fù)現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • FCT: The Fully Convolutional Transformer for Medical Image Segmentation 論文解讀

    FCT: The Fully Convolutional Transformer for Medical Image Segmentation 論文解讀

    論文:The Fully Convolutional Transformer for Medical Image Segmentation (thecvf.com) 代碼:Thanos-DB/FullyConvolutionalTransformer (github.com) 期刊/會議:WACV 2023 我們提出了一種新的transformer,能夠分割不同形態(tài)的醫(yī)學(xué)圖像。 醫(yī)學(xué)圖像分析的細粒度特性所帶來的挑戰(zhàn)意味著transformer對其分析的適應(yīng)仍處

    2024年02月10日
    瀏覽(22)
  • 【論文閱讀筆記】Prompt Tuning for Parameter-efficient Medical Image Segmentation

    【論文閱讀筆記】Prompt Tuning for Parameter-efficient Medical Image Segmentation

    Fischer M, Bartler A, Yang B. Prompt tuning for parameter-efficient medical image segmentation[J]. Medical Image Analysis, 2024, 91: 103024. 【開源】 【核心思想】 本文的核心思想是提出了一種用于醫(yī)學(xué)圖像分割的參數(shù)高效的提示調(diào)整(Prompt Tuning)方法。這種方法基于預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),通過插入可學(xué)習(xí)的

    2024年01月17日
    瀏覽(45)
  • 醫(yī)學(xué)圖像分割2 TransUnet:Transformers Make Strong Encoders for Medical Image Segmentation

    醫(yī)學(xué)圖像分割2 TransUnet:Transformers Make Strong Encoders for Medical Image Segmentation

    TransUnet:Transformers Make Strong Encoders for Medical Image Segmentation 在醫(yī)學(xué)圖像分割領(lǐng)域,U形結(jié)構(gòu)的網(wǎng)絡(luò),尤其是Unet,已經(jīng)取得了很優(yōu)秀的效果。但是,CNN結(jié)構(gòu)并不擅長建立遠程信息連接,也就是CNN結(jié)構(gòu)的感受野有限。盡管可以通過堆疊CNN結(jié)構(gòu)、使用空洞卷積等方式增加感受野,但也

    2024年02月05日
    瀏覽(25)
  • HiFormer Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation

    HiFormer Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation

    [WACV2023] HiFormer: Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation 摘要 由于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算的特性,它們在建模長程相關(guān)性和空間相關(guān)性時受到限制。雖然Transformer最初是為了解決這個問題而開發(fā)的,但它們 無法捕獲低級別的特征 。相比之下,

    2024年01月21日
    瀏覽(25)
  • SA-Net:用于醫(yī)學(xué)圖像分割的尺度注意網(wǎng)絡(luò) A scale-attention network for medical image segmentation

    ????????醫(yī)學(xué)圖像的語義分割為后續(xù)的圖像分析和理解任務(wù)提供了重要的基石。隨著深度學(xué)習(xí)方法的快速發(fā)展,傳統(tǒng)的 U-Net 分割網(wǎng)絡(luò)已在許多領(lǐng)域得到應(yīng)用。基于探索性實驗,已發(fā)現(xiàn)多尺度特征對于醫(yī)學(xué)圖像的分割非常重要。在本文中,我們提出了一種尺度注意力深度學(xué)

    2024年02月16日
    瀏覽(27)
  • MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model

    MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model

    MedSegDiff:基于擴散概率模型的醫(yī)學(xué)圖像分割 摘要: 擴散概率模型(Diffusion probabilistic model, DPM) 是近年來計算機視覺研究的熱點之一。它在Imagen、Latent Diffusion Models和Stable Diffusion等圖像生成應(yīng)用中表現(xiàn)出了令人印象深刻的生成能力,引起了社區(qū)的廣泛討論。最近的許多研究還發(fā)

    2024年02月02日
    瀏覽(16)
  • 論文閱讀——Loss odyssey in medical image segmentation

    論文閱讀——Loss odyssey in medical image segmentation

    Loss odyssey in medical image segmentation github:https://github.com/JunMa11/SegLossOdyssey 這篇文章回顧了醫(yī)學(xué)圖像分割中的20種不同的損失函數(shù),旨在回答:對于醫(yī)學(xué)圖像分割任務(wù),我們應(yīng)該選擇哪種損失函數(shù)? 首先是一張各類分割函數(shù)的圖譜: 介紹函數(shù)之前先定義字母符號的含義: , 分別

    2024年02月04日
    瀏覽(24)
  • Medical Imaging AI – Image Segmentation using Deep Lear

    作者:禪與計算機程序設(shè)計藝術(shù) Image segmentation is one of the key tasks in medical image analysis and computer vision that involves dividing an entire image into multiple parts or regions based on some criteria such as color, texture, shape, etc., so that each region represents a different object or structure present in the image. It helps to e

    2024年02月06日
    瀏覽(33)
  • 【論文閱讀筆記】SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    【論文閱讀筆記】SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    Du Y, Bai F, Huang T, et al. SegVol: Universal and Interactive Volumetric Medical Image Segmentation[J]. arXiv preprint arXiv:2311.13385, 2023.[代碼開源] 【論文概述】 本文思路借鑒于自然圖像分割領(lǐng)域的 SAM ,介紹了一種名為SegVol的先進醫(yī)學(xué)圖像分割模型,旨在構(gòu)建一種 圖像分割基礎(chǔ)模型 ,這是一個面向體

    2024年01月16日
    瀏覽(22)
  • 3D醫(yī)學(xué)圖像分割大模型 SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    3D醫(yī)學(xué)圖像分割大模型 SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    pub: 22 November, 2023 ArXiv [ paper] [ code] 1 體積圖像分割通過準(zhǔn)確提取器官、病變和組織等感興趣的區(qū)域,在醫(yī)學(xué)圖像分析中起著至關(guān)重要的作用,在腫瘤監(jiān)測、手術(shù)計劃、疾病診斷和優(yōu)化治療等臨床應(yīng)用中有著廣泛的應(yīng)用。 2 公開可用的體積醫(yī)學(xué)圖像數(shù)據(jù)集通常由來自不同類別的

    2024年02月03日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包