国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

計算機視覺智能中醫(yī)（三）：基于Unet模型的舌頭舌體圖片分割

2年前作者：藍色是天分類：Toy博客閱讀(22)違法舉報

這篇具有很好參考價值的文章主要介紹了計算機視覺智能中醫(yī)（三）：基于Unet模型的舌頭舌體圖片分割。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

返回至系列文章導(dǎo)航博客

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

完整項目下載：下載鏈接
【閑魚】https://m.tb.cn/h.52C8psW?tk=fMpwdwfqjz3 CZ3457 「我在閑魚發(fā)布了【舌象數(shù)據(jù)集，詳情見csdn！http://t.csdn.cn】」
點擊鏈接直接打開

1 簡介

舌體分割是舌診檢測的基礎(chǔ)，唯有做到準確分割舌體才能保證后續(xù)訓(xùn)練以及預(yù)測的準確性。此部分真正的任務(wù)是在用戶上傳的圖像中準確尋找到屬于舌頭的像素點。舌體分割屬于生物醫(yī)學(xué)圖像分割領(lǐng)域。分割效果如下：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

2 數(shù)據(jù)集介紹

舌象數(shù)據(jù)集包含舌象原圖以及分割完成的二元圖，共979*2張，示例圖片如下：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

3 模型介紹

U-Net是一個優(yōu)秀的語義分割模型，在中e診中U-Net共三部分，分別是主干特征提取部分、加強特征提取部分、預(yù)測部分。利用主干特征提取部分獲得5個初步有效的特征層，之后通過加強特征提取部分對上述獲取到的5個有效特征層進行上采樣并進行特征融合。最終獲得了一個結(jié)合所有特征的有效特征層，并利用最終有效特征層對像素點進行預(yù)測，找到屬于舌體的像素點。具體操作詳情如下圖所示：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

進行標注后利用PyTorch框架構(gòu)建U-Net模型抓取舌象圖像特征，預(yù)測舌象圖像標簽。為對模型進行評價，在訓(xùn)練中計算每次循環(huán)的平均損失率。最終每張圖的損失了約為2%左右。具體的平均損失率變化如下圖：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

訓(xùn)練共歷時4天，共979張標記圖像，最終平均預(yù)測損失率約為2%。模型預(yù)測，即舌體分割的效果非常理想，在此展示當損失率為40%與損失率為2%時的分割結(jié)果示例，示例如下圖所示：
（1）損失率為40%時分割結(jié)果圖

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

（2）損失率為2%時分割結(jié)果圖

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

根據(jù)模型預(yù)測結(jié)果對屬于舌體的像素點進行匹配提取，將不屬于舌體的部分以墨綠色進行填充，最終的舌體分割效果圖如下：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

4 代碼實現(xiàn)細節(jié)

4.1 相關(guān)文件介紹

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

notedata文件夾中有分割標注圖片、ordata文件夾中有原始圖片、params文件夾中有訓(xùn)練模型文件、result文件夾中有測試樣例圖片、train_image文件夾中有訓(xùn)練過程圖片。

4.2 utils.py

工具類：由于數(shù)據(jù)集中各個圖片的大小是不一樣的，為了保障后續(xù)工作可以順利進行，這里應(yīng)該定義一個工具類將圖片可以等比例縮放至256*256（可以改看自己需求）。

from PIL import Image

def keep_image_size_open(path, size=(256, 256)):
    img = Image.open(path)
    temp = max(img.size)
    mask = Image.new('RGB', (temp, temp), (0,0,0))
    mask.paste(img, (0,0))
    mask = mask.resize(size)
    return mask

4.3 data.py

這里主要是將數(shù)據(jù)集中標簽圖片與原圖進行匹配合并~具體步驟代碼注釋中有詳解！

import os
from torch.utils.data import Dataset
from utils import *
from torchvision import transforms
transform = transforms.Compose([
    transforms.ToTensor()
    ])

class MyDataset(Dataset):
    def __init__(self, path):   #拿到標簽文件夾中圖片的名字
        self.path = path
        self.name = os.listdir(os.path.join(path, 'notedata'))
        
    def __len__(self):          #計算標簽文件中文件名的數(shù)量
        return len(self.name)
    
    def __getitem__(self, index):   #將標簽文件夾中的文件名在原圖文件夾中進行匹配（由于標簽是png的格式而原圖是jpg所以需要進行一個轉(zhuǎn)化）
        segment_name = self.name[index] #XX.png
        segment_path = os.path.join(self.path, 'notedata', segment_name)
        image_path = os.path.join(self.path, 'ordata', segment_name.replace('png', 'jpg')) #png與jpg進行轉(zhuǎn)化
        
        segment_image = keep_image_size_open(segment_path)  #等比例縮放
        image = keep_image_size_open(image_path)            #等比例縮放
        
        return transform(image), transform(segment_image)

if __name__ == "__main__":
    data = MyDataset("E:/ITEM_TIME/project/UNET/")
    print(data[0][0].shape)
    print(data[0][1].shape)

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

可見數(shù)據(jù)集已經(jīng)規(guī)整！

4.4 net.py

Unet網(wǎng)絡(luò)的編寫！

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

from torch import nn
import torch
from torch.nn import functional as F


class Conv_Block(nn.Module):   #卷積
    def __init__(self, in_channel, out_channel):
        super(Conv_Block, self).__init__()
        self.layer = nn.Sequential(
            nn.Conv2d(in_channel, out_channel, 3, 1, 1, padding_mode='reflect', 
                      bias=False),
            nn.BatchNorm2d(out_channel),
            nn.Dropout2d(0.3),
            nn.LeakyReLU(),
            nn.Conv2d(out_channel, out_channel, 3, 1, 1, padding_mode='reflect', 
                      bias=False),
            nn.BatchNorm2d(out_channel),
            nn.Dropout2d(0.3),
            nn.LeakyReLU()
            )
        
    def forward(self, x):
        return self.layer(x)
    
    
class DownSample(nn.Module):    #下采樣
    def __init__(self, channel):
        super(DownSample, self).__init__()
        self.layer = nn.Sequential(
            nn.Conv2d(channel, channel,3,2,1,padding_mode='reflect',
                      bias=False),
            nn.BatchNorm2d(channel),
            nn.LeakyReLU()
            
            )
        
    def forward(self,x):
        return self.layer(x)
    
    
class UpSample(nn.Module):   #上采樣（最鄰近插值法）
    def __init__(self, channel):
        super(UpSample, self).__init__()
        self.layer = nn.Conv2d(channel, channel//2,1,1)
        
    def forward(self,x, feature_map):
        up = F.interpolate(x, scale_factor=2, mode='nearest')
        out = self.layer(up)
        return torch.cat((out,feature_map),dim=1)
    
    
class UNet(nn.Module):
    def __init__(self):
        super(UNet, self).__init__()
        self.c1=Conv_Block(3,64)
        self.d1=DownSample(64)
        self.c2=Conv_Block(64, 128)
        self.d2=DownSample(128)
        self.c3=Conv_Block(128,256)
        self.d3=DownSample(256)
        self.c4=Conv_Block(256,512)
        self.d4=DownSample(512)
        self.c5=Conv_Block(512,1024)
        self.u1=UpSample(1024)
        self.c6=Conv_Block(1024,512)
        self.u2=UpSample(512)
        self.c7=Conv_Block(512,256)
        self.u3=UpSample(256)
        self.c8=Conv_Block(256,128)
        self.u4=UpSample(128)
        self.c9=Conv_Block(128,64)
        
        self.out = nn.Conv2d(64,3,3,1,1)
        self.Th = nn.Sigmoid()

       
        
    def forward(self,x):
        R1 = self.c1(x)
        R2 = self.c2(self.d1(R1))
        R3 = self.c3(self.d2(R2))
        R4 = self.c4(self.d3(R3))
        R5 = self.c5(self.d4(R4))
        
        O1 = self.c6(self.u1(R5,R4))
        O2 = self.c7(self.u2(O1,R3))
        O3 = self.c8(self.u3(O2,R2))
        O4 = self.c9(self.u4(O3,R1))
        
        return self.Th(self.out(O4))
    
if __name__ == "__main__":
    x = torch.randn(2, 3, 256, 256)
    net  = UNet()
    print(net(x).shape)

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

結(jié)果匹配說明沒問題~

4.5 train.py

訓(xùn)練代碼~

from torch import nn
from torch import optim
import torch
from data import *
from net import *
from torchvision.utils import save_image
from torch.utils.data import DataLoader

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
weight_path = 'params/unet.pth'
data_path = 'E:/ITEM_TIME/project/UNET/'
save_path = 'train_image'

if __name__ == "__main__":
    
    dic = []###
    
    data_loader = DataLoader(MyDataset(data_path),batch_size=3,shuffle=True)  #batch_size用3/4都可以看電腦性能
    net = UNet().to(device)
    if os.path.exists(weight_path):
        net.load_state_dict(torch.load(weight_path))
        print('success load weight')
    else:
        print('not success load weight')
        
    opt = optim.Adam(net.parameters())
    loss_fun = nn.BCELoss()
    
    epoch = 1
    while True:
        avg = []###
        for i, (image,segment_image) in enumerate(data_loader):
            image,segment_image = image.to(device),segment_image.to(device)
            
            out_image = net(image)
            train_loss = loss_fun(out_image, segment_image)
            
            opt.zero_grad()
            train_loss.backward()
            opt.step()
            
            if i%5 == 0:
                print('{}-{}-train_loss===>>{}'.format(epoch,i,train_loss.item()))
                
            if i%50 == 0:
                torch.save(net.state_dict(), weight_path)
            #為方便看效果將原圖、標簽圖、訓(xùn)練圖進行拼接
            _image = image[0]
            _segment_image = segment_image[0]
            _out_image = out_image[0]
            
            img = torch.stack([_image,_segment_image,_out_image],dim=0)
            save_image(img, f'{save_path}/{i}.jpg')
            
            avg.append(float(train_loss.item()))###
            
        
        
        loss_avg = sum(avg)/len(avg)
        
        dic.append(loss_avg)
        
        epoch += 1
    print(dic)

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

可見代碼成功運行~上面的損失率是在訓(xùn)練4天后的效果，剛開始肯定很大很差，需要有耐心！

4.6 test.py

測試代碼，對圖片進行智能分割~

from net import *
from utils import keep_image_size_open
import os
import torch
from data import *
from torchvision.utils import save_image
from PIL import Image
import numpy as np

net = UNet().cpu()  #或者放在cuda上

weights = 'params/unet.pth'  #導(dǎo)入網(wǎng)絡(luò)

if os.path.exists(weights):
    net.load_state_dict(torch.load(weights))
    print('success')
else:
    print('no loading')
    
_input = 'xxxx.jpg'  #導(dǎo)入測試圖片

img = keep_image_size_open(_input)


img_data = transform(img)
print(img_data.shape)

img_data = torch.unsqueeze(img_data, dim=0)

print(img_data)
out = net(img_data)

save_image(out, 'result/result.jpg')
save_image(img_data, 'result/orininal.jpg')

print(out)

#E:\ITEM_TIME\UNET\ordata\4292.jpg

img_after = Image.open(r"result\result.jpg")
img_before = Image.open(r"result\orininal.jpg")
#img.show()
img_after_array = np.array(img_after)#把圖像轉(zhuǎn)成數(shù)組格式img = np.asarray(image)
img_before_array = np.array(img_before)

shape_after = img_after_array.shape
shape_before = img_before_array.shape

print(shape_after,shape_before)

#將分隔好的圖片進行對應(yīng)像素點還原,即將黑白分隔圖轉(zhuǎn)化為有顏色的提取圖

if shape_after == shape_before:
    height = shape_after[0]
    width = shape_after[1]
    dst = np.zeros((height,width,3))
    for h in range(0,height):
        for w in range (0,width):
            (b1,g1,r1) = img_after_array[h,w]
            (b2,g2,r2) = img_before_array[h,w]
            
            if (b1, g1, r1) <= (90, 90, 90): 
                img_before_array[h, w] = (144,238,144) 
            dst[h,w] = img_before_array[h,w]
    img2 = Image.fromarray(np.uint8(dst))
    img2.save(r"result\blend.png","png")

else:
    print("失??！")

結(jié)果展示：
（1）原圖（orininal.jpg）：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

（2）模型分割圖（result.jpg）：

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

（3）對應(yīng)像素點還原圖（blend.png）：就是將（2）中的圖白色的部分用原圖像素點填充，黑色的部分用綠色填充

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能

至此，舌體分割完成！

舌機器學(xué),智能中醫(yī)舌診-中e診,機器學(xué)習(xí),計算機視覺,舌體,圖像分割,人工智能文章來源地址http://www.zghlxwxcb.cn/news/detail-665048.html

到了這里，關(guān)于計算機視覺智能中醫(yī)（三）：基于Unet模型的舌頭舌體圖片分割的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

醫(yī)學(xué)圖像分割方向優(yōu)質(zhì)的論文及其代碼【Medical Image Segmentation】UNet、transformer、計算機視覺
? 作者：Yifei Chen, Chenyan Zhang, Yifan Ke, Yiyu Huang, Xuezhou Dai, Feiwei Qin? ?中文摘要：由于收集過程具有挑戰(zhàn)性、標記成本高、信噪比低以及生物醫(yī)學(xué)圖像特征復(fù)雜，傳統(tǒng)的監(jiān)督學(xué)習(xí)方法在醫(yī)學(xué)圖像分割方面歷來遇到一定的限制。本文提出了一種半監(jiān)督模型DFCPS，創(chuàng)新性地融合了
2024年04月13日
瀏覽(96)
基于深度學(xué)習(xí)的計算機視覺在智能交通系統(tǒng)中的應(yīng)用
作者：禪與計算機程序設(shè)計藝術(shù) 隨著智能手機的普及，自動駕駛領(lǐng)域也逐漸被激烈討論。自動駕驲系統(tǒng)（Autonomous Driving System，ADS）在一定程度上能夠代替人類駕駛員，減少人因疏忽造成的安全隱患，提高行駛效率。但是目前市面上的車聯(lián)網(wǎng)方案仍然存在諸多不足。智能交通
2024年02月12日
瀏覽(27)
基于深度學(xué)習(xí)的計算機視覺：應(yīng)用于智能檢測和識別的新技術(shù)
作者：禪與計算機程序設(shè)計藝術(shù) 目前，深度學(xué)習(xí)技術(shù)在圖像處理、目標檢測、對象識別等領(lǐng)域已經(jīng)取得了顯著的進步。隨著大數(shù)據(jù)的產(chǎn)生、深度神經(jīng)網(wǎng)絡(luò)的不斷提升，計算機視覺領(lǐng)域也成為自然界圖像理解的一項熱門研究方向。近年來，基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)（CNN）在
2024年02月06日
瀏覽(30)
人工智能詳細筆記：計算機視覺、目標檢測與R-CNN系列 YOLO系列模型
計算機視覺概述：計算機視覺是一種利用計算機算法和數(shù)學(xué)模型來模擬和自動化人類視覺的學(xué)科領(lǐng)域。計算機視覺的地位：計算機視覺（CV）與自然語言處理（NLP）、語音識別（SR）并列為機器學(xué)習(xí)方向的三大熱點方向。計算機視覺的常見任務(wù) ：下面將從粗粒度到細粒度介
2024年02月08日
瀏覽(30)
畢業(yè)設(shè)計選題：基于深度學(xué)習(xí)的舌頭分割系統(tǒng) 人工智能 YOLO 計算機視覺
目錄前言課題背景和意義實現(xiàn)技術(shù)思路一、算法理論基礎(chǔ) 1.1?Snake模型? 1.2 幾何約束? 1.3?切片重組二、?數(shù)據(jù)集三、實驗及結(jié)果分析最后 ? ? ??大四是整個大學(xué)期間最忙碌的時光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準備,一邊要為畢業(yè)設(shè)計耗費大量精力。
2024年02月19日
瀏覽(581)
畢業(yè)設(shè)計：基于機器學(xué)習(xí)的硬幣檢測識別系統(tǒng) 人工智能 YOLO 計算機視覺
目錄前言課題背景和意義實現(xiàn)技術(shù)思路一、?硬幣檢測方法 1.1?規(guī)格、變形監(jiān)測 1.2?變色檢測二、?數(shù)據(jù)集三、實驗及結(jié)果分析 3.1?實驗環(huán)境搭建 3.2?模型訓(xùn)練最后 ? ? ??大四是整個大學(xué)期間最忙碌的時光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準備,一邊要為
2024年02月20日
瀏覽(100)
畢業(yè)設(shè)計選題：基于機器學(xué)習(xí)的票據(jù)表格分割識別系統(tǒng) 人工智能 YOLO 計算機視覺
目錄前言課題背景和意義實現(xiàn)技術(shù)思路一、?算法理論基礎(chǔ) 1.1 卷積神經(jīng)網(wǎng)絡(luò) 1.3 EM算法二、實驗及結(jié)果分析 2.1?數(shù)據(jù)處理 2.2?模型訓(xùn)練 3.2?結(jié)果分析最后 ? ? ??大四是整個大學(xué)期間最忙碌的時光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準備,一邊要為畢業(yè)設(shè)計耗
2024年02月22日
瀏覽(96)
畢業(yè)設(shè)計選題基于深度學(xué)習(xí)的人流量預(yù)測系統(tǒng) 人工智能 YOLO 計算機視覺
目錄 ?前言設(shè)計思路一、課題背景與意義二、算法理論原理 2.1 卷積神經(jīng)網(wǎng)絡(luò) 2.2 注意力機制三、檢測的實現(xiàn) 3.1 數(shù)據(jù)處理 3.2 實驗環(huán)境搭建 3.3 實驗及結(jié)果分析最后 ? ? ? ???大四是整個大學(xué)期間最忙碌的時光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準備,一邊要
2024年01月19日
瀏覽(97)
機器學(xué)習(xí)筆記 - 基于Python發(fā)現(xiàn)最佳計算機視覺模型的神經(jīng)架構(gòu)搜索技術(shù)NAS
????????近年來，隨著深度學(xué)習(xí)技術(shù)的興起，計算機視覺領(lǐng)域取得了巨大進步。事實證明，卷積神經(jīng)網(wǎng)絡(luò) (CNN) 在圖像識別任務(wù)中異常強大，但針對特定問題設(shè)計最佳架構(gòu)仍然是一項具有挑戰(zhàn)性的任務(wù)。這就是神經(jīng)架構(gòu)搜索（NAS）發(fā)揮作用的地方。NAS 是一種尖端技術(shù)，可以
2024年02月14日
瀏覽(25)
計算機視覺的應(yīng)用13-基于SSD模型的城市道路積水識別的應(yīng)用項目
大家好，我是微學(xué)AI，今天給大家介紹一下計算機視覺的應(yīng)用13-基于SSD模型的城市道路積水識別的應(yīng)用項目，輔助城市交通管理。今年第11號臺風(fēng)“海葵”后部云團的影響，福州地區(qū)的降雨量突破了歷史極值，多出地方存在嚴重的積水。城市道路積水是造成交通擁堵、車輛事故
2024年02月09日
瀏覽(20)

<ul id="keoch"><kbd id="keoch"></kbd></ul>

<thead id="keoch"><label id="keoch"></label></thead>