国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<menu id="caawq"><rt id="caawq"></rt></menu>

<samp id="caawq"></samp>

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程

1年前作者：m0_51579041分類：Toy博客閱讀(31)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

一、代碼

#---------------------------------------------------#
#   檢測圖片
#---------------------------------------------------#
def detect_image(self, image, count=False, name_classes=None):
    #---------------------------------------------------------#
    #   在這里將圖像轉(zhuǎn)換成RGB圖像，防止灰度圖在預(yù)測時(shí)報(bào)錯(cuò)。
    #   代碼僅僅支持RGB圖像的預(yù)測，所有其它類型的圖像都會(huì)轉(zhuǎn)化成RGB
    #---------------------------------------------------------#
    image       = cvtColor(image)
    #---------------------------------------------------#
    #   對(duì)輸入圖像進(jìn)行一個(gè)備份，后面用于繪圖
    #---------------------------------------------------#
    old_img     = copy.deepcopy(image)
    orininal_h  = np.array(image).shape[0]
    orininal_w  = np.array(image).shape[1]
    #---------------------------------------------------------#
    #   給圖像增加灰條，實(shí)現(xiàn)不失真的resize
    #   也可以直接resize進(jìn)行識(shí)別
    #---------------------------------------------------------#
    image_data, nw, nh  = resize_image(image, (self.input_shape[1],self.input_shape[0]))
    #---------------------------------------------------------#
    #   添加上batch_size維度
    #---------------------------------------------------------#
    image_data  = np.expand_dims(np.transpose(preprocess_input(np.array(image_data, np.float32)), (2, 0, 1)), 0)

    with torch.no_grad():
        images = torch.from_numpy(image_data)
        if self.cuda:
            images = images.cuda()
            
        #---------------------------------------------------#
        #   圖片傳入網(wǎng)絡(luò)進(jìn)行預(yù)測
        #---------------------------------------------------#
        pr = self.net(images)[0]
        #---------------------------------------------------#
        #   取出每一個(gè)像素點(diǎn)的種類
        #---------------------------------------------------#
        pr = F.softmax(pr.permute(1,2,0),dim = -1).cpu().numpy()
        #--------------------------------------#
        #   將灰條部分截取掉
        #--------------------------------------#
        pr = pr[int((self.input_shape[0] - nh) // 2) : int((self.input_shape[0] - nh) // 2 + nh), \
                int((self.input_shape[1] - nw) // 2) : int((self.input_shape[1] - nw) // 2 + nw)]
        #---------------------------------------------------#
        #   進(jìn)行圖片的resize
        #---------------------------------------------------#
        pr = cv2.resize(pr, (orininal_w, orininal_h), interpolation = cv2.INTER_LINEAR)
        #---------------------------------------------------#
        #   取出每一個(gè)像素點(diǎn)的種類
        #---------------------------------------------------#
        pr = pr.argmax(axis=-1)

        seg_img = np.reshape(np.array(self.colors, np.uint8)[np.reshape(pr, [-1])], [orininal_h, orininal_w, -1])
        #------------------------------------------------#
        #   將新圖片轉(zhuǎn)換成Image的形式
        #------------------------------------------------#
        image   = Image.fromarray(np.uint8(seg_img))
        #------------------------------------------------#
        #   將新圖與原圖及進(jìn)行混合
        #------------------------------------------------#
        image   = Image.blend(old_img, image, 0.7)

二、代碼逐步debug調(diào)試

(1)讀圖

#---------------------------------------------------------#
#   在這里將圖像轉(zhuǎn)換成RGB圖像，防止灰度圖在預(yù)測時(shí)報(bào)錯(cuò)。
#   代碼僅僅支持RGB圖像的預(yù)測，所有其它類型的圖像都會(huì)轉(zhuǎn)化成RGB
#---------------------------------------------------------#
image       = cvtColor(image)

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程,搭建自己的深度學(xué)習(xí)框架,語義分割,深度學(xué)習(xí),人工智能

(2) Letterbox

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程,搭建自己的深度學(xué)習(xí)框架,語義分割,深度學(xué)習(xí),人工智能

無論輸入的圖片尺寸多大，都會(huì)經(jīng)過letter_box后，變?yōu)?12x512尺寸

(3) 歸一化、HWC 轉(zhuǎn) CHW，并expand維度到NCHW,轉(zhuǎn)tensor

def preprocess_input(image):
    image /= 255.0
    return image
    
#---------------------------------------------------------#
#   添加上batch_size維度
#---------------------------------------------------------#
image_data  = np.expand_dims(np.transpose(preprocess_input(np.array(image_data, np.float32)), (2, 0, 1)), 0)

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程,搭建自己的深度學(xué)習(xí)框架,語義分割,深度學(xué)習(xí),人工智能

(4) 前向傳播

#---------------------------------------------------#
#   圖片傳入網(wǎng)絡(luò)進(jìn)行預(yù)測
#---------------------------------------------------#
pr = self.net(images)[0]

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程,搭建自己的深度學(xué)習(xí)框架,語義分割,深度學(xué)習(xí),人工智能
21個(gè)channel代表（20+1）個(gè)類別，512x512為模型輸入及輸入尺寸

(5) softmax 計(jì)算像素類別概率

#---------------------------------------------------#
#   取出每一個(gè)像素點(diǎn)的種類
#---------------------------------------------------#
pr = F.softmax(pr.permute(1,2,0),dim = -1).cpu().numpy()

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程,搭建自己的深度學(xué)習(xí)框架,語義分割,深度學(xué)習(xí),人工智能

經(jīng)過softmax后，512x512的mask圖中，每個(gè)位置(x,y)對(duì)應(yīng)的21個(gè)channel的值和為1。

(6) 截取灰條部分，并resize到原圖尺寸（逆letter_box）

            #--------------------------------------#
            #   將灰條部分截取掉
            #--------------------------------------#
            pr = pr[int((self.input_shape[0] - nh) // 2) : int((self.input_shape[0] - nh) // 2 + nh), \
                    int((self.input_shape[1] - nw) // 2) : int((self.input_shape[1] - nw) // 2 + nw)]
            #---------------------------------------------------#
            #   進(jìn)行圖片的resize
            #---------------------------------------------------#
            pr = cv2.resize(pr, (orininal_w, orininal_h), interpolation = cv2.INTER_LINEAR)

pr類型是np,array，所以可以通過這種方式進(jìn)行逆letter_box操作，將mask的寬高，還原到原始輸入圖片的寬高。

(7) 利用argmax，計(jì)算每個(gè)像素屬于的類別

#---------------------------------------------------#
#   取出每一個(gè)像素點(diǎn)的種類
#---------------------------------------------------#
pr = pr.argmax(axis=-1)

返回最后一個(gè)維度(channel)中，最大值所對(duì)應(yīng)的索引，即類別。例如，像素點(diǎn)（x1,y1）所對(duì)應(yīng)的21個(gè)channel中，第5個(gè)channel的值最大，則像素點(diǎn)（x1,y1）對(duì)應(yīng)類別則是class=5。

(8) 可視化

seg_img = np.reshape(np.array(self.colors, np.uint8)[np.reshape(pr, [-1])], [orininal_h, orininal_w, -1])
#------------------------------------------------#
#   將新圖片轉(zhuǎn)換成Image的形式
#------------------------------------------------#
image   = Image.fromarray(np.uint8(seg_img))
#------------------------------------------------#
#   將新圖與原圖及進(jìn)行混合
#------------------------------------------------#
image   = Image.blend(old_img, image, 0.7)

【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程,搭建自己的深度學(xué)習(xí)框架,語義分割,深度學(xué)習(xí),人工智能
將預(yù)測的結(jié)果與原圖進(jìn)行混合。文章來源地址http://www.zghlxwxcb.cn/news/detail-853081.html

到了這里，關(guān)于【深度學(xué)習(xí)實(shí)戰(zhàn)（6）】搭建通用的語義分割推理流程的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

深度學(xué)習(xí)在語義分割中的進(jìn)展與應(yīng)用
埃弗頓·戈梅德（Everton Gomede）?
2024年02月03日
瀏覽(22)
計(jì)算機(jī)視覺與深度學(xué)習(xí)-圖像分割-視覺識(shí)別任務(wù)01-語義分割-【北郵魯鵬】
給每個(gè)像素分配類別標(biāo)簽。不區(qū)分實(shí)例，只考慮像素類別。滑動(dòng)窗口缺點(diǎn) 重疊區(qū)域的特征反復(fù)被計(jì)算，效率很低。所以針對(duì)該問題提出了新的解決方案–全卷積。讓整個(gè)網(wǎng)絡(luò)只包含卷積層，一次性輸出所有像素的類別預(yù)測。全卷積優(yōu)點(diǎn) 不用將圖片分為一個(gè)個(gè)小區(qū)域然后再
2024年02月07日
瀏覽(19)
基于深度學(xué)習(xí)的自動(dòng)駕駛汽車語義分割與場景標(biāo)注算法研究。
自動(dòng)駕駛汽車是當(dāng)前研究的熱點(diǎn)領(lǐng)域之一，其中基于深度學(xué)習(xí)的語義分割與場景標(biāo)注算法在自動(dòng)駕駛汽車的視覺感知中具有重要作用。本文將圍繞自動(dòng)駕駛汽車的語義分割與場景標(biāo)注算法展開研究。一、研究背景隨著人工智能技術(shù)的不斷發(fā)展，自動(dòng)駕駛汽車逐漸成為汽車產(chǎn)
2024年02月07日
瀏覽(28)
PointNet：利用深度學(xué)習(xí)對(duì)點(diǎn)云進(jìn)行3D分類和語義分割
參考自，PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation 代碼倉庫地址為：https://github.com/charlesq34/pointnet/ 介紹這次介紹的是一個(gè)比較基礎(chǔ)的工作，針對(duì)空間點(diǎn)云，進(jìn)行分類或者語義分割的框架，現(xiàn)在通常也被用作對(duì)RGB-D圖像進(jìn)行特征提取的部分。該工作的目的就是
2024年02月03日
瀏覽(23)
使用爬蟲代碼獲得深度學(xué)習(xí)目標(biāo)檢測或者語義分割中的圖片。
問題描述：目標(biāo)檢測或者圖像分割需要大量的數(shù)據(jù)，如果手動(dòng)從網(wǎng)上找的話會(huì)比較慢，這時(shí)候，我們可以從網(wǎng)上爬蟲下來，然后自己篩選即可。代碼如下（不要忘記安裝代碼依賴的庫）：這里以搜索明星的圖片為例，運(yùn)行代碼，然后根據(jù)提示輸入搜索圖片的名字→搜索圖片
2024年02月10日
瀏覽(27)
可解釋深度學(xué)習(xí)：從感受野到深度學(xué)習(xí)的三大基本任務(wù)：圖像分類，語義分割，目標(biāo)檢測，讓你真正理解深度學(xué)習(xí)
目錄 ? 前言一、初識(shí)感受野 1.1猜一猜他是什么？ 1.2人眼視覺系統(tǒng)下的感受野 1.3深度神經(jīng)網(wǎng)絡(luò)中的感受野 1.3.1感受野的性質(zhì) 1.3.2感受野的定義 1.3.3舉一個(gè)例子 1.3.4以VGG網(wǎng)絡(luò)為例二、感受野的計(jì)算 2.1 哪些操作能夠改變感受野？ 2.2 感受野的計(jì)算公式 2.3 感受野的中心位置計(jì)算
2024年02月02日
瀏覽(26)
深度學(xué)習(xí)：使用UNet做圖像語義分割，訓(xùn)練自己制作的數(shù)據(jù)集，詳細(xì)教程
語義分割(Semantic Segmentation)是圖像處理和機(jī)器視覺一個(gè)重要分支。與分類任務(wù)不同，語義分割需要判斷圖像每個(gè)像素點(diǎn)的類別，進(jìn)行精確分割。語義分割目前在自動(dòng)駕駛、自動(dòng)摳圖、醫(yī)療影像等領(lǐng)域有著比較廣泛的應(yīng)用。我總結(jié)了使用UNet網(wǎng)絡(luò)做圖像語義分割的方法，教程很詳
2024年02月03日
瀏覽(43)
計(jì)算機(jī)設(shè)計(jì)大賽深度學(xué)習(xí)人體語義分割在彈幕防遮擋上的實(shí)現(xiàn) - python
?? 優(yōu)質(zhì)競賽項(xiàng)目系列，今天要分享的是 ?? 深度學(xué)習(xí)人體語義分割在彈幕防遮擋上的應(yīng)用該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！ ??學(xué)長這里給一個(gè)題目綜合評(píng)分(每項(xiàng)滿分5分) 難度系數(shù)：3分工作量：3分創(chuàng)新點(diǎn)：3分 ?? 更多資料, 項(xiàng)目分享： https://gi
2024年02月20日
瀏覽(642)
【深度學(xué)習(xí)】語義分割：論文閱讀（NeurIPS 2021）MaskFormer: per-pixel classification is not all you need
論文：Per-Pixel Classification is Not All You Need for Semantic Segmentation / MaskFormer 代碼：代碼官方-代碼筆記：作者筆記說明【論文筆記】MaskFormer: Per-Pixel Classification is Not All You Need for Semantic Segmentation 總結(jié)思路清晰-簡潔【MaskFormer】Per-Pixel Classification is Not All You Needfor Semantic Segmenta
2024年02月04日
瀏覽(27)
【3-D深度學(xué)習(xí)：肺腫瘤分割】創(chuàng)建和訓(xùn)練 V-Net 神經(jīng)網(wǎng)絡(luò)，并從 3D 醫(yī)學(xué)圖像中對(duì)肺腫瘤進(jìn)行語義分割研究（Matlab代碼實(shí)現(xiàn)）
????????? 歡迎來到本博客 ???????? ??博主優(yōu)勢： ?????? 博客內(nèi)容盡量做到思維縝密，邏輯清晰，為了方便讀者。 ?? 座右銘：行百里者，半于九十。 ?????? 本文目錄如下： ?????? 目錄 ??1 概述 ??2 運(yùn)行結(jié)果 ??3?參考文獻(xiàn) ??4 Matlab代碼實(shí)現(xiàn) 使用
2024年02月15日
瀏覽(89)

<dfn id="ussu4"></dfn>

<small id="ussu4"></small>

<button id="ussu4"></button>

<sup id="ussu4"><li id="ussu4"></li></sup>