国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

[SS]語義分割——基礎(chǔ)知識(shí)

這篇具有很好參考價(jià)值的文章主要介紹了[SS]語義分割——基礎(chǔ)知識(shí)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

語義分割前言?

目錄

一、定義

1、概念?

2、 常見分割任務(wù)

3、建筑物提取(Building Footprint Extraction)

二、任務(wù)數(shù)據(jù)

1、數(shù)據(jù)集格式

2、結(jié)果具體形式

三、評(píng)價(jià)指標(biāo)與標(biāo)注

1、評(píng)價(jià)指標(biāo)

2、標(biāo)注工具


一、定義

1、概念?

????????語義分割(Semantic Segmentation)是計(jì)算機(jī)視覺中的一項(xiàng)任務(wù),目標(biāo)是將圖像中的每個(gè)像素按其語義類別進(jìn)行分類。與傳統(tǒng)的目標(biāo)檢測不同,語義分割對(duì)圖像中的每個(gè)像素都進(jìn)行分類,而不是只關(guān)注物體的邊界框。

????????語義分割的目標(biāo)是給圖像中的每個(gè)像素分配一個(gè)類別標(biāo)簽,通常使用顏色編碼來可視化不同的類別。例如,將圖像中的道路像素標(biāo)記為藍(lán)色,建筑物像素標(biāo)記為紅色等。

????????語義分割在許多計(jì)算機(jī)視覺任務(wù)中起到重要作用,如自動(dòng)駕駛、智能監(jiān)控、圖像編輯等。它可以提供詳細(xì)的場景理解,使計(jì)算機(jī)能夠準(zhǔn)確地理解圖像中的不同物體和區(qū)域,并在各種應(yīng)用中進(jìn)行更精確的分析和決策。

????????近年來,隨著深度學(xué)習(xí)的快速發(fā)展,基于深度學(xué)習(xí)的語義分割方法取得了顯著的進(jìn)展。常用的深度學(xué)習(xí)模型包括全卷積網(wǎng)絡(luò)(FCN)、U-Net、DeepLab等,它們能夠準(zhǔn)確地分割圖像,并在各種實(shí)際場景中取得了優(yōu)秀的性能。

2、 常見分割任務(wù)

語義分割、實(shí)例分割、全景分割?這些基本概念別再搞混了!

語義 VS 實(shí)例 VS 全景分割?

語義分割(Semantic Segmentation)

????????語義分割是將圖像分割為不同的語義區(qū)域,即將圖像中的每個(gè)像素都標(biāo)記為屬于哪個(gè)語義類別。換句話說,它的目標(biāo)是為圖像中的每個(gè)像素分配一個(gè)語義標(biāo)簽,例如人、車、樹、建筑等。語義分割關(guān)注的是圖像中的每個(gè)像素的語義信息,不關(guān)心具體的實(shí)例。

實(shí)例分割(Instance Segmentation)

????????實(shí)例分割是將圖像中的目標(biāo)物體分割為獨(dú)立的實(shí)例,即為每個(gè)目標(biāo)分配唯一的標(biāo)識(shí)符,并進(jìn)行像素級(jí)的分割。與語義分割不同,實(shí)例分割不僅關(guān)注目標(biāo)的語義類別,還關(guān)注目標(biāo)的個(gè)體性。因此,在實(shí)例分割中,同一類別的不同目標(biāo)物體會(huì)被分配不同的標(biāo)識(shí)符,以區(qū)分它們。

全景分割(Panoramic Segmentation)

????????全景分割是語義分割和實(shí)例分割的融合,旨在將圖像中的每個(gè)像素分配一個(gè)語義標(biāo)簽,并為每個(gè)目標(biāo)物體分配唯一的標(biāo)識(shí)符,同時(shí)區(qū)分不同的實(shí)例。全景分割可以視為將圖像中的每個(gè)像素標(biāo)記為語義類別和實(shí)例標(biāo)識(shí)符的任務(wù)。實(shí)質(zhì)上,全景分割是一種綜合性的圖像分割任務(wù),旨在提供對(duì)圖像中所有物體的語義信息和個(gè)體信息。

3、建筑物提取(Building Footprint Extraction)

????????建筑物提取任務(wù)BFE(Building Footprint Extraction)是指從高分辨率遙感圖像中準(zhǔn)確地提取出建筑物的輪廓或邊界信息。這是一項(xiàng)具有重要應(yīng)用價(jià)值的任務(wù),可以用于城市規(guī)劃、地理信息系統(tǒng)(GIS)、自動(dòng)駕駛、災(zāi)害評(píng)估等領(lǐng)域。

????????BFE任務(wù)的挑戰(zhàn)在于建筑物在圖像中呈現(xiàn)出各種形狀、大小和復(fù)雜性。為了解決這個(gè)問題,研究者們提出了各種方法和算法。以下是一些常用的BFE方法:

  1. 基于圖像特征的方法:這些方法利用圖像的顏色、紋理、形狀等特征來區(qū)分建筑物和非建筑物。例如,可以使用邊緣檢測、紋理分析、形狀匹配等技術(shù)來提取建筑物的邊界。

  2. 基于機(jī)器學(xué)習(xí)的方法:這些方法使用機(jī)器學(xué)習(xí)算法來學(xué)習(xí)建筑物和非建筑物的分類器。常用的算法包括支持向量機(jī)(SVM)、隨機(jī)森林(Random Forest)和深度學(xué)習(xí)模型等。這些方法需要大量的標(biāo)注數(shù)據(jù)和特征工程。

  3. 基于分割的方法:這些方法將建筑物提取任務(wù)看作是像素級(jí)的語義分割任務(wù),利用分割模型將每個(gè)像素分類為建筑物或非建筑物。深度學(xué)習(xí)模型如U-Net、Mask R-CNN等常被用于此類方法。

  4. 基于無監(jiān)督學(xué)習(xí)的方法:這些方法通過對(duì)圖像進(jìn)行聚類和分割來提取建筑物。常用的技術(shù)包括基于顏色、紋理和形狀的聚類分析、超像素分割等。

  5. 結(jié)合多源數(shù)據(jù)的方法:這些方法將多源數(shù)據(jù)(如高分辨率遙感圖像、激光雷達(dá)數(shù)據(jù)等)結(jié)合起來,通過融合不同數(shù)據(jù)源的信息來提高建筑物提取的準(zhǔn)確性。

????????BFE是一個(gè)復(fù)雜的任務(wù),目前仍然存在一些挑戰(zhàn)和問題,如建筑物遮擋、復(fù)雜背景、低對(duì)比度等。未來的研究將繼續(xù)致力于提高建筑物提取的準(zhǔn)確性和魯棒性,以滿足實(shí)際應(yīng)用的需求。

二、任務(wù)數(shù)據(jù)

1、數(shù)據(jù)集格式

PASCAL VOC2012數(shù)據(jù)集介紹

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

????????PASCAL VOC數(shù)據(jù)集提供一個(gè)PNG圖片(P模式),在圖片中記錄每個(gè)像素所屬的類別信息。需要注意的是,提供的PNG圖片是用調(diào)色板的模式進(jìn)行存儲(chǔ),為1通道圖片,圖象呈彩色是因?yàn)獒槍?duì)像素0到255提供了一個(gè)調(diào)色板,針對(duì)每個(gè)像素值都對(duì)應(yīng)一個(gè)顏色,所以可以將1通道的圖片映射到彩色的圖片上。?

notes:

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

? ? ? ? 針對(duì)目標(biāo)的邊緣,會(huì)有特殊的顏色進(jìn)行分割,或者圖片特殊區(qū)域也會(huì)用特殊顏色進(jìn)行填充。該特殊顏色對(duì)應(yīng)的像素值是255,在訓(xùn)練過程中計(jì)算損失時(shí)會(huì)忽略數(shù)值為255的地方,針對(duì)目標(biāo)邊緣的類別劃分并不容易,包括有些不容易分割的目標(biāo)也可以進(jìn)行填充,這樣就可以忽略,在訓(xùn)練模型時(shí)候就不會(huì)計(jì)算這部分損失。

MS COCO數(shù)據(jù)集介紹以及pycocotools簡單使用?

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

? ? ? ? MS COCO數(shù)據(jù)集中提供的是針對(duì)圖片中每一個(gè)目標(biāo)都給出了多邊形的坐標(biāo)形式,將坐標(biāo)點(diǎn)連起來就對(duì)應(yīng)了目標(biāo)所在的區(qū)域。在使用中需要將多邊形坐標(biāo)信息解碼成PNG圖片。計(jì)算損失時(shí)將預(yù)測的每個(gè)像素對(duì)應(yīng)的類別與真實(shí)標(biāo)簽的每一個(gè)類別進(jìn)行對(duì)比計(jì)算,所以在計(jì)算損失時(shí)希望得到PNG圖象的。

2、結(jié)果具體形式

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

? ? ? ? 單通道圖片,加上調(diào)色板顯示彩色。如圖,背景的像素值為0,對(duì)應(yīng)飛機(jī)的位置像素值為1,對(duì)應(yīng)人的位置像素值等于15?;叶葓D片顯示效果遠(yuǎn)不如調(diào)色板顯彩效果。每個(gè)像素的數(shù)值對(duì)應(yīng)了每個(gè)類別的索引。

三、評(píng)價(jià)指標(biāo)與標(biāo)注

1、評(píng)價(jià)指標(biāo)

Pixel Accuracy(Global Acc)

?

  • 在預(yù)測標(biāo)簽圖像中所有預(yù)測正確的像素個(gè)數(shù)的總和除以這幅圖片的總像素個(gè)數(shù)。?

mean Accuracy

?

  • ?每個(gè)類別的Accuracy計(jì)算出來,再進(jìn)行求和取平均操作。

mean IoU

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類?

  • 計(jì)算每個(gè)類別的IoU,然后每個(gè)類別求平均操作。目標(biāo)IoU交并比計(jì)算是將兩個(gè)目標(biāo)的交集面積比上兩個(gè)目標(biāo)的并集面積,公式的含義則是該類別的正確預(yù)測像素個(gè)數(shù)比上真實(shí)標(biāo)簽與預(yù)測像素的并集面積,并集計(jì)算過程為真實(shí)標(biāo)簽面積加上錯(cuò)誤預(yù)測面積減去正確預(yù)測面積。?

notes:?

  • :類別被預(yù)測成類別的像素個(gè)數(shù),如為類別被預(yù)測成類別的像素個(gè)數(shù),即正確像素個(gè)數(shù)
  • :目標(biāo)類別個(gè)數(shù)(包含背景)
  • :目標(biāo)類別的總像素個(gè)數(shù)(真實(shí)標(biāo)簽)

?構(gòu)建混淆矩陣進(jìn)行計(jì)算

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

  • 表示類別被預(yù)測為的像素個(gè)數(shù),即矩陣正對(duì)角線上對(duì)應(yīng)的是被正確預(yù)測類別的像素?cái)?shù)量
  • 表示類別被預(yù)測為的像素個(gè)數(shù),如為類別0被預(yù)測為類別1的像素個(gè)數(shù)

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

[SS]語義分割——基礎(chǔ)知識(shí),語義分割,深度學(xué)習(xí),分類

2、標(biāo)注工具

Labelme?

Labelme分割標(biāo)注軟件使用?

EISeg?

EISeg分割標(biāo)注軟件使用?

ArcGis

?深度學(xué)習(xí)/語義分割入門筆記(一)——遙感影像數(shù)據(jù)集及標(biāo)簽制作+arcgis批量矢量轉(zhuǎn)柵格

語義分割—遙感影像數(shù)據(jù)標(biāo)簽制作(ARCGIS)?文章來源地址http://www.zghlxwxcb.cn/news/detail-811061.html

到了這里,關(guān)于[SS]語義分割——基礎(chǔ)知識(shí)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 深度學(xué)習(xí)基礎(chǔ)知識(shí)整理

    Auto-encoders是一種人工神經(jīng)網(wǎng)絡(luò),用于學(xué)習(xí)未標(biāo)記數(shù)據(jù)的有效編碼。它由兩個(gè)部分組成:編碼器和解碼器。編碼器將輸入數(shù)據(jù)轉(zhuǎn)換為一種更緊湊的表示形式,而解碼器則將該表示形式轉(zhuǎn)換回原始數(shù)據(jù)。這種方法可以用于降維,去噪,特征提取和生成模型。 自編碼器的訓(xùn)練過程

    2024年01月17日
    瀏覽(25)
  • [SS]語義分割_轉(zhuǎn)置卷積

    [SS]語義分割_轉(zhuǎn)置卷積

    轉(zhuǎn)置卷積(Transposed Convolution) 抽絲剝繭,帶你理解轉(zhuǎn)置卷積(反卷積)? 目錄 一、概念 1、定義? 2、運(yùn)算步驟 二、常見參數(shù) ????????轉(zhuǎn)置卷積(Transposed Convolution),也被稱為反卷積(Deconvolution)或逆卷積(Inverse Convolution),是一種卷積神經(jīng)網(wǎng)絡(luò)中常用的操作。轉(zhuǎn)置卷

    2024年01月22日
    瀏覽(12)
  • 深度學(xué)習(xí)torch基礎(chǔ)知識(shí)

    detach是截?cái)喾聪騻鞑サ奶荻攘?將某個(gè)node變成不需要梯度的Varibale。因此當(dāng)反向傳播經(jīng)過這個(gè)node時(shí),梯度就不會(huì)從這個(gè)node往前面?zhèn)鞑ァ?拼接:將多個(gè)維度參數(shù)相同的張量連接成一個(gè)張量 torch.nn.DataParallel(module, device_ids=None, output_device=None, dim=0) module即表示你定義的模型,devic

    2024年02月13日
    瀏覽(21)
  • 深度學(xué)習(xí)基礎(chǔ)知識(shí)神經(jīng)網(wǎng)絡(luò)

    深度學(xué)習(xí)基礎(chǔ)知識(shí)神經(jīng)網(wǎng)絡(luò)

    1. 感知機(jī) 感知機(jī)(Perceptron)是 Frank Rosenblatt 在1957年提出的概念,其結(jié)構(gòu)與MP模型類似,一般被視為最簡單的人工神經(jīng)網(wǎng)絡(luò),也作為二元線性分類器被廣泛使用。通常情況下指單層的人工神經(jīng)網(wǎng)絡(luò),以區(qū)別于多層感知機(jī)(Multilayer Perceptron)。盡管感知機(jī)結(jié)構(gòu)簡單,但能夠?qū)W習(xí)

    2024年02月03日
    瀏覽(26)
  • 深度學(xué)習(xí)基礎(chǔ)知識(shí)-感知機(jī)+神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)

    深度學(xué)習(xí)基礎(chǔ)知識(shí)-感知機(jī)+神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)

    參考書籍:(找不到資源可以后臺(tái)私信我) 《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn) (齋藤康毅)》 《Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition (Aurelien Geron [Géron, Aurélien])》 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別: Perceptron(感知機(jī)) 感知機(jī)就是一種接收多種輸入信

    2023年04月26日
    瀏覽(20)
  • 深度學(xué)習(xí)基礎(chǔ)知識(shí)-pytorch數(shù)據(jù)基本操作

    深度學(xué)習(xí)基礎(chǔ)知識(shí)-pytorch數(shù)據(jù)基本操作

    1.1.1 數(shù)據(jù)結(jié)構(gòu) 機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的主要數(shù)據(jù)結(jié)構(gòu),例如 ? ? ? ? ? ? ? ? 0維:叫標(biāo)量,代表一個(gè)類別,如1.0 ? ? ? ? ? ? ? ? 1維:代表一個(gè)特征向量。如 ?[1.0,2,7,3.4] ? ? ? ? ? ? ? ? 2維:就是矩陣,一個(gè)樣本-特征矩陣,如: [[1.0,2,7,3.4?] ? ? ? ? ? ? ?? ? ?

    2024年02月11日
    瀏覽(26)
  • 深度學(xué)習(xí)基礎(chǔ)知識(shí)(三)-線性代數(shù)的實(shí)現(xiàn)

    1.標(biāo)量使用 標(biāo)量由只有一個(gè)元素的張量表示,標(biāo)量可以做最簡單的計(jì)算。 結(jié)果: 2.向量使用 向量:將標(biāo)量值組成的列表就是向量 結(jié)果: 訪問張量的長度 只有一個(gè)軸的張量,形狀只有一個(gè)元素 創(chuàng)建一個(gè)二維矩陣5行4列,然后將矩陣做轉(zhuǎn)置,軸對(duì)稱的一個(gè)轉(zhuǎn)置 結(jié)果:其實(shí)就是把

    2024年02月10日
    瀏覽(27)
  • 深度學(xué)習(xí)TensorFlow2基礎(chǔ)知識(shí)學(xué)習(xí)前半部分

    深度學(xué)習(xí)TensorFlow2基礎(chǔ)知識(shí)學(xué)習(xí)前半部分

    目錄 測試TensorFlow是否支持GPU: 自動(dòng)求導(dǎo): ?數(shù)據(jù)預(yù)處理 之 統(tǒng)一數(shù)組維度 ?定義變量和常量 ?訓(xùn)練模型的時(shí)候設(shè)備變量的設(shè)置 生成隨機(jī)數(shù)據(jù) 交叉熵?fù)p失CE和均方誤差函數(shù)MSE? 全連接Dense層 維度變換reshape 增加或減小維度 數(shù)組合并 廣播機(jī)制: 簡單范數(shù)運(yùn)算 ?矩陣轉(zhuǎn)置 框架本

    2024年02月04日
    瀏覽(45)
  • 現(xiàn)代C++中的從頭開始深度學(xué)習(xí)【1/8】:基礎(chǔ)知識(shí)

    ????????提及機(jī)器學(xué)習(xí)框架與研究和工業(yè)的相關(guān)性。現(xiàn)在很少有項(xiàng)目不使用Google TensorFlow或Meta PyTorch,在于它們的可擴(kuò)展性和靈活性。 也就是說,花時(shí)間從頭開始編碼機(jī)器學(xué)習(xí)算法似乎違反直覺,即沒有任何基本框架。然而,事實(shí)并非如此。自己對(duì)算法進(jìn)行編碼可以清晰而

    2024年02月13日
    瀏覽(22)
  • 計(jì)算機(jī)視覺基礎(chǔ)知識(shí)(十二)--神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)

    計(jì)算機(jī)視覺基礎(chǔ)知識(shí)(十二)--神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)

    一種機(jī)器學(xué)習(xí)的算法 一般有輸入層--隱藏層--輸出層 隱藏層數(shù)量多于兩個(gè)的稱為深度神經(jīng)網(wǎng)絡(luò); 輸入的是特征向量; 特征向量代表的是變化的方向; 或者說是最能代表這個(gè)事物的特征方向; 權(quán)重是特征值,有正有負(fù),加強(qiáng)或抑制; 權(quán)重的絕對(duì)值大小,代表輸入信號(hào)對(duì)神經(jīng)元的影響大小

    2024年02月21日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包