国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【YOLO】物體識別算法的核心思想

這篇具有很好參考價(jià)值的文章主要介紹了【YOLO】物體識別算法的核心思想。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

前言

YOLO是目前比較流行的物體檢測算法,有著體積小,檢測準(zhǔn)確度高的強(qiáng)大優(yōu)點(diǎn)。這里對YOLO的核心思想知識點(diǎn),使用可視化的方法做一總結(jié)。

物體檢測基礎(chǔ)

YOLO是用于識別圖像中的物體的網(wǎng)絡(luò)。這類網(wǎng)絡(luò)解決的問題通常是找到圖片中是否存在某種物體(如是否有狗或人),以及找到物體在圖片中的位置并標(biāo)記出來(如使用紅色方框標(biāo)記物體)。

比如,對于一個檢測圖片中人和狗的網(wǎng)絡(luò)來說,在神經(jīng)網(wǎng)絡(luò)的輸出端,需要表達(dá)兩類信息:

  1. 某物體是否存在于圖片中。通常會使用數(shù)字0、1來分別表示目標(biāo)物體不存在目標(biāo)物體存在。
    【YOLO】物體識別算法的核心思想

  2. 如果目標(biāo)物體存在,目標(biāo)物體在圖片中的位置。YOLO使用物體的中心坐標(biāo)物體的長、寬來表示。
    【YOLO】物體識別算法的核心思想

YOLO —— 對圖像碎片進(jìn)行物體檢測

YOLO作為一個圖像物體檢測算法,輸出一個向量來表示圖像中目標(biāo)物體的信息

【YOLO】物體識別算法的核心思想

P c P_c Pc?:圖像中是否不存在任何目標(biāo)物體,1代表存在,0代表完全不存在
B x B_x Bx?:目標(biāo)物體幾何中心的橫坐標(biāo)
B y B_y By?:目標(biāo)物體幾何中心的縱坐標(biāo)
B w B_w Bw?:目標(biāo)物體的寬度
B h B_h Bh?:目標(biāo)物體的高度
C 1 C_1 C1?:是否存在類別1的物體(狗)
C 2 C_2 C2?:是否存在類別2的物體(人)

檢測單個物體

比如,將下面的圖片傳入訓(xùn)練好的YOLO網(wǎng)絡(luò),就會得到這樣的一個向量。根據(jù)這個向量標(biāo)出對應(yīng)的物體中心和方形輪廓,就會得我們想要的結(jié)果。
【YOLO】物體識別算法的核心思想

當(dāng)圖片中沒有任何目標(biāo)物體時, P c P_c Pc? 的值為0,向量中的其他值就不必理會。

【YOLO】物體識別算法的核心思想

同時檢測多個物體

但是如果圖中同時有多個目標(biāo)物體,一個向量不夠用怎么辦?

【YOLO】物體識別算法的核心思想

直覺性的答案是將原本的 7 ? 1 7*1 7?1 的向量擴(kuò)大,使之同時包含 n n n 個物體的信息,也就是變成 7 n ? 1 7n*1 7n?1 (形如下圖)的格式。
[ P c 1 B x 1 B y 1 B w 1 B h 1 C 11 C 21 . . . . . . . . . P c n B x n B y n B w n B h n C 1 n C 2 n ] \left[ \begin{matrix} P_{c1} \\ B_{x1} \\ B_{y1} \\ B_{w1} \\ B_{h1} \\ C_{11} \\ C_{21} \\ ... \\ ... \\ ... \\ P_{cn} \\ B_{xn} \\ B_{yn} \\ B_{wn} \\ B_{hn} \\ C_{1n} \\ C_{2n} \\ \end{matrix} \right] ? ??Pc1?Bx1?By1?Bw1?Bh1?C11?C21?.........Pcn?Bxn?Byn?Bwn?Bhn?C1n?C2n??? ??

P c k P_{ck} Pck?:圖像中是否存在第k個目標(biāo)物體,1代表存在,0代表完全不存在
B x k B_{xk} Bxk?:第k個目標(biāo)物體幾何中心的橫坐標(biāo)
B y k B_{yk} Byk?:第k個目標(biāo)物體幾何中心的縱坐標(biāo)
B w k B_{wk} Bwk?:第k個目標(biāo)物體的寬度
B h k B_{hk} Bhk?:第k個目標(biāo)物體的高度
C 1 k C_{1k} C1k?:第k個目標(biāo)物體是否屬于類別1(狗)
C 2 k C_{2k} C2k?:第k個目標(biāo)物體是否屬于類別2(人)

但由于神經(jīng)網(wǎng)絡(luò)的輸出結(jié)構(gòu)是固定的,無法靈活的根據(jù)情況來自由變動,那么一種簡單的解決方法就是讓用于表示輸出的向量足夠大(比如每次檢測 10000 10000 10000 個物體,神經(jīng)網(wǎng)絡(luò)每次輸出一個 70000 ? 1 70000*1 70000?1 的向量)。但是這個方法,對于常見的只有數(shù)個目標(biāo)物體的情況時就會有很大的浪費(fèi),而對于個別的出現(xiàn)非常多物體的情況來說又會不夠用,適用性非常差。

YOLO所使用的思想的一大杰出之處就是優(yōu)雅的解決了這個問題。

它將圖片分割為數(shù)個小的碎片(比如 4 ? 4 4*4 4?4),然后對于每個碎片進(jìn)行單一物體檢測。這樣一來,只要切割圖像得到的單個碎片足夠小,就能夠保證每個圖像碎片中的目標(biāo)物體數(shù)量足夠少(比如只有1~2個)。

【YOLO】物體識別算法的核心思想

這樣一來,對于每個圖像碎片,我們可以讓神經(jīng)網(wǎng)絡(luò)只嘗試找到固定數(shù)量個目標(biāo)物體即可,神經(jīng)網(wǎng)絡(luò)的輸出格式就可以固定下來(比如我們設(shè)為 16 16 16 個碎片,每個碎片 2 2 2 個目標(biāo)物體,那么神經(jīng)網(wǎng)絡(luò)的輸出就是一個 14 ? 16 14*16 14?16 的矩陣)。

下圖就是一個例子。(不過值得注意的是,為了便于表示,對目標(biāo)物體的中心坐標(biāo)、寬度、高度做了歸一化處理,可能與YOLO算法的實(shí)際情況不符。其次,對于每個碎片中目標(biāo)物體的中心坐標(biāo),究竟是碎片內(nèi)的局部目標(biāo)物體的中心坐標(biāo),還是目標(biāo)物體在沒打碎圖像前的全局中心坐標(biāo),參考資料沒講解清楚,這里存疑。筆者按照局部目標(biāo)物體的中心坐標(biāo)的方法進(jìn)行處理。)

【YOLO】物體識別算法的核心思想

多邊界框的處理 —— IOU方法

通過使用上述方法,將目標(biāo)圖片切割成小碎片,然后逐一進(jìn)行檢測,得到的檢測結(jié)果就是這樣一個 7 ? 16 7*16 7?16 的矩陣(這里假設(shè)切割圖片為 4 ? 4 4*4 4?4 個碎片,每個碎片中只尋找一個物體)。再對輸出的結(jié)果進(jìn)行處理,就可以得到目標(biāo)物體的邊界框(下圖中用黃色和紅色的方框來表示),以及這些邊界框的精確度(下圖中用每個方框邊角的黑色數(shù)字來表示)。

【YOLO】物體識別算法的核心思想

但是目標(biāo)檢測問題中,經(jīng)常會遇見的問題是出現(xiàn)多個邊界框,都畫出來的話顯然會造成混亂:這么多個邊界框?qū)?yīng)的究竟是幾個目標(biāo)物體?對于某個目標(biāo)物體來說,哪個邊界框?qū)儆谒繉?yīng)某一目標(biāo)物體的多個邊界框中,哪個最精確?

該如何選擇邊界框呢?

一種直覺性的方法是保留準(zhǔn)確度最大的邊界框。但是這個方法的問題是,只會保留 1 1 1 個邊界框用于標(biāo)出圖像中狗的位置、 1 1 1 個邊界框用于標(biāo)出圖像中人的位置。但如果圖像中有多個同類目標(biāo)物體,就會丟失信息了,導(dǎo)致無法接受的偏差。我們需要更好的方法。

這一問題的常用解法是利用IOU(交并比)判斷兩個邊界框是否屬于同一物體。計(jì)算方法是,對于任意兩個邊框,用二者重疊部分(交集)的面積,除以二者合并起來(并集)的面積,得到一個比值。圖像化公式見下圖

【YOLO】物體識別算法的核心思想

通常我們會設(shè)定一個閾值,當(dāng)IOU超過這個閾值,就判斷兩個邊框?qū)儆谕粋€物體。這樣一來,就能首先確定每個目標(biāo)物體對應(yīng)那些邊界框,隨后再借助每個邊界框所對應(yīng)的精確度,找出屬于每個目標(biāo)物體的最精確的邊界框。(利用這種方法而非粗暴的找全局最大值,從而提高物體檢測精確度的方法,被稱為Non maximum suppression,非極大值抑制)

參考鏈接

https://www.youtube.com/watch?v=ag3DLKsl2vk
https://www.cnblogs.com/happyamyhope/p/9629358.html
https://zhuanlan.zhihu.com/p/37489043文章來源地址http://www.zghlxwxcb.cn/news/detail-456016.html

到了這里,關(guān)于【YOLO】物體識別算法的核心思想的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 低成本ESP32-CAM,YOLO核心代碼識別,錄像保存,項(xiàng)目中問題分享以及解決。

    低成本ESP32-CAM,YOLO核心代碼識別,錄像保存,項(xiàng)目中問題分享以及解決。

    ? ESPCAM監(jiān)控的具體細(xì)節(jié) Arduino編寫, FreeRTOS系統(tǒng),以便后面添加其他功能, 圖片以UDP發(fā)送,數(shù)據(jù)處理基本在服務(wù)端, TCL連接給ESP32人或物的位置,兩個舵機(jī)控制轉(zhuǎn)向。 服務(wù)端的具體細(xì)節(jié) 后端是python代碼, 使用YOLOv5核心代碼識別圖像人或物,核心代碼的提取花時間 用opencv調(diào)試

    2024年02月05日
    瀏覽(22)
  • 【編程實(shí)踐】JVM內(nèi)存管理的核心數(shù)據(jù)結(jié)構(gòu)和算法思想&代碼示例說明
  • 開源的AI算法可以進(jìn)行物體識別,動物識別

    有許多開源的AI算法可以進(jìn)行物體識別和動物識別。其中最常用的算法是深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),如Google開源的Inception和ResNet模型,以及Facebook開源的Detectron2框架等。這些算法通過訓(xùn)練大量數(shù)據(jù)集來學(xué)習(xí)物體和動物的特征,并通過卷積、池化

    2024年02月07日
    瀏覽(15)
  • python目前哪個版本最穩(wěn)定,python什么版本比較穩(wěn)定

    python目前哪個版本最穩(wěn)定,python什么版本比較穩(wěn)定

    大家好,本文將圍繞python目前哪個版本最穩(wěn)定展開說明,python什么版本比較穩(wěn)定是一個很多人都想弄明白的事情,想搞清楚python哪個版本好用2020需要先了解以下幾個事情。 大家好,小編來為大家解答以下問題,python安裝哪個版本比較好,python一般安裝哪個版本,現(xiàn)在讓我們

    2024年01月25日
    瀏覽(23)
  • 畢業(yè)設(shè)計(jì)-基于深度學(xué)習(xí)玉米葉病蟲害識別系統(tǒng) YOLO python 機(jī)器學(xué)習(xí) 目標(biāo)檢測 人工智能 算法

    畢業(yè)設(shè)計(jì)-基于深度學(xué)習(xí)玉米葉病蟲害識別系統(tǒng) YOLO python 機(jī)器學(xué)習(xí) 目標(biāo)檢測 人工智能 算法

    目錄 前言 設(shè)計(jì)思路 一、課題背景與意義 二、算法理論原理 2.1 卷積神經(jīng)網(wǎng)絡(luò) 2.2 YOLOv5算法 三、檢測的實(shí)現(xiàn) 3.1 數(shù)據(jù)集 3.2 實(shí)驗(yàn)環(huán)境搭建 3.3 實(shí)驗(yàn)及結(jié)果分析 實(shí)現(xiàn)效果圖樣例 最后 ? ? ? ???大四是整個大學(xué)期間最忙碌的時光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準(zhǔn)

    2024年02月03日
    瀏覽(520)
  • 圖像分析技術(shù)大比拼:圖像分類、圖像識別、目標(biāo)檢測的優(yōu)缺點(diǎn)分析與算法比較

    ? ? ??計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個重要分支,它旨在構(gòu)建能夠理解和處理圖像、視頻等視覺信息的計(jì)算機(jī)系統(tǒng)。在計(jì)算機(jī)視覺領(lǐng)域中,圖像分類、圖像識別和目標(biāo)檢測是三個重要的任務(wù)。 ? ? ?? 一、圖像分類 ? ? ? 圖像分類是計(jì)算機(jī)視覺領(lǐng)域最基礎(chǔ)的任務(wù)之一,它

    2024年02月16日
    瀏覽(18)
  • STM32 OV7725攝像頭模塊識別顏色物體(1)--HSL二值化和腐蝕中心算法,并用串口輸出數(shù)據(jù)

    STM32 OV7725攝像頭模塊識別顏色物體(1)--HSL二值化和腐蝕中心算法,并用串口輸出數(shù)據(jù)

    目錄 前言 一、攝像頭采集數(shù)據(jù)流程 二、如何將圖像顯示到電腦上 ?三、圖像二值化 1、什么是RGB? 2、RGB565轉(zhuǎn)RGB888 I、RGB565和RGB888的區(qū)別 II、代碼 3、RGB轉(zhuǎn)HSL I、什么是HSL ?II、轉(zhuǎn)換公式 ?III、代碼 3、輸出一張攝像頭二值化圖片 I、原理 II、代碼? 四、簡單的物體識別 1、原理參

    2024年02月11日
    瀏覽(28)
  • Spring核心思想

    Spring核心思想

    通常所說的 Spring 指的是 Spring Framework(Spring 框架) Spring 是包含了眾多工具方法的 IOC 容器 將眾多工具方法的 IOC 容器拆解為三部分 眾多工具方法 IOC 容器 眾多工具方法 將扳手??理解為一個工具 扳手??可以用來打螺絲(方法) 扳手??可以用來敲核桃(方法) … 容器 將水杯理解為

    2024年02月08日
    瀏覽(18)
  • Spring核心設(shè)計(jì)思想

    Spring核心設(shè)計(jì)思想

    目錄 前言: Spring是什么 什么是IoC 傳統(tǒng)開發(fā)思想 IoC開發(fā)思想 Spring IoC 什么是DI 小結(jié): ? ? 官網(wǎng)中提出:Spring makes programming Java quicker, easier, and safer for everybody. Spring’s focus on speed, simplicity, and productivity has made it the?world\\\'s most popular Java framework. ? ? Spring 使編程 Java 對每個人來

    2023年04月17日
    瀏覽(21)
  • 【23】核心易中期刊推薦——視覺/圖像感知與識別&人工智能算法及應(yīng)用???????

    【23】核心易中期刊推薦——視覺/圖像感知與識別&人工智能算法及應(yīng)用???????

    在期刊論文的分布中,存在一種普遍現(xiàn)象:即對于某一特定的學(xué)科或?qū)I(yè)來說,少數(shù)期刊所含的相關(guān)情報(bào)量很大,而多數(shù)期刊的情報(bào)量卻很少;也就是說,世界上大量的科學(xué)論文集中在少量的科學(xué)期刊中,這就是所謂的“核心期刊效應(yīng)”,其結(jié)果是產(chǎn)生了各個學(xué)科或?qū)I(yè)的“

    2024年02月03日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包