国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<label id="vvqb4"></label>

【YOLO】物體識別算法的核心思想

2年前作者：Xav Zewen分類：Toy博客閱讀(27)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【YOLO】物體識別算法的核心思想。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

前言

YOLO是目前比較流行的物體檢測算法，有著體積小，檢測準(zhǔn)確度高的強(qiáng)大優(yōu)點(diǎn)。這里對YOLO的核心思想知識點(diǎn)，使用可視化的方法做一總結(jié)。

物體檢測基礎(chǔ)

YOLO是用于識別圖像中的物體的網(wǎng)絡(luò)。這類網(wǎng)絡(luò)解決的問題通常是找到圖片中是否存在某種物體（如是否有狗或人），以及找到物體在圖片中的位置并標(biāo)記出來（如使用紅色方框標(biāo)記物體）。

比如，對于一個檢測圖片中人和狗的網(wǎng)絡(luò)來說，在神經(jīng)網(wǎng)絡(luò)的輸出端，需要表達(dá)兩類信息：

某物體是否存在于圖片中。通常會使用數(shù)字0、1來分別表示目標(biāo)物體不存在、目標(biāo)物體存在。
如果目標(biāo)物體存在，目標(biāo)物體在圖片中的位置。YOLO使用物體的中心坐標(biāo)和物體的長、寬來表示。

YOLO —— 對圖像碎片進(jìn)行物體檢測

YOLO作為一個圖像物體檢測算法，輸出一個向量來表示圖像中目標(biāo)物體的信息

【YOLO】物體識別算法的核心思想

$P_c$ ：圖像中是否不存在任何目標(biāo)物體，1代表存在，0代表完全不存在
$B_x$ ：目標(biāo)物體幾何中心的橫坐標(biāo)
$B_y$ ：目標(biāo)物體幾何中心的縱坐標(biāo)
$B_w$ ：目標(biāo)物體的寬度
$B_h$ ：目標(biāo)物體的高度
$C_1$ ：是否存在類別1的物體（狗）
$C_2$ ：是否存在類別2的物體（人）

檢測單個物體

比如，將下面的圖片傳入訓(xùn)練好的YOLO網(wǎng)絡(luò)，就會得到這樣的一個向量。根據(jù)這個向量標(biāo)出對應(yīng)的物體中心和方形輪廓，就會得我們想要的結(jié)果。
【YOLO】物體識別算法的核心思想

當(dāng)圖片中沒有任何目標(biāo)物體時， $P_c$ 的值為0，向量中的其他值就不必理會。

【YOLO】物體識別算法的核心思想

同時檢測多個物體

但是如果圖中同時有多個目標(biāo)物體，一個向量不夠用怎么辦？

【YOLO】物體識別算法的核心思想

直覺性的答案是將原本的 $7 ? 1$ 的向量擴(kuò)大，使之同時包含 $n$ 個物體的信息，也就是變成 $7 n ? 1$ （形如下圖）的格式。
$\left[ \begin{matrix} P_{c1} \\ B_{x1} \\ B_{y1} \\ B_{w1} \\ B_{h1} \\ C_{11} \\ C_{21} \\ ... \\ ... \\ ... \\ P_{cn} \\ B_{xn} \\ B_{yn} \\ B_{wn} \\ B_{hn} \\ C_{1n} \\ C_{2n} \\ \end{matrix} \right]$

$P_{ck}$ ：圖像中是否存在第k個目標(biāo)物體，1代表存在，0代表完全不存在
$B_{xk}$ ：第k個目標(biāo)物體幾何中心的橫坐標(biāo)
$B_{yk}$ ：第k個目標(biāo)物體幾何中心的縱坐標(biāo)
$B_{wk}$ ：第k個目標(biāo)物體的寬度
$B_{hk}$ ：第k個目標(biāo)物體的高度
$C_{1k}$ ：第k個目標(biāo)物體是否屬于類別1（狗）
$C_{2k}$ ：第k個目標(biāo)物體是否屬于類別2（人）

但由于神經(jīng)網(wǎng)絡(luò)的輸出結(jié)構(gòu)是固定的，無法靈活的根據(jù)情況來自由變動，那么一種簡單的解決方法就是讓用于表示輸出的向量足夠大（比如每次檢測 $10000$ 個物體，神經(jīng)網(wǎng)絡(luò)每次輸出一個 $70000 ? 1$ 的向量）。但是這個方法，對于常見的只有數(shù)個目標(biāo)物體的情況時就會有很大的浪費(fèi)，而對于個別的出現(xiàn)非常多物體的情況來說又會不夠用，適用性非常差。

YOLO所使用的思想的一大杰出之處就是優(yōu)雅的解決了這個問題。

它將圖片分割為數(shù)個小的碎片（比如 $4 ? 4$ ），然后對于每個碎片進(jìn)行單一物體檢測。這樣一來，只要切割圖像得到的單個碎片足夠小，就能夠保證每個圖像碎片中的目標(biāo)物體數(shù)量足夠少（比如只有1~2個）。

【YOLO】物體識別算法的核心思想

這樣一來，對于每個圖像碎片，我們可以讓神經(jīng)網(wǎng)絡(luò)只嘗試找到固定數(shù)量個目標(biāo)物體即可，神經(jīng)網(wǎng)絡(luò)的輸出格式就可以固定下來（比如我們設(shè)為 $16$ 個碎片，每個碎片 $2$ 個目標(biāo)物體，那么神經(jīng)網(wǎng)絡(luò)的輸出就是一個 $14 ? 16$ 的矩陣）。

下圖就是一個例子。（不過值得注意的是，為了便于表示，對目標(biāo)物體的中心坐標(biāo)、寬度、高度做了歸一化處理，可能與YOLO算法的實(shí)際情況不符。其次，對于每個碎片中目標(biāo)物體的中心坐標(biāo)，究竟是碎片內(nèi)的局部目標(biāo)物體的中心坐標(biāo)，還是目標(biāo)物體在沒打碎圖像前的全局中心坐標(biāo)，參考資料沒講解清楚，這里存疑。筆者按照局部目標(biāo)物體的中心坐標(biāo)的方法進(jìn)行處理。）

【YOLO】物體識別算法的核心思想

多邊界框的處理 —— IOU方法

通過使用上述方法，將目標(biāo)圖片切割成小碎片，然后逐一進(jìn)行檢測，得到的檢測結(jié)果就是這樣一個 $7 ? 16$ 的矩陣（這里假設(shè)切割圖片為 $4 ? 4$ 個碎片，每個碎片中只尋找一個物體）。再對輸出的結(jié)果進(jìn)行處理，就可以得到目標(biāo)物體的邊界框（下圖中用黃色和紅色的方框來表示），以及這些邊界框的精確度（下圖中用每個方框邊角的黑色數(shù)字來表示）。

【YOLO】物體識別算法的核心思想

但是目標(biāo)檢測問題中，經(jīng)常會遇見的問題是出現(xiàn)多個邊界框，都畫出來的話顯然會造成混亂：這么多個邊界框?qū)?yīng)的究竟是幾個目標(biāo)物體？對于某個目標(biāo)物體來說，哪個邊界框?qū)儆谒繉?yīng)某一目標(biāo)物體的多個邊界框中，哪個最精確？

該如何選擇邊界框呢？

一種直覺性的方法是保留準(zhǔn)確度最大的邊界框。但是這個方法的問題是，只會保留 $1$ 個邊界框用于標(biāo)出圖像中狗的位置、 $1$ 個邊界框用于標(biāo)出圖像中人的位置。但如果圖像中有多個同類目標(biāo)物體，就會丟失信息了，導(dǎo)致無法接受的偏差。我們需要更好的方法。

這一問題的常用解法是利用IOU（交并比）判斷兩個邊界框是否屬于同一物體。計(jì)算方法是，對于任意兩個邊框，用二者重疊部分（交集）的面積，除以二者合并起來（并集）的面積，得到一個比值。圖像化公式見下圖

【YOLO】物體識別算法的核心思想

通常我們會設(shè)定一個閾值，當(dāng)IOU超過這個閾值，就判斷兩個邊框?qū)儆谕粋€物體。這樣一來，就能首先確定每個目標(biāo)物體對應(yīng)那些邊界框，隨后再借助每個邊界框所對應(yīng)的精確度，找出屬于每個目標(biāo)物體的最精確的邊界框。（利用這種方法而非粗暴的找全局最大值，從而提高物體檢測精確度的方法，被稱為Non maximum suppression，非極大值抑制）

參考鏈接

https://www.youtube.com/watch?v=ag3DLKsl2vk
https://www.cnblogs.com/happyamyhope/p/9629358.html
https://zhuanlan.zhihu.com/p/37489043文章來源地址http://www.zghlxwxcb.cn/news/detail-456016.html

到了這里，關(guān)于【YOLO】物體識別算法的核心思想的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

低成本ESP32-CAM，YOLO核心代碼識別，錄像保存，項(xiàng)目中問題分享以及解決。
? ESPCAM監(jiān)控的具體細(xì)節(jié) Arduino編寫， FreeRTOS系統(tǒng),以便后面添加其他功能，圖片以UDP發(fā)送，數(shù)據(jù)處理基本在服務(wù)端， TCL連接給ESP32人或物的位置，兩個舵機(jī)控制轉(zhuǎn)向。服務(wù)端的具體細(xì)節(jié) 后端是python代碼，使用YOLOv5核心代碼識別圖像人或物，核心代碼的提取花時間用opencv調(diào)試
2024年02月05日
瀏覽(22)
【編程實(shí)踐】JVM內(nèi)存管理的核心數(shù)據(jù)結(jié)構(gòu)和算法思想&代碼示例說明
2024年02月06日
瀏覽(25)
開源的AI算法可以進(jìn)行物體識別，動物識別
有許多開源的AI算法可以進(jìn)行物體識別和動物識別。其中最常用的算法是深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN），如Google開源的Inception和ResNet模型，以及Facebook開源的Detectron2框架等。這些算法通過訓(xùn)練大量數(shù)據(jù)集來學(xué)習(xí)物體和動物的特征，并通過卷積、池化
2024年02月07日
瀏覽(15)
python目前哪個版本最穩(wěn)定,python什么版本比較穩(wěn)定
大家好，本文將圍繞python目前哪個版本最穩(wěn)定展開說明，python什么版本比較穩(wěn)定是一個很多人都想弄明白的事情，想搞清楚python哪個版本好用2020需要先了解以下幾個事情。大家好，小編來為大家解答以下問題，python安裝哪個版本比較好，python一般安裝哪個版本，現(xiàn)在讓我們
2024年01月25日
瀏覽(23)
畢業(yè)設(shè)計(jì)-基于深度學(xué)習(xí)玉米葉病蟲害識別系統(tǒng) YOLO python 機(jī)器學(xué)習(xí) 目標(biāo)檢測人工智能算法
目錄前言設(shè)計(jì)思路一、課題背景與意義二、算法理論原理 2.1 卷積神經(jīng)網(wǎng)絡(luò) 2.2 YOLOv5算法三、檢測的實(shí)現(xiàn) 3.1 數(shù)據(jù)集 3.2 實(shí)驗(yàn)環(huán)境搭建 3.3 實(shí)驗(yàn)及結(jié)果分析實(shí)現(xiàn)效果圖樣例最后 ? ? ? ???大四是整個大學(xué)期間最忙碌的時光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準(zhǔn)
2024年02月03日
瀏覽(520)
圖像分析技術(shù)大比拼：圖像分類、圖像識別、目標(biāo)檢測的優(yōu)缺點(diǎn)分析與算法比較
? ? ??計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個重要分支，它旨在構(gòu)建能夠理解和處理圖像、視頻等視覺信息的計(jì)算機(jī)系統(tǒng)。在計(jì)算機(jī)視覺領(lǐng)域中，圖像分類、圖像識別和目標(biāo)檢測是三個重要的任務(wù)。 ? ? ?? 一、圖像分類 ? ? ? 圖像分類是計(jì)算機(jī)視覺領(lǐng)域最基礎(chǔ)的任務(wù)之一，它
2024年02月16日
瀏覽(18)
STM32 OV7725攝像頭模塊識別顏色物體（1）--HSL二值化和腐蝕中心算法，并用串口輸出數(shù)據(jù)
目錄前言一、攝像頭采集數(shù)據(jù)流程二、如何將圖像顯示到電腦上 ?三、圖像二值化 1、什么是RGB? 2、RGB565轉(zhuǎn)RGB888 I、RGB565和RGB888的區(qū)別 II、代碼 3、RGB轉(zhuǎn)HSL I、什么是HSL ?II、轉(zhuǎn)換公式 ?III、代碼 3、輸出一張攝像頭二值化圖片 I、原理 II、代碼? 四、簡單的物體識別 1、原理參
2024年02月11日
瀏覽(28)
Spring核心思想
通常所說的 Spring 指的是 Spring Framework(Spring 框架) Spring 是包含了眾多工具方法的 IOC 容器將眾多工具方法的 IOC 容器拆解為三部分眾多工具方法 IOC 容器眾多工具方法將扳手??理解為一個工具扳手??可以用來打螺絲(方法) 扳手??可以用來敲核桃(方法) … 容器將水杯理解為
2024年02月08日
瀏覽(18)
Spring核心設(shè)計(jì)思想
目錄前言： Spring是什么什么是IoC 傳統(tǒng)開發(fā)思想 IoC開發(fā)思想 Spring IoC 什么是DI 小結(jié)： ? ? 官網(wǎng)中提出：Spring makes programming Java quicker, easier, and safer for everybody. Spring’s focus on speed, simplicity, and productivity has made it the?world\\\'s most popular Java framework. ? ? Spring 使編程 Java 對每個人來
2023年04月17日
瀏覽(21)
【23】核心易中期刊推薦——視覺/圖像感知與識別&人工智能算法及應(yīng)用???????
在期刊論文的分布中，存在一種普遍現(xiàn)象：即對于某一特定的學(xué)科或?qū)I(yè)來說，少數(shù)期刊所含的相關(guān)情報(bào)量很大，而多數(shù)期刊的情報(bào)量卻很少；也就是說，世界上大量的科學(xué)論文集中在少量的科學(xué)期刊中，這就是所謂的“核心期刊效應(yīng)”，其結(jié)果是產(chǎn)生了各個學(xué)科或?qū)I(yè)的“
2024年02月03日
瀏覽(27)

<address id="sdld4"></address>