国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<rp id="krvfg"></rp>

<dfn id="krvfg"><mark id="krvfg"></mark></dfn>

<span id="krvfg"></span>

<strike id="krvfg"><strike id="krvfg"></strike></strike>

<dfn id="krvfg"><button id="krvfg"></button></dfn>

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí)

2年前作者：Mr.D學(xué)長分類：Toy博客閱讀(101)違法舉報

這篇具有很好參考價值的文章主要介紹了計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

0 前言

?? 優(yōu)質(zhì)競賽項(xiàng)目系列，今天要分享的是

?? 機(jī)器視覺 opencv 深度學(xué)習(xí)目標(biāo)檢測

該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！

??學(xué)長這里給一個題目綜合評分(每項(xiàng)滿分5分)

難度系數(shù)：3分
工作量：3分
創(chuàng)新點(diǎn)：4分

?? 更多資料, 項(xiàng)目分享：

https://gitee.com/dancheng-senior/postgraduate文章來源地址http://www.zghlxwxcb.cn/news/detail-732575.html

2 目標(biāo)檢測概念

普通的深度學(xué)習(xí)監(jiān)督算法主要是用來做分類，如圖1所示，分類的目標(biāo)是要識別出圖中所示是一只貓。

在ILSVRC（ImageNet Large Scale Visual Recognition
Challenge)競賽以及實(shí)際的應(yīng)用中，還包括目標(biāo)定位和目標(biāo)檢測等任務(wù)。

其中目標(biāo)定位是不僅僅要識別出來是什么物體（即分類），而且還要預(yù)測物體的位置，位置一般用邊框（bounding box）標(biāo)記，如圖2所示。

而目標(biāo)檢測實(shí)質(zhì)是多目標(biāo)的定位，即要在圖片中定位多個目標(biāo)物體，包括分類和定位。

比如對圖3進(jìn)行目標(biāo)檢測，得到的結(jié)果是好幾只不同動物，他們的位置如圖3中不同顏色的框所示。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java

3 目標(biāo)分類、定位、檢測示例

簡單來說，分類、定位和檢測的區(qū)別如下：

分類：是什么？
定位：在哪里？是什么？（單個目標(biāo)）
檢測：在哪里？分別是什么？（多個目標(biāo)）

目標(biāo)檢測對于人類來說并不困難，通過對圖片中不同顏色模塊的感知很容易定位并分類出其中目標(biāo)物體，但對于計算機(jī)來說，面對的是RGB像素矩陣，很難從圖像中直接得到狗和貓這樣的抽象概念并定位其位置，再加上有時候多個物體和雜亂的背景混雜在一起，目標(biāo)檢測更加困難。

但這難不倒科學(xué)家們，在傳統(tǒng)視覺領(lǐng)域，目標(biāo)檢測就是一個非常熱門的研究方向，一些特定目標(biāo)的檢測，比如人臉檢測和行人檢測已經(jīng)有非常成熟的技術(shù)了。普通的目標(biāo)檢測也有過很多的嘗試，但是效果總是差強(qiáng)人意。

4 傳統(tǒng)目標(biāo)檢測

傳統(tǒng)的目標(biāo)檢測一般使用滑動窗口的框架，主要包括三個步驟：

1 利用不同尺寸的滑動窗口框住圖中的某一部分作為候選區(qū)域；

2 提取候選區(qū)域相關(guān)的視覺特征。比如人臉檢測常用的Harr特征；行人檢測和普通目標(biāo)檢測常用的HOG特征等；

3 利用分類器進(jìn)行識別，比如常用的SVM模型。

傳統(tǒng)的目標(biāo)檢測中，多尺度形變部件模型DPM（Deformable Part Model是出類拔萃的，連續(xù)獲得VOC（Visual Object
Class）2007到2009的檢測冠軍，2010年其作者Felzenszwalb
Pedro被VOC授予”終身成就獎”。DPM把物體看成了多個組成的部件（比如人臉的鼻子、嘴巴等），用部件間的關(guān)系來描述物體，這個特性非常符合自然界很多物體的非剛體特征。DPM可以看做是HOG+SVM的擴(kuò)展，很好的繼承了兩者的優(yōu)點(diǎn)，在人臉檢測、行人檢測等任務(wù)上取得了不錯的效果，但是DPM相對復(fù)雜，檢測速度也較慢，從而也出現(xiàn)了很多改進(jìn)的方法。正當(dāng)大家熱火朝天改進(jìn)DPM性能的時候，基于深度學(xué)習(xí)的目標(biāo)檢測橫空出世，迅速蓋過了DPM的風(fēng)頭，很多之前研究傳統(tǒng)目標(biāo)檢測算法的研究者也開始轉(zhuǎn)向深度學(xué)習(xí)。

基于深度學(xué)習(xí)的目標(biāo)檢測發(fā)展起來后，其實(shí)效果也一直難以突破。比如文獻(xiàn)[6]中的算法在VOC
2007測試集合上的mAP只能30%多一點(diǎn)，文獻(xiàn)[7]中的OverFeat在ILSVRC 2013測試集上的mAP只能達(dá)到24.3%。2013年R-
CNN誕生了，VOC 2007測試集的mAP被提升至48%，2014年時通過修改網(wǎng)絡(luò)結(jié)構(gòu)又飆升到了66%，同時ILSVRC
2013測試集的mAP也被提升至31.4%。

R-CNN是Region-based Convolutional Neural
Networks的縮寫，中文翻譯是基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)，是一種結(jié)合區(qū)域提名（Region
Proposal）和卷積神經(jīng)網(wǎng)絡(luò)（CNN）的目標(biāo)檢測方法。Ross Girshick在2013年的開山之作《Rich Feature Hierarchies
for Accurate Object Detection and Semantic
Segmentation》[1]奠定了這個子領(lǐng)域的基礎(chǔ)，這篇論文后續(xù)版本發(fā)表在CVPR 2014[2]，期刊版本發(fā)表在PAMI 2015[3]。

其實(shí)在R-CNN之前已經(jīng)有很多研究者嘗試用Deep Learning的方法來做目標(biāo)檢測了，包括OverFeat[7]，但R-
CNN是第一個真正可以工業(yè)級應(yīng)用的解決方案，這也和深度學(xué)習(xí)本身的發(fā)展類似，神經(jīng)網(wǎng)絡(luò)、卷積網(wǎng)絡(luò)都不是什么新概念，但在本世紀(jì)突然真正變得可行，而一旦可行之后再迅猛發(fā)展也不足為奇了。

R-CNN這個領(lǐng)域目前研究非?；钴S，先后出現(xiàn)了R-CNN[1,2,3,18]、SPP-net[4,19]、Fast R-CNN[14, 20]
、Faster R-CNN[5,21]、R-FCN[16,24]、YOLO[15,22]、SSD[17,23]等研究。Ross
Girshick作為這個領(lǐng)域的開山鼻祖總是神一樣的存在，R-CNN、Fast R-CNN、Faster
R-CNN、YOLO都和他有關(guān)。這些創(chuàng)新的工作其實(shí)很多時候是把一些傳統(tǒng)視覺領(lǐng)域的方法和深度學(xué)習(xí)結(jié)合起來了，比如選擇性搜索（Selective
Search)和圖像金字塔（Pyramid）等。

5 兩類目標(biāo)檢測算法

深度學(xué)習(xí)相關(guān)的目標(biāo)檢測方法也可以大致分為兩派：

基于區(qū)域提名的，如R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN；

端到端（End-to-End），無需區(qū)域提名的，如YOLO、SSD。

目前來說，基于區(qū)域提名的方法依然占據(jù)上風(fēng)，但端到端的方法速度上優(yōu)勢明顯，后續(xù)的發(fā)展拭目以待。

5.1 相關(guān)研究

5.1.1 選擇性搜索

目標(biāo)檢測的第一步是要做區(qū)域提名（Region Proposal），也就是找出可能的感興趣區(qū)域（Region Of Interest,
ROI）。區(qū)域提名類似于光學(xué)字符識別（OCR）領(lǐng)域的切分，OCR切分常用過切分方法，簡單說就是盡量切碎到小的連通域（比如小的筆畫之類），然后再根據(jù)相鄰塊的一些形態(tài)學(xué)特征進(jìn)行合并。但目標(biāo)檢測的對象相比OCR領(lǐng)域千差萬別，而且圖形不規(guī)則，大小不一，所以一定程度上可以說區(qū)域提名是比OCR切分更難的一個問題。

區(qū)域提名可能的方法有：

一、滑動窗口。滑動窗口本質(zhì)上就是窮舉法，利用不同的尺度和長寬比把所有可能的大大小小的塊都窮舉出來，然后送去識別，識別出來概率大的就留下來。很明顯，這樣的方法復(fù)雜度太高，產(chǎn)生了很多的冗余候選區(qū)域，在現(xiàn)實(shí)當(dāng)中不可行。

二、規(guī)則塊。在窮舉法的基礎(chǔ)上進(jìn)行了一些剪枝，只選用固定的大小和長寬比。這在一些特定的應(yīng)用場景是很有效的，比如拍照搜題APP小猿搜題中的漢字檢測，因?yàn)闈h字方方正正，長寬比大多比較一致，因此用規(guī)則塊做區(qū)域提名是一種比較合適的選擇。但是對于普通的目標(biāo)檢測來說，規(guī)則塊依然需要訪問很多的位置，復(fù)雜度高。

三、選擇性搜索。從機(jī)器學(xué)習(xí)的角度來說，前面的方法召回是不錯了，但是精度差強(qiáng)人意，所以問題的核心在于如何有效地去除冗余候選區(qū)域。其實(shí)冗余候選區(qū)域大多是發(fā)生了重疊，選擇性搜索利用這一點(diǎn)，自底向上合并相鄰的重疊區(qū)域，從而減少冗余。

區(qū)域提名并不只有以上所說的三種方法，實(shí)際上這塊是非常靈活的，因此變種也很多，有興趣的讀者不妨參考一下文獻(xiàn)[12]。

選擇性搜索的具體算法細(xì)節(jié)[8]如算法1所示。總體上選擇性搜索是自底向上不斷合并候選區(qū)域的迭代過程。

?



    輸入: 一張圖片


    輸出：候選的目標(biāo)位置集合L
    
    算法：
    
    1: 利用過切分方法得到候選的區(qū)域集合R = {r1,r2,…,rn}
    
    2: 初始化相似集合S = ?
    
    3: foreach 鄰居區(qū)域?qū)?ri,rj) do
    
    4:     計算相似度s(ri,rj)
    
    5:     S = S  ∪ s(ri,rj)
    
    6: while S not=? do
    
    7:     得到最大的相似度s(ri,rj)=max(S)
    
    8:     合并對應(yīng)的區(qū)域rt = ri ∪ rj
    
    9:     移除ri對應(yīng)的所有相似度：S = S\s(ri,r*)
    
    10:    移除rj對應(yīng)的所有相似度：S = S\s(r*,rj)
    
    11:    計算rt對應(yīng)的相似度集合St
    
    12:    S = S ∪ St
    
    13:    R = R ∪ rt
    
    14: L = R中所有區(qū)域?qū)?yīng)的邊框

算法1 選擇性搜索算法

從算法不難看出，R中的區(qū)域都是合并后的，因此減少了不少冗余，相當(dāng)于準(zhǔn)確率提升了，但是別忘了我們還需要繼續(xù)保證召回率，因此算法1中的相似度計算策略就顯得非常關(guān)鍵了。如果簡單采用一種策略很容易錯誤合并不相似的區(qū)域，比如只考慮輪廓時，不同顏色的區(qū)域很容易被誤合并。選擇性搜索采用多樣性策略來增加候選區(qū)域以保證召回，比如顏色空間考慮RGB、灰度、HSV及其變種等，相似度計算時既考慮顏色相似度，又考慮紋理、大小、重疊情況等。

總體上，選擇性搜索是一種比較樸素的區(qū)域提名方法，被早期的基于深度學(xué)習(xí)的目標(biāo)檢測方法（包括Overfeat和R-CNN等）廣泛利用，但被當(dāng)前的新方法棄用了。

5.1.2 OverFeat

OverFeat是用CNN統(tǒng)一來做分類、定位和檢測的經(jīng)典之作，作者是深度學(xué)習(xí)大神之一Yann Lecun在紐約大學(xué)的團(tuán)隊。OverFeat也是ILSVRC
2013任務(wù)3（分類+定位）的冠軍得主。

OverFeat的核心思想有三點(diǎn)：

1 區(qū)域提名：結(jié)合滑動窗口和規(guī)則塊，即多尺度（multi-scale)的滑動窗口；

2
分類和定位：統(tǒng)一用CNN來做分類和預(yù)測邊框位置，模型與AlexNet[12]類似，其中1-5層為特征抽取層，即將圖片轉(zhuǎn)換為固定維度的特征向量，6-9層為分類層(分類任務(wù)專用)，不同的任務(wù)（分類、定位、檢測）公用特征抽取層（1-5層），只替換6-9層；

3
累積：因?yàn)橛昧嘶瑒哟翱?，同一個目標(biāo)對象會有多個位置，也就是多個視角；因?yàn)橛昧硕喑叨龋粋€目標(biāo)對象又會有多個大小不一的塊。這些不同位置和不同大小塊上的分類置信度會進(jìn)行累加，從而使得判定更為準(zhǔn)確。

OverFeat的關(guān)鍵步驟有四步：

1
利用滑動窗口進(jìn)行不同尺度的區(qū)域提名，然后使用CNN模型對每個區(qū)域進(jìn)行分類，得到類別和置信度。從圖中可以看出，不同縮放比例時，檢測出來的目標(biāo)對象數(shù)量和種類存在較大差異；

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
2 利用多尺度滑動窗口來增加檢測數(shù)量，提升分類效果，如圖3所示；

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
3 用回歸模型預(yù)測每個對象的位置，從圖4中來看，放大比例較大的圖片，邊框數(shù)量也較多；

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java

4 邊框合并。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
Overfeat是CNN用來做目標(biāo)檢測的早期工作，主要思想是采用了多尺度滑動窗口來做分類、定位和檢測，雖然是多個任務(wù)但重用了模型前面幾層，這種模型重用的思路也是后來R-
CNN系列不斷沿用和改進(jìn)的經(jīng)典做法。

當(dāng)然Overfeat也是有不少缺點(diǎn)的，至少速度和效果都有很大改進(jìn)空間，后面的R-CNN系列在這兩方面做了很多提升。

5.2 基于區(qū)域提名的方法

主要介紹基于區(qū)域提名的方法，包括R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN。

5.2.1 R-CNN

如前面所述，早期的目標(biāo)檢測，大都使用滑動窗口的方式進(jìn)行窗口提名，這種方式本質(zhì)是窮舉法，R-CNN采用的是Selective Search。

以下是R-CNN的主要步驟：

區(qū)域提名：通過Selective Search從原始圖片提取2000個左右區(qū)域候選框；

區(qū)域大小歸一化：把所有侯選框縮放成固定大?。ㄔ牟捎?27×227）；

特征提?。和ㄟ^CNN網(wǎng)絡(luò)，提取特征；

分類與回歸：在特征層的基礎(chǔ)上添加兩個全連接層，再用SVM分類來做識別，用線性回歸來微調(diào)邊框位置與大小，其中每個類別單獨(dú)訓(xùn)練一個邊框回歸器。

其中目標(biāo)檢測系統(tǒng)的結(jié)構(gòu)如圖6所示，注意，圖中的第2步對應(yīng)步驟中的1、2步，即包括區(qū)域提名和區(qū)域大小歸一化。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
Overfeat可以看做是R-CNN的一個特殊情況，只需要把Selective
Search換成多尺度的滑動窗口，每個類別的邊框回歸器換成統(tǒng)一的邊框回歸器，SVM換為多層網(wǎng)絡(luò)即可。但是Overfeat實(shí)際比R-
CNN快9倍，這主要得益于卷積相關(guān)的共享計算。

事實(shí)上，R-CNN有很多缺點(diǎn)：

重復(fù)計算：R-CNN雖然不再是窮舉，但依然有兩千個左右的候選框，這些候選框都需要進(jìn)行CNN操作，計算量依然很大，其中有不少其實(shí)是重復(fù)計算；

SVM模型：而且還是線性模型，在標(biāo)注數(shù)據(jù)不缺的時候顯然不是最好的選擇；

訓(xùn)練測試分為多步：區(qū)域提名、特征提取、分類、回歸都是斷開的訓(xùn)練的過程，中間數(shù)據(jù)還需要單獨(dú)保存；

訓(xùn)練的空間和時間代價很高：卷積出來的特征需要先存在硬盤上，這些特征需要幾百G的存儲空間；

慢：前面的缺點(diǎn)最終導(dǎo)致R-CNN出奇的慢，GPU上處理一張圖片需要13秒，CPU上則需要53秒[2]。

當(dāng)然，R-CNN這次是沖著效果來的，其中ILSVRC 2013數(shù)據(jù)集上的mAP由Overfeat的24.3%提升到了31.4%，第一次有了質(zhì)的改變。

5.2.2 SPP-net

SPP-net是MSRA何愷明等人提出的，其主要思想是去掉了原始圖像上的crop/warp等操作，換成了在卷積特征上的空間金字塔池化層（Spatial
Pyramid Pooling，SPP），如圖7所示。為何要引入SPP層
，主要原因是CNN的全連接層要求輸入圖片是大小一致的，而實(shí)際中的輸入圖片往往大小不一，如果直接縮放到同一尺寸，很可能有的物體會充滿整個圖片，而有的物體可能只能占到圖片的一角。傳統(tǒng)的解決方案是進(jìn)行不同位置的裁剪，但是這些裁剪技術(shù)都可能會導(dǎo)致一些問題出現(xiàn)，比如圖7中的crop會導(dǎo)致物體不全，warp導(dǎo)致物體被拉伸后形變嚴(yán)重，SPP就是為了解決這種問題的。SPP對整圖提取固定維度的特征，再把圖片均分成4份，每份提取相同維度的特征，再把圖片均分為16份，以此類推?？梢钥闯觯瑹o論圖片大小如何，提取出來的維度數(shù)據(jù)都是一致的，這樣就可以統(tǒng)一送至全連接層了。SPP思想在后來的R-
CNN模型中也被廣泛用到。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java

SPP-net的網(wǎng)絡(luò)結(jié)構(gòu)如圖8所示，實(shí)質(zhì)是最后一層卷積層后加了一個SPP層，將維度不一的卷積特征轉(zhuǎn)換為維度一致的全連接輸入。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java

SPP-net做目標(biāo)檢測的主要步驟為：

1 區(qū)域提名：用Selective Search從原圖中生成2000個左右的候選窗口；

2 區(qū)域大小縮放：SPP-net不再做區(qū)域大小歸一化，而是縮放到min(w,
h)=s，即統(tǒng)一長寬的最短邊長度，s選自{480,576,688,864,1200}中的一個，選擇的標(biāo)準(zhǔn)是使得縮放后的候選框大小與224×224最接近；

3 特征提?。豪肧PP-net網(wǎng)絡(luò)結(jié)構(gòu)提取特征；

4 分類與回歸：類似R-CNN，利用SVM基于上面的特征訓(xùn)練分類器模型，用邊框回歸來微調(diào)候選框的位置。

SPP-net解決了R-CNN區(qū)域提名時crop/warp帶來的偏差問題，提出了SPP層，使得輸入的候選框可大可小，但其他方面依然和R-
CNN一樣，因而依然存在不少問題，這就有了后面的Fast R-CNN。

5.2.3 Fast R-CNN

Fast R-CNN是要解決R-CNN和SPP-net兩千個左右候選框帶來的重復(fù)計算問題，其主要思想為：

1 使用一個簡化的SPP層 —— RoI（Region of Interesting） Pooling層，操作與SPP類似；

2 訓(xùn)練和測試是不再分多步：不再需要額外的硬盤來存儲中間層的特征，梯度能夠通過RoI Pooling層直接傳播；此外，分類和回歸用Multi-
task的方式一起進(jìn)行；

3 SVD：使用SVD分解全連接層的參數(shù)矩陣，壓縮為兩個規(guī)模小很多的全連接層。

Fast R-CNN的主要步驟如下：

1 特征提取：以整張圖片為輸入利用CNN得到圖片的特征層；

2 區(qū)域提名：通過Selective Search等方法從原始圖片提取區(qū)域候選框，并把這些候選框一一投影到最后的特征層；

3 區(qū)域歸一化：針對特征層上的每個區(qū)域候選框進(jìn)行RoI Pooling操作，得到固定大小的特征表示；

4 分類與回歸：然后再通過兩個全連接層，分別用softmax多分類做目標(biāo)識別，用回歸模型進(jìn)行邊框位置與大小微調(diào)。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
Fast R-CNN比R-CNN的訓(xùn)練速度（大模型L）快8.8倍，測試時間快213倍，比SPP-net訓(xùn)練速度快2.6倍，測試速度快10倍左右。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java

5.3 端到端的方法

介紹端到端（End-to-End）的目標(biāo)檢測方法，這些方法無需區(qū)域提名，包括YOLO和SSD。

YOLO

YOLO的全拼是You Only Look Once，顧名思義就是只看一次，進(jìn)一步把目標(biāo)判定和目標(biāo)識別合二為一，所以識

網(wǎng)絡(luò)的整體結(jié)構(gòu)如圖所示，針對一張圖片，YOLO的處理步驟為：

把輸入圖片縮放到448×448大小；

運(yùn)行卷積網(wǎng)絡(luò)；

對模型置信度卡閾值，得到目標(biāo)位置與類別。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
網(wǎng)絡(luò)的模型如圖15所示，將448×448大小的圖切成S×S的網(wǎng)格，目標(biāo)中心點(diǎn)所在的格子負(fù)責(zé)該目標(biāo)的相關(guān)檢測，每個網(wǎng)格預(yù)測B個邊框及其置信度，以及C種類別的概率。YOLO中S=7，B=2，C取決于數(shù)據(jù)集中物體類別數(shù)量，比如VOC數(shù)據(jù)集就是C=20。對VOC數(shù)據(jù)集來說，YOLO就是把圖片統(tǒng)一縮放到448×448，然后每張圖平均劃分為7×7=49個小格子，每個格子預(yù)測2個矩形框及其置信度，以及20種類別的概率。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
YOLO簡化了整個目標(biāo)檢測流程，速度的提升也很大，但是YOLO還是有不少可以改進(jìn)的地方，比如S×S的網(wǎng)格就是一個比較啟發(fā)式的策略，如果兩個小目標(biāo)同時落入一個格子中，模型也只能預(yù)測一個；另一個問題是Loss函數(shù)對不同大小的bbox未做區(qū)分。

SSD

SSD[17,23]的全拼是Single Shot MultiBox
Detector，沖著YOLO的缺點(diǎn)來的。SSD的框架如圖16所示，圖16(a)表示帶有兩個Ground
Truth邊框的輸入圖片，圖16(b)和?分別表示8×8網(wǎng)格和4×4網(wǎng)格，顯然前者適合檢測小的目標(biāo)，比如圖片中的貓，后者適合檢測大的目標(biāo)，比如圖片中的狗。在每個格子上有一系列固定大小的Box（有點(diǎn)類似前面提到的Anchor
Box），這些在SSD稱為Default Box，用來框定目標(biāo)物體的位置，在訓(xùn)練的時候Ground
Truth會賦予給某個固定的Box，比如圖16(b)中的藍(lán)框和圖16?中的紅框

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
SSD的網(wǎng)絡(luò)分為兩部分，前面的是用于圖像分類的標(biāo)準(zhǔn)網(wǎng)絡(luò)（去掉了分類相關(guān)的層），后面的網(wǎng)絡(luò)是用于檢測的多尺度特征映射層，從而達(dá)到檢測不同大小的目標(biāo)。SSD和YOLO的網(wǎng)絡(luò)結(jié)構(gòu)對比如圖17所示。

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java
SSD在保持YOLO高速的同時效果也提升很多，主要是借鑒了Faster
R-CNN中的Anchor機(jī)制，同時使用了多尺度。但是從原理依然可以看出，Default
Box的形狀以及網(wǎng)格大小是事先固定的，那么對特定的圖片小目標(biāo)的提取會不夠好。

6 人體檢測結(jié)果

計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí),python,java

7 最后

?? 更多資料, 項(xiàng)目分享：

https://gitee.com/dancheng-senior/postgraduate

到了這里，關(guān)于計算機(jī)競賽機(jī)器視覺目標(biāo)檢測 - opencv 深度學(xué)習(xí)的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

機(jī)器視覺 opencv 深度學(xué)習(xí) 駕駛?cè)四樒跈z測系統(tǒng) -python 計算機(jī)競賽
?? 優(yōu)質(zhì)競賽項(xiàng)目系列，今天要分享的是 ?? 機(jī)器視覺 opencv 深度學(xué)習(xí) 駕駛?cè)四樒跈z測系統(tǒng) 該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！ ??學(xué)長這里給一個題目綜合評分(每項(xiàng)滿分5分) 難度系數(shù)：3分工作量：3分創(chuàng)新點(diǎn)：4分 ?? 更多資料, 項(xiàng)目分享： https:/
2024年02月05日
瀏覽(97)
計算機(jī)視覺+深度學(xué)習(xí)+機(jī)器學(xué)習(xí)+opencv+目標(biāo)檢測跟蹤（代碼+視頻）
計算機(jī)視覺、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)是當(dāng)今最熱門的技術(shù)，它們被廣泛應(yīng)用于各種領(lǐng)域，如自動駕駛、醫(yī)學(xué)圖像分析、安防監(jiān)控等。而目標(biāo)檢測跟蹤技術(shù)則是計算機(jī)視覺中的一個重要分支，它可以幫助我們在圖像或視頻中自動識別和跟蹤特定的目標(biāo)。下面我們來一一介紹這些技
2024年02月01日
瀏覽(59)
計算機(jī)競賽題目：基于機(jī)器視覺opencv的手勢檢測手勢識別算法 - 深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) opencv python
?? 優(yōu)質(zhì)競賽項(xiàng)目系列，今天要分享的是基于機(jī)器視覺opencv的手勢檢測手勢識別算法該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！ ?? 更多資料, 項(xiàng)目分享： https://gitee.com/dancheng-senior/postgraduate 普通機(jī)器視覺手勢檢測的基本流程如下：其中輪廓的提取，多邊形
2024年02月07日
瀏覽(96)
計算機(jī)視覺+深度學(xué)習(xí)+機(jī)器學(xué)習(xí)+opencv+目標(biāo)檢測跟蹤+一站式學(xué)習(xí)（代碼+視頻+PPT)
第1章：視覺項(xiàng)目資料介紹與學(xué)習(xí)指南相關(guān)知識：介紹計算機(jī)視覺、OpenCV庫，以及課程的整體結(jié)構(gòu)。學(xué)習(xí)概要：了解課程的目標(biāo)和學(xué)習(xí)路徑，為后續(xù)章節(jié)做好準(zhǔn)備。重要性：提供學(xué)生對整個課程的整體認(rèn)識，為學(xué)習(xí)提供框架和背景。包括了計算機(jī)視覺/opencv視頻視頻對應(yīng)
2024年02月05日
瀏覽(58)
基于計算機(jī)視覺，深度學(xué)習(xí)、機(jī)器學(xué)習(xí)，OpenCV，圖像分割，目標(biāo)檢測卷積神經(jīng)網(wǎng)絡(luò)計算機(jī)畢業(yè)設(shè)計選題題目大全選題指導(dǎo)
隨著深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的快速發(fā)展，計算機(jī)視覺領(lǐng)域的應(yīng)用變得越來越廣泛和有趣。本畢業(yè)設(shè)計旨在探索這一領(lǐng)域的前沿技術(shù)，將深度學(xué)習(xí)模型、神經(jīng)網(wǎng)絡(luò)架構(gòu)、OpenCV圖像處理工具，以及卷積神經(jīng)網(wǎng)絡(luò)（CNN）的強(qiáng)大能力結(jié)合起來，以解決實(shí)際圖像處理問題。
2024年02月08日
瀏覽(100)
計算機(jī)競賽車道線檢測(自動駕駛機(jī)器視覺)
無人駕駛技術(shù)是機(jī)器學(xué)習(xí)為主的一門前沿領(lǐng)域，在無人駕駛領(lǐng)域中機(jī)器學(xué)習(xí)的各種算法隨處可見，今天學(xué)長給大家介紹無人駕駛技術(shù)中的車道線檢測。在無人駕駛領(lǐng)域每一個任務(wù)都是相當(dāng)復(fù)雜，看上去無從下手。那么面對這樣極其復(fù)雜問題，我們解決問題方式從先嘗試簡化問
2024年02月08日
瀏覽(27)
基于機(jī)器視覺的車道線檢測計算機(jī)競賽
?? 優(yōu)質(zhì)競賽項(xiàng)目系列，今天要分享的是基于深度學(xué)習(xí)的視頻多目標(biāo)跟蹤實(shí)現(xiàn) 該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！ ?? 更多資料, 項(xiàng)目分享： https://gitee.com/dancheng-senior/postgraduate 理解車道檢測的概念那么什么是車道檢測？以下是百度百科對車道的定義：
2024年02月08日
瀏覽(29)
計算機(jī)競賽基于機(jī)器視覺的行人口罩佩戴檢測
簡介 2020新冠爆發(fā)以來，疫情牽動著全國人民的心，一線醫(yī)護(hù)工作者在最前線抗擊疫情的同時，我們也可以看到很多科技行業(yè)和人工智能領(lǐng)域的從業(yè)者，也在貢獻(xiàn)著他們的力量。近些天來，曠視、商湯、?？?、百度都多家科技公司研發(fā)出了帶有AI人臉檢測算法的紅外測溫、口罩
2024年02月10日
瀏覽(19)
計算機(jī)競賽基于機(jī)器視覺的手勢檢測和識別算法
?? 優(yōu)質(zhì)競賽項(xiàng)目系列，今天要分享的是基于深度學(xué)習(xí)的手勢檢測與識別算法該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！ ?? 更多資料, 項(xiàng)目分享： https://gitee.com/dancheng-senior/postgraduate 廢話不多說，先看看學(xué)長實(shí)現(xiàn)的效果吧主流的手勢分割方法主要分為靜態(tài)手
2024年02月11日
瀏覽(30)
計算機(jī)競賽基于機(jī)器視覺的停車位識別檢測
簡介你是不是經(jīng)常在停車場周圍轉(zhuǎn)來轉(zhuǎn)去尋找停車位。如果你的車輛能準(zhǔn)確地告訴你最近的停車位在哪里，那是不是很爽？事實(shí)證明，基于深度學(xué)習(xí)和OpenCV解決這個問題相對容易，只需獲取停車場的實(shí)時視頻即可。該項(xiàng)目較為新穎，適合作為競賽課題方向，學(xué)長非常推薦！
2024年02月11日
瀏覽(39)