?
計算機視覺筆記:第一章 圖像分類-CSDN博客
計算機視覺筆記 第二章 圖像語義分割-CSDN博客
計算機視覺筆記 第三章:目標(biāo)檢測-CSDN博客
計算機視覺 第四章:圖像識別、目標(biāo)跟蹤-CSDN博客
計算機視覺 第五章 多目視覺(立體視覺)-CSDN博客
標(biāo)定圖像中目標(biāo)的位置,并給出目標(biāo)的類別
目標(biāo)檢測和語義分割的區(qū)別:
語義分割:包含低層的像素級別的處理方法,也包含高層的語義級別的處理方法
目標(biāo)檢測:基本都是高層的語義級別的處理方法
基于經(jīng)典手工特征的目標(biāo)檢測算法
通用流程:1. 使用滑動窗口尋找目標(biāo);
2. 使用模板匹配或者其改進方法對滑窗選中的區(qū)域進行判斷。
滑動窗口與模板匹配檢測法(蠻力搜索):
目標(biāo)發(fā)生旋轉(zhuǎn)或大小變化等,方法都會失效
選擇性搜索:
用類似區(qū)域分裂合并法的方法找到目標(biāo)候選區(qū)域
多元化策略---色彩空間多樣化:使用不同的色彩空間,以提取不同的不變屬性
?????????? 相似度度量多樣化:顏色、紋理、尺寸等多方面相似度匹配
?????????? 改變起始區(qū)域:采用不同算法選取起始區(qū)域,以達到最佳分隔效果
優(yōu)點:多尺度,多元化,快速
VJ檢測器:
傳統(tǒng)滑動窗口檢測+
Haar特征:
?
?
Haar特征反映了局部區(qū)域之間的相對明暗關(guān)系,能夠為人臉和非人臉的區(qū)分提供有效的信息
特征選擇方法:
既想要速度也想要準確率,于是使用Adaboost決策器---把多個簡單分類器組合起來,聚弱為強。整個檢測器由多級Adaboost 決策器組成。
多階段處理:
將較少的計算資源分配 背景窗口,而將較多的計算資源分配在目標(biāo)窗口。 如果某一級決策器將當(dāng)前窗口判定為背景,則無需后 續(xù)決策就可繼續(xù)開始下一個窗口的判斷。
可變形部件模型:
將傳統(tǒng)對目標(biāo)整體的檢測問題拆分并轉(zhuǎn)化為對模型各個部件的檢測問題,然后將各部件檢測結(jié)果聚合成最終結(jié)果。即“從整體到部分,再從部分到整體”。
模型由基濾波器和一系列部件濾波器構(gòu)成。
對模型輸出結(jié)果采用采用邊界框回歸提升邊框位置精度,采用上下文信息集成提升檢測準確率。(上下文信息反映了各個類別的目標(biāo)在圖像中的聯(lián)合先驗概率密度分 布,即哪些類別的目標(biāo)可能同時出現(xiàn),哪些類別的目標(biāo)則不太可能同時出現(xiàn)。)
深度學(xué)習(xí)目標(biāo)檢測
RNN系列:兩階段算法。先產(chǎn)生目標(biāo)候選區(qū)域,再做分類回歸。準確率高。
Yolo系列,SSD系列:只用一個卷積網(wǎng)絡(luò)預(yù)測目標(biāo)位置和類別。速度快。
RNN系列:
RCNN:
借鑒滑動窗口思想,從圖片中提取2000個候選區(qū)域;
每個候選區(qū)域利用卷積神經(jīng)網(wǎng)絡(luò)獲取一個特征向量;
對于每個區(qū)域相應(yīng)的特征向量,利用支持向量機進行分類;
邊界框回歸,調(diào)整目標(biāo)邊界框的大小。
缺點:選擇性搜索效率低;串行CNN特征提取需要逐個候選框提取特征效率低;三個模塊(特征提取,SVM,邊框修正)是分別訓(xùn)練的,空間占用大
Fast RCNN:
使用一個卷積神經(jīng)網(wǎng)絡(luò)對全圖進行特征提取;
使用一個感興趣區(qū)域池化層在全圖特征上摘取每一個感興趣區(qū)域?qū)?yīng)的特征;
加入了多任務(wù)損失函數(shù),除了選擇性搜索,其他模塊都可以合在一起訓(xùn)練
? 缺點:選擇性搜索仍在
Faster RCNN:
區(qū)域提議網(wǎng)絡(luò)(RPN)取代選擇性搜索
錨框(先驗框):RPN預(yù)置了九種尺寸(三種面積128×128,256×256,512×512,每種面 積又包含三種長寬比1:1,1:2,2:1)的錨框在圖像上滑動來尋找目標(biāo)。一張圖片需要的錨框總數(shù)約為20000個。
Mask RCNN:
用感興趣區(qū)域(即先將原圖和特征圖的像素對應(yīng)起來,然后將特征圖和固定的特征區(qū)域?qū)?yīng)起來)對齊取代感興趣區(qū)域池化;
對這些感興趣區(qū)域進行分類(N類別分類)、邊界框回歸和掩模生成(在每一個感興趣區(qū)域里面進行FCN(全卷積)操作)
Yolo和ssd系列: 將物體分類和物體檢測網(wǎng)絡(luò)合二為一,都在全連接層完成
Yolo:
網(wǎng)絡(luò)結(jié)構(gòu)分為三部分:卷積層,目標(biāo)檢測層,非極大值抑制篩選層
卷積層提取特征,提高模型的泛化能力。目標(biāo)檢測層為每個邊界框計算一個置信度(置信度包含兩個方面,一是這個邊界框含有目標(biāo)的可能性大小,二是這個邊界框的準確度)。非極大值抑制篩選層:基本同邊界框回歸。
SSD:
結(jié)合了RNN和YOLO的優(yōu)點。文章來源:http://www.zghlxwxcb.cn/news/detail-854793.html
多尺寸特征圖上進行目標(biāo)檢測:每一個卷積層,都會輸出不同大小感受野的特征圖。在這些不同尺度的特征圖上,進行目標(biāo)位置和類別的訓(xùn)練和預(yù)測,從而達到多尺度檢測的目的。文章來源地址http://www.zghlxwxcb.cn/news/detail-854793.html
到了這里,關(guān)于計算機視覺筆記 第三章:目標(biāo)檢測的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!