国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

這篇具有很好參考價(jià)值的文章主要介紹了目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

論文鏈接: https://www.cv-foundation.org/openaccess/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf
論文技術(shù)報(bào)告鏈接: https://arxiv.org/pdf/1311.2524.pdf
出處: CVPR 2014
參考視頻: https://www.bilibili.com/video/BV1d64y1W74E/?spm_id_from=333.999.0.0&vd_source=e321967bf2cdc2338238788250d12de8

R-CNN基本原理

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
總結(jié)起來就是:輸入原圖,然后用selective search算法生成2000個(gè)候選框,再將每個(gè)候選框縮放為 227 × 227 227\times227 227×227的固定大小,再逐一喂到同一個(gè)卷積神經(jīng)網(wǎng)絡(luò)提取4096維的特征,用該4096維的特征同時(shí)進(jìn)行分類(線性SVM)和回歸,最終得到目標(biāo)檢測(cè)結(jié)果。

可以看到R-CNN嚴(yán)重依賴上下游的多個(gè)步驟協(xié)作完成目標(biāo)檢測(cè)任務(wù):①提取候選框;②縮放;③用CNN提取特征;④分類和回歸。只要有一個(gè)步驟出現(xiàn)問題,整個(gè)檢測(cè)系統(tǒng)就會(huì)出現(xiàn)問題。每個(gè)步驟都需要單獨(dú)去優(yōu)化,因此并不是一個(gè)端到端的系統(tǒng)。

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
R-CNN是一個(gè)非常耗時(shí)、非常低效、非常臃腫、一點(diǎn)不端到端的算法:
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN因此,可以對(duì)R-CNN進(jìn)行改進(jìn):
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

產(chǎn)生候選框-Selective Search

論文鏈接: https://www.koen.me/research/selectivesearch/

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

將候選框縮放至 227 × 227 227\times227 227×227固定大小

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
最終,作者采用連帶鄰近像素的非等比例縮放方法,連帶像素 p = 16 p=16 p=16。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN這種將像素向外擴(kuò)一圈,并將擴(kuò)展之后的結(jié)果作為候選框的方法叫做Dilate proposal。

可視化能夠使得某個(gè)feature map的某個(gè)值最大化的原始候選框

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
從AlexNet最后一個(gè)池化層得到的feature map的形狀是 6 × 6 × 256 6\times6\times256 6×6×256,我們可視化其中的某一個(gè)channel的某一個(gè)值,找到使得這個(gè)值最大化的原始的候選框。
作者從 6 × 6 × 256 6\times6\times256 6×6×256的feature map中選了60多個(gè)channel來可視化能夠使得某個(gè)channel的某個(gè)值最大化的24個(gè)原始候選框:
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

對(duì)比實(shí)驗(yàn)

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
說明了fine-tuning的重要性。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
R-CNN用于語義分割:
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

為什么不直接用softmax分類而要用線性SVM分類?

原因①:
fine-tuning時(shí)與訓(xùn)練各類別SVM時(shí)的正負(fù)樣本選擇策略是不一樣的,所以,如果直接用softmax的話,就必須都按照fine-tuning的正負(fù)樣本的選擇策略來,但是如果用SVM來分類的話,會(huì)更好,因?yàn)橛?xùn)練SVM時(shí)加入了hard negtive mining,而且選擇正負(fù)樣本時(shí)也和fine-tuning時(shí)不一樣。因此,不能直接用softmax而是要用SVM的。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN原因②:
為什么不使用SVM的正負(fù)樣本選擇策略去訓(xùn)練softmax?作者是使用Matlab實(shí)現(xiàn)的,Matlab是一個(gè)封裝的很死的一個(gè)庫,不允許有太多的自由的修改,不像python一樣可以自由的修改底層代碼。RBG大神當(dāng)時(shí)寫R-CNN時(shí)用的是Matlab,可能matlab只有SVM可以進(jìn)行hard negtive mining。所以沒有直接用softmax而是用的SVM。

Bounding Box Regression

所謂回歸就是對(duì)候選框進(jìn)行精調(diào),使回歸模型輸出一系列偏移量,再對(duì)候選框施加偏移量從而得到最終的預(yù)測(cè)框。

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN具體來講:
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
讓黃色去擬合藍(lán)色,即找一套線性權(quán)重,使得損失函數(shù)最小。

R-CNN的Slides講解

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN沒有什么實(shí)質(zhì)性的進(jìn)展。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN R-CNN取得了實(shí)質(zhì)性的突破。

R-CNN論文精度

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

Selective Search產(chǎn)生Region proposals

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN強(qiáng)行縮放:
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

候選框特征提取

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN使用Caffe實(shí)現(xiàn)的AlexNet作為特征提取的骨干網(wǎng)絡(luò),包括5個(gè)卷積層和2個(gè)全連接層。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN把所有一千萬個(gè)候選框輸入,找到能使某個(gè)feature map中的某個(gè)值產(chǎn)生最大激活的候選框,也就是使某單次卷積、單個(gè)神經(jīng)元產(chǎn)生最大激活。
不對(duì)這個(gè)feature map求平均,只關(guān)注某個(gè)feature map中的某個(gè)值。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN使6個(gè)通道中的某6個(gè)神經(jīng)元產(chǎn)生最大激活的top regions。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN沒有fine turning時(shí),預(yù)訓(xùn)練模型中CNN的特征表示性能大部分來自卷積層而非全連接層,去掉全連接層影響不大。進(jìn)行fine turning時(shí),CNN提取通用特征,F(xiàn)C完成特定領(lǐng)域任務(wù)。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN加了邊界框回歸能有效降低定位誤差。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN輸入CNN之前,強(qiáng)行將候選框縮放至統(tǒng)一尺寸、統(tǒng)一長寬比,所以在不同尺寸和長寬比上FT性能提升意味著全連接層學(xué)習(xí)到更有用的特征

正負(fù)樣本的問題:為什么在fine turning訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)和在訓(xùn)練各類別的線性SVM時(shí)的正負(fù)樣本的選取不一樣?
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
fine turning時(shí),正樣本與GT有偏離,精準(zhǔn)定位性能差;
用softmax并不能解決這一問題(掉點(diǎn));
用SVM時(shí),GT框?yàn)樵擃愓龢颖?,精?zhǔn)定位性能好,且加入了難例挖掘,能夠較好的解決問題。文章來源地址http://www.zghlxwxcb.cn/news/detail-445289.html

到了這里,關(guān)于目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 實(shí)例分割論文精讀:Mask R-CNN

    實(shí)例分割論文精讀:Mask R-CNN

    本文提出了一種概念簡單、靈活、通用的實(shí)例分割方法,該方法在有效地檢測(cè)圖像中的物體同時(shí),為每個(gè)物體實(shí)例生成一個(gè)實(shí)例分割模板,添加了一個(gè)分支,用于預(yù)測(cè)一個(gè)對(duì)象遮罩,與現(xiàn)有的分支并行,用于邊界框識(shí)別,Mask R-CNN易于訓(xùn)練,只給Faster R-CNN增加了很小的開銷,運(yùn)

    2024年02月01日
    瀏覽(25)
  • 目標(biāo)檢測(cè)——R-CNN網(wǎng)絡(luò)基礎(chǔ)

    目標(biāo)檢測(cè)——R-CNN網(wǎng)絡(luò)基礎(chǔ)

    候選區(qū)域生成 CNN網(wǎng)絡(luò)提取特征 目標(biāo)分類(SVM) 目標(biāo)定位 紅色是SS生成的結(jié)果,綠色是標(biāo)注框 預(yù)測(cè)過程 ROI Pooling 目標(biāo)分類和回歸

    2024年02月17日
    瀏覽(32)
  • 【目標(biāo)檢測(cè)】Faster R-CNN算法實(shí)現(xiàn)

    【目標(biāo)檢測(cè)】Faster R-CNN算法實(shí)現(xiàn)

    繼2014年的R-CNN、2015年的Fast R-CNN后,2016年目標(biāo)檢測(cè)領(lǐng)域再次迎來Ross Girshick大佬的神作Faster R-CNN,一舉解決了目標(biāo)檢測(cè)的實(shí)時(shí)性問題。相較于Fast R-CNN而言,F(xiàn)aster R-CNN主要改進(jìn)措施包括: 區(qū)域建議網(wǎng)絡(luò)(RPN):Faster R-CNN摒棄了選擇性搜索,提出區(qū)域提議網(wǎng)絡(luò)(Region Proposal Netwo

    2024年03月14日
    瀏覽(28)
  • 基于Faster R-CNN實(shí)現(xiàn)目標(biāo)檢測(cè)

    基于Faster R-CNN實(shí)現(xiàn)目標(biāo)檢測(cè)

    楊金鵬,男,西安工程大學(xué)電子信息學(xué)院,2022級(jí)研究生 研究方向:機(jī)器視覺與人工智能 電子郵件:1394026082@qq.com 路治東,男,西安工程大學(xué)電子信息學(xué)院,2022級(jí)研究生,張宏偉人工智能課題組 研究方向:機(jī)器視覺與人工智能 電子郵件:2063079527@qq.com Faster RCNN檢測(cè)部分主要

    2024年02月07日
    瀏覽(24)
  • 目標(biāo)檢測(cè)(Object Detection):Fast R-CNN,YOLO v3

    目標(biāo)檢測(cè)(Object Detection):Fast R-CNN,YOLO v3

    目錄 目標(biāo)檢測(cè)(Object Detection) R-CNN SPPNet Fast R-CNN YOLO v1 YOLO v2 YOLO v3 任務(wù)是計(jì)算機(jī)視覺中非常重要的基礎(chǔ)問題,也是解決圖像分割、目標(biāo)跟蹤、圖像描述等問題的基礎(chǔ)。目標(biāo)檢測(cè)是檢測(cè)輸入圖像是否存在給定類別的物體,如果存在,輸出物體在圖像中的位置信息(矩形框的坐標(biāo)

    2024年02月11日
    瀏覽(24)
  • Voxel R-CNN:基于體素的高性能 3D 目標(biāo)檢測(cè)

    Voxel R-CNN:基于體素的高性能 3D 目標(biāo)檢測(cè)

    論文地址:https://arxiv.org/abs/2012.15712 論文代碼:https://github.com/djiajunustc/Voxel-R-CNN 基于點(diǎn)的方法具有較高的檢測(cè)精度,但基于點(diǎn)的方法通常效率較低,因?yàn)閷?duì)于點(diǎn)集抽象來說,使用點(diǎn)表示來搜索最近鄰的代價(jià)更高。 相比于基于點(diǎn),更高效,基于體素的結(jié)構(gòu)更適合于特征提取,

    2024年02月09日
    瀏覽(15)
  • 深度學(xué)習(xí)之目標(biāo)檢測(cè)R-CNN模型算法流程詳解說明(超詳細(xì)理論篇)

    深度學(xué)習(xí)之目標(biāo)檢測(cè)R-CNN模型算法流程詳解說明(超詳細(xì)理論篇)

    1.R-CNN論文背景 2. R-CNN算法流程 3. R-CNN創(chuàng)新點(diǎn) 論文網(wǎng)址https://openaccess.thecvf.com/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf ??RCNN(Region-based Convolutional Neural Networks)是一篇由Ross Girshick等人于2014年發(fā)表的論文,題為《Rich feature hierarchies for accurate object detection

    2024年02月11日
    瀏覽(24)
  • 人工智能詳細(xì)筆記:計(jì)算機(jī)視覺、目標(biāo)檢測(cè)與R-CNN系列 YOLO系列模型

    計(jì)算機(jī)視覺概述 :計(jì)算機(jī)視覺是一種利用計(jì)算機(jī)算法和數(shù)學(xué)模型來模擬和自動(dòng)化人類視覺的學(xué)科領(lǐng)域。 計(jì)算機(jī)視覺的地位 :計(jì)算機(jī)視覺(CV)與自然語言處理(NLP)、語音識(shí)別(SR)并列為機(jī)器學(xué)習(xí)方向的三大熱點(diǎn)方向。 計(jì)算機(jī)視覺的常見任務(wù) :下面將從粗粒度到細(xì)粒度介

    2024年02月08日
    瀏覽(30)
  • 目標(biāo)檢測(cè)算法(R-CNN,fast R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3,yoloV4,yoloV5,yoloV6,yoloV7)

    目標(biāo)檢測(cè)算法(R-CNN,fast R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3,yoloV4,yoloV5,yoloV6,yoloV7)

    深度學(xué)習(xí)目前已經(jīng)應(yīng)用到了各個(gè)領(lǐng)域,應(yīng)用場(chǎng)景大體分為三類:物體識(shí)別,目標(biāo)檢測(cè),自然語言處理。 目標(biāo)檢測(cè)可以理解為是物體識(shí)別和物體定位的綜合 ,不僅僅要識(shí)別出物體屬于哪個(gè)分類,更重要的是得到物體在圖片中的具體位置。 為了完成這兩個(gè)任務(wù),目標(biāo)檢測(cè)模型分

    2024年02月02日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包