国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

2年前作者：一直特立獨(dú)行的貓1994分類：Toy博客閱讀(26)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

論文鏈接： https://www.cv-foundation.org/openaccess/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf
論文技術(shù)報(bào)告鏈接： https://arxiv.org/pdf/1311.2524.pdf
出處： CVPR 2014
參考視頻： https://www.bilibili.com/video/BV1d64y1W74E/?spm_id_from=333.999.0.0&vd_source=e321967bf2cdc2338238788250d12de8

R-CNN基本原理

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

總結(jié)起來就是：輸入原圖，然后用selective search算法生成2000個(gè)候選框，再將每個(gè)候選框縮放為 $227\times227$ 的固定大小，再逐一喂到同一個(gè)卷積神經(jīng)網(wǎng)絡(luò)提取4096維的特征，用該4096維的特征同時(shí)進(jìn)行分類(線性SVM)和回歸，最終得到目標(biāo)檢測(cè)結(jié)果。

可以看到R-CNN嚴(yán)重依賴上下游的多個(gè)步驟協(xié)作完成目標(biāo)檢測(cè)任務(wù)：①提取候選框；②縮放；③用CNN提取特征；④分類和回歸。只要有一個(gè)步驟出現(xiàn)問題，整個(gè)檢測(cè)系統(tǒng)就會(huì)出現(xiàn)問題。每個(gè)步驟都需要單獨(dú)去優(yōu)化，因此并不是一個(gè)端到端的系統(tǒng)。

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
R-CNN是一個(gè)非常耗時(shí)、非常低效、非常臃腫、一點(diǎn)不端到端的算法：
因此，可以對(duì)R-CNN進(jìn)行改進(jìn)：

產(chǎn)生候選框-Selective Search

論文鏈接： https://www.koen.me/research/selectivesearch/

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

將候選框縮放至 227 × 227 227\times227 227×227固定大小

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
最終，作者采用連帶鄰近像素的非等比例縮放方法，連帶像素 $p = 16$ 。
這種將像素向外擴(kuò)一圈，并將擴(kuò)展之后的結(jié)果作為候選框的方法叫做Dilate proposal。

可視化能夠使得某個(gè)feature map的某個(gè)值最大化的原始候選框

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
從AlexNet最后一個(gè)池化層得到的feature map的形狀是 $6\times6\times256$ ，我們可視化其中的某一個(gè)channel的某一個(gè)值，找到使得這個(gè)值最大化的原始的候選框。
作者從 $6\times6\times256$ 的feature map中選了60多個(gè)channel來可視化能夠使得某個(gè)channel的某個(gè)值最大化的24個(gè)原始候選框：
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

對(duì)比實(shí)驗(yàn)

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
說明了fine-tuning的重要性。

R-CNN用于語義分割：

為什么不直接用softmax分類而要用線性SVM分類？

原因①：
fine-tuning時(shí)與訓(xùn)練各類別SVM時(shí)的正負(fù)樣本選擇策略是不一樣的，所以，如果直接用softmax的話，就必須都按照fine-tuning的正負(fù)樣本的選擇策略來，但是如果用SVM來分類的話，會(huì)更好，因?yàn)橛?xùn)練SVM時(shí)加入了hard negtive mining，而且選擇正負(fù)樣本時(shí)也和fine-tuning時(shí)不一樣。因此，不能直接用softmax而是要用SVM的。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 原因②：
為什么不使用SVM的正負(fù)樣本選擇策略去訓(xùn)練softmax?作者是使用Matlab實(shí)現(xiàn)的，Matlab是一個(gè)封裝的很死的一個(gè)庫，不允許有太多的自由的修改，不像python一樣可以自由的修改底層代碼。RBG大神當(dāng)時(shí)寫R-CNN時(shí)用的是Matlab，可能matlab只有SVM可以進(jìn)行hard negtive mining。所以沒有直接用softmax而是用的SVM。

Bounding Box Regression

所謂回歸就是對(duì)候選框進(jìn)行精調(diào)，使回歸模型輸出一系列偏移量，再對(duì)候選框施加偏移量從而得到最終的預(yù)測(cè)框。

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 具體來講：

讓黃色去擬合藍(lán)色，即找一套線性權(quán)重，使得損失函數(shù)最小。

R-CNN的Slides講解

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 沒有什么實(shí)質(zhì)性的進(jìn)展。
R-CNN取得了實(shí)質(zhì)性的突破。

R-CNN論文精度

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN

Selective Search產(chǎn)生Region proposals

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 強(qiáng)行縮放：

候選框特征提取

目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 使用Caffe實(shí)現(xiàn)的AlexNet作為特征提取的骨干網(wǎng)絡(luò)，包括5個(gè)卷積層和2個(gè)全連接層。
把所有一千萬個(gè)候選框輸入，找到能使某個(gè)feature map中的某個(gè)值產(chǎn)生最大激活的候選框，也就是使某單次卷積、單個(gè)神經(jīng)元產(chǎn)生最大激活。
不對(duì)這個(gè)feature map求平均，只關(guān)注某個(gè)feature map中的某個(gè)值。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 使6個(gè)通道中的某6個(gè)神經(jīng)元產(chǎn)生最大激活的top regions。
沒有fine turning時(shí)，預(yù)訓(xùn)練模型中CNN的特征表示性能大部分來自卷積層而非全連接層，去掉全連接層影響不大。進(jìn)行fine turning時(shí)，CNN提取通用特征，F(xiàn)C完成特定領(lǐng)域任務(wù)。
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN 加了邊界框回歸能有效降低定位誤差。
輸入CNN之前，強(qiáng)行將候選框縮放至統(tǒng)一尺寸、統(tǒng)一長寬比，所以在不同尺寸和長寬比上FT性能提升意味著全連接層學(xué)習(xí)到更有用的特征。

正負(fù)樣本的問題：為什么在fine turning訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)和在訓(xùn)練各類別的線性SVM時(shí)的正負(fù)樣本的選取不一樣？
目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN
fine turning時(shí)，正樣本與GT有偏離，精準(zhǔn)定位性能差；
用softmax并不能解決這一問題（掉點(diǎn)）；
用SVM時(shí)，GT框?yàn)樵擃愓龢颖?，精?zhǔn)定位性能好，且加入了難例挖掘，能夠較好的解決問題。文章來源地址http://www.zghlxwxcb.cn/news/detail-445289.html

到了這里，關(guān)于目標(biāo)檢測(cè)經(jīng)典論文精讀-R-CNN的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

實(shí)例分割論文精讀：Mask R-CNN
本文提出了一種概念簡單、靈活、通用的實(shí)例分割方法，該方法在有效地檢測(cè)圖像中的物體同時(shí)，為每個(gè)物體實(shí)例生成一個(gè)實(shí)例分割模板，添加了一個(gè)分支，用于預(yù)測(cè)一個(gè)對(duì)象遮罩，與現(xiàn)有的分支并行，用于邊界框識(shí)別，Mask R-CNN易于訓(xùn)練，只給Faster R-CNN增加了很小的開銷,運(yùn)
2024年02月01日
瀏覽(25)
目標(biāo)檢測(cè)——R-CNN網(wǎng)絡(luò)基礎(chǔ)
候選區(qū)域生成 CNN網(wǎng)絡(luò)提取特征目標(biāo)分類（SVM）目標(biāo)定位紅色是SS生成的結(jié)果，綠色是標(biāo)注框預(yù)測(cè)過程 ROI Pooling 目標(biāo)分類和回歸
2024年02月17日
瀏覽(32)
目標(biāo)檢測(cè)網(wǎng)絡(luò)系列之R-CNN
2023年09月08日
瀏覽(25)
【目標(biāo)檢測(cè)】Faster R-CNN算法實(shí)現(xiàn)
繼2014年的R-CNN、2015年的Fast R-CNN后，2016年目標(biāo)檢測(cè)領(lǐng)域再次迎來Ross Girshick大佬的神作Faster R-CNN，一舉解決了目標(biāo)檢測(cè)的實(shí)時(shí)性問題。相較于Fast R-CNN而言，F(xiàn)aster R-CNN主要改進(jìn)措施包括：區(qū)域建議網(wǎng)絡(luò)（RPN）：Faster R-CNN摒棄了選擇性搜索，提出區(qū)域提議網(wǎng)絡(luò)（Region Proposal Netwo
2024年03月14日
瀏覽(28)
基于Faster R-CNN實(shí)現(xiàn)目標(biāo)檢測(cè)
楊金鵬，男，西安工程大學(xué)電子信息學(xué)院，2022級(jí)研究生研究方向：機(jī)器視覺與人工智能電子郵件：1394026082@qq.com 路治東，男，西安工程大學(xué)電子信息學(xué)院，2022級(jí)研究生，張宏偉人工智能課題組研究方向：機(jī)器視覺與人工智能電子郵件：2063079527@qq.com Faster RCNN檢測(cè)部分主要
2024年02月07日
瀏覽(24)
目標(biāo)檢測(cè)(Object Detection)：Fast R-CNN，YOLO v3
目錄目標(biāo)檢測(cè)(Object Detection) R-CNN SPPNet Fast R-CNN YOLO v1 YOLO v2 YOLO v3 任務(wù)是計(jì)算機(jī)視覺中非常重要的基礎(chǔ)問題，也是解決圖像分割、目標(biāo)跟蹤、圖像描述等問題的基礎(chǔ)。目標(biāo)檢測(cè)是檢測(cè)輸入圖像是否存在給定類別的物體，如果存在，輸出物體在圖像中的位置信息（矩形框的坐標(biāo)
2024年02月11日
瀏覽(24)
Voxel R-CNN：基于體素的高性能 3D 目標(biāo)檢測(cè)
論文地址：https://arxiv.org/abs/2012.15712 論文代碼：https://github.com/djiajunustc/Voxel-R-CNN 基于點(diǎn)的方法具有較高的檢測(cè)精度，但基于點(diǎn)的方法通常效率較低，因?yàn)閷?duì)于點(diǎn)集抽象來說，使用點(diǎn)表示來搜索最近鄰的代價(jià)更高。相比于基于點(diǎn)，更高效，基于體素的結(jié)構(gòu)更適合于特征提取，
2024年02月09日
瀏覽(15)
深度學(xué)習(xí)之目標(biāo)檢測(cè)R-CNN模型算法流程詳解說明（超詳細(xì)理論篇）
1.R-CNN論文背景 2. R-CNN算法流程 3. R-CNN創(chuàng)新點(diǎn) 論文網(wǎng)址https://openaccess.thecvf.com/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf ??RCNN（Region-based Convolutional Neural Networks）是一篇由Ross Girshick等人于2014年發(fā)表的論文，題為《Rich feature hierarchies for accurate object detection
2024年02月11日
瀏覽(24)
人工智能詳細(xì)筆記：計(jì)算機(jī)視覺、目標(biāo)檢測(cè)與R-CNN系列 YOLO系列模型
計(jì)算機(jī)視覺概述：計(jì)算機(jī)視覺是一種利用計(jì)算機(jī)算法和數(shù)學(xué)模型來模擬和自動(dòng)化人類視覺的學(xué)科領(lǐng)域。計(jì)算機(jī)視覺的地位：計(jì)算機(jī)視覺（CV）與自然語言處理（NLP）、語音識(shí)別（SR）并列為機(jī)器學(xué)習(xí)方向的三大熱點(diǎn)方向。計(jì)算機(jī)視覺的常見任務(wù) ：下面將從粗粒度到細(xì)粒度介
2024年02月08日
瀏覽(30)
目標(biāo)檢測(cè)算法（R-CNN，fast R-CNN，faster R-CNN，yolo，SSD，yoloV2，yoloV3，yoloV4,yoloV5,yoloV6，yoloV7）
深度學(xué)習(xí)目前已經(jīng)應(yīng)用到了各個(gè)領(lǐng)域，應(yīng)用場(chǎng)景大體分為三類：物體識(shí)別，目標(biāo)檢測(cè)，自然語言處理。目標(biāo)檢測(cè)可以理解為是物體識(shí)別和物體定位的綜合，不僅僅要識(shí)別出物體屬于哪個(gè)分類，更重要的是得到物體在圖片中的具體位置。為了完成這兩個(gè)任務(wù)，目標(biāo)檢測(cè)模型分
2024年02月02日
瀏覽(27)