国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

一種提升深度多視角行人檢測(cè)的泛化性能的方法 Bringing Generalization to Deep Multi-View Pedestrian Detection

這篇具有很好參考價(jià)值的文章主要介紹了一種提升深度多視角行人檢測(cè)的泛化性能的方法 Bringing Generalization to Deep Multi-View Pedestrian Detection。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

一種提升深度多視角行人檢測(cè)的泛化性能的方法 Bringing Generalization to Deep Multi-View Pedestrian Detection

論文url: https://openaccess.thecvf.com/content/WACV2023W/RWS/html/Vora_Bringing_Generalization_to_Deep_Multi-View_Pedestrian_Detection_WACVW_2023_paper.html

論文簡(jiǎn)述

論文提出了一種用于多視角行人檢測(cè)的深度學(xué)習(xí)模型,旨在提高模型在不同攝像機(jī)數(shù)量、不同攝像機(jī)配置和新場(chǎng)景下的泛化能力。

總體框架圖

輸入

$ {N} $ 個(gè)校準(zhǔn)的RGB攝像頭圖像,圖像尺寸為( 3 , $ {H}{i} $ , $ {W} $),其中 $ {H}{i} $ 和 $ {W} $ 分別代表圖像的高度和寬度。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-846703.html

DropView Regularization

  • 操作:在訓(xùn)練過(guò)程中,對(duì)于每批次視角樣本,隨機(jī)選擇一個(gè)或多個(gè)視角進(jìn)行丟棄,即不使用這些視角圖進(jìn)行訓(xùn)練。
  • 作用:迫使模型學(xué)習(xí)到不依賴于任何單一視角的特征表示,這一操作也可以看作數(shù)據(jù)增強(qiáng),模擬了在實(shí)際應(yīng)用中可能遇到的攝像頭失效或視角遮擋等情況,從而使模型在面對(duì)不完整數(shù)據(jù)時(shí)仍能保持性能。提高了魯棒性,增強(qiáng)了泛化能力。

特征提取模塊(Feature Extraction)

  • 操作:使用ResNet18作為特征提取的主干網(wǎng)絡(luò),并將最后三層的步長(zhǎng)大卷積替換為空洞卷積(dilated convolutions),以獲得更高空間分辨率的特征圖。
  • 輸出: $ {N} $ 個(gè)攝像頭視圖的特征,尺寸為( $ {N} $ , $ {C} $ , $ {H}{f} $ , $ {W} $ ),其中 $ {C} $ 是通道數(shù)(特征數(shù)), $ {H}{f} $ 和 $ {W} $ 是提取的特征圖的高度和寬度。

透視變換(Perspective Transformation)

  • 對(duì)于每個(gè)視角的特征圖,使用透視變換將其從相機(jī)坐標(biāo)系映射到世界坐標(biāo)系中的地面平面(鳥瞰圖)上。
  • 透視變換考慮了相機(jī)的內(nèi)參 $ {K} $ 和外參 $ {[R|t]} $,其中內(nèi)參包括焦距和主點(diǎn)坐標(biāo),外參包括旋轉(zhuǎn)和平移向量。
  • 變換過(guò)程中,定義一個(gè)地面平面,通常假設(shè)為 $ {Z=0} $ 的平面,即 $ {W = (X, Y, 0, 1)^T} $ 。每個(gè)像素點(diǎn) $ {(x, y)} $ 從圖像坐標(biāo)系通過(guò)以下變換映射到地面平面坐標(biāo)系:

    其中 $ {s} $ 是縮放因子, $ {P} $ 是透視變換矩陣,$ {(X, Y, Z)} $ 是世界坐標(biāo)系中的點(diǎn)。
  • 輸出:投影到地面平面上的 $ {N} $ 個(gè)特征圖,尺寸為 $ {(N, C, H_{g}, W_{g})} $ ,其中 $ {H}{g} $ 和 $ {W} $ 是地面平面網(wǎng)格的高度和寬度。

平均池化(Average Pooling)

  • 對(duì)所有視圖的投影特征圖進(jìn)行平均池化,得到最終的鳥瞰圖特征表示 $ {F} $ ,尺寸為 $ {(C, H_{g}, W_{g})} $ 。
  • 特點(diǎn):在多視角檢測(cè)中,攝像頭的物理排列可能會(huì)變化,但模型應(yīng)該能夠獨(dú)立于特定的攝像頭排列來(lái)檢測(cè)行人。平均池化操作是排列不變的,這意味著無(wú)論攝像頭的輸入順序如何,模型的輸出都是一致的,從而提高了模型的泛化能力。

占用圖預(yù)測(cè)(Occupancy Map Prediction)

  • 使用三層空洞卷積層去預(yù)測(cè)行人占用概率圖,輸出尺寸為 $ {(H_{g}, W_{g})} $ 。(參考MVDet)

損失函數(shù)設(shè)計(jì)

  • 輸入:模型輸出的概率占用圖 $ {(p)} $ 和真實(shí)標(biāo)注的占用圖 $ {(g)} $ 。
  • 結(jié)合KL散度(KLDiv)和皮爾遜交叉相關(guān)系數(shù)(CC)作為損失函數(shù),公式如下:

    $ {σ(p,g)} $ 是 $ {p,g} $ 的協(xié)方差, $ {σ(p)} $ 是 $ {p} $ 的標(biāo)準(zhǔn)差, $ {σ(g)} $ 是 $ {g} $ 的標(biāo)準(zhǔn)差。

后記

  • 有意思的是該作者不僅僅使用了MultiViewX和WildTrack這兩個(gè)普遍的數(shù)據(jù)集,并且還用GTAV里面的拍照模式采樣了一些樣本。

到了這里,關(guān)于一種提升深度多視角行人檢測(cè)的泛化性能的方法 Bringing Generalization to Deep Multi-View Pedestrian Detection的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 深度學(xué)習(xí)實(shí)戰(zhàn)(四):行人跟蹤與摔倒檢測(cè)報(bào)警

    深度學(xué)習(xí)實(shí)戰(zhàn)(四):行人跟蹤與摔倒檢測(cè)報(bào)警

    轉(zhuǎn)載于集智書童 ??本項(xiàng)目的目的是為了給大家提供跟多的實(shí)戰(zhàn)思路,拋磚引玉為大家提供一個(gè)案例,也希望讀者可以根據(jù)該方法實(shí)現(xiàn)更多的思想與想法,也希望讀者可以改進(jìn)該項(xiàng)目種提到的方法,比如改進(jìn)其中的行人檢測(cè)器、跟蹤方法、行為識(shí)別算法等等。 (1)圖卷積網(wǎng)

    2024年01月22日
    瀏覽(19)
  • 基于opencv深度學(xué)習(xí),交通目標(biāo)檢測(cè),行人車輛檢測(cè),人流統(tǒng)計(jì),交通流量檢測(cè)

    基于opencv深度學(xué)習(xí),交通目標(biāo)檢測(cè),行人車輛檢測(cè),人流統(tǒng)計(jì),交通流量檢測(cè)

    文章目錄 0 前言+ 1. 目標(biāo)檢測(cè)概況+ 1.1 什么是目標(biāo)檢測(cè)?+ 1.2 發(fā)展階段 2. 行人檢測(cè)+ 2.1 行人檢測(cè)簡(jiǎn)介+ 2.2 行人檢測(cè)技術(shù)難點(diǎn)+ 2.3 行人檢測(cè)實(shí)現(xiàn)效果+ 2.4 關(guān)鍵代碼-訓(xùn)練過(guò)程 最后 設(shè)計(jì)項(xiàng)目案例演示地址: 鏈接 畢業(yè)設(shè)計(jì)代做一對(duì)一指導(dǎo)項(xiàng)目方向涵蓋: 1.1 什么是目標(biāo)檢測(cè)? 目標(biāo)檢

    2024年02月04日
    瀏覽(27)
  • 大數(shù)據(jù)畢設(shè)分享 深度學(xué)習(xí)行人口罩佩戴檢測(cè)

    大數(shù)據(jù)畢設(shè)分享 深度學(xué)習(xí)行人口罩佩戴檢測(cè)

    #### 簡(jiǎn)介 2020新冠爆發(fā)以來(lái),疫情牽動(dòng)著全國(guó)人民的心,一線醫(yī)護(hù)工作者在最前線抗擊疫情的同時(shí),我們也可以看到很多科技行業(yè)和人工智能領(lǐng)域的從業(yè)者,也在貢獻(xiàn)著他們的力量。近些天來(lái),曠視、商湯、??怠俣榷级嗉铱萍脊狙邪l(fā)出了帶有AI人臉檢測(cè)算法的紅外測(cè)溫、

    2024年03月10日
    瀏覽(60)
  • 深度學(xué)習(xí)之基于YoloV8的行人跌倒目標(biāo)檢測(cè)系統(tǒng)

    深度學(xué)習(xí)之基于YoloV8的行人跌倒目標(biāo)檢測(cè)系統(tǒng)

    歡迎大家點(diǎn)贊、收藏、關(guān)注、評(píng)論啦 ,由于篇幅有限,只展示了部分核心代碼。 ?? 世界老齡化趨勢(shì)日益嚴(yán)重,現(xiàn)代化的生活習(xí)慣又使得大多數(shù)老人獨(dú)居,統(tǒng)計(jì)數(shù)據(jù)表明,跌倒是老年人的主要致傷原因。利用先進(jìn)的計(jì)算機(jī)技術(shù)、傳感器技術(shù)和圖像信息處理技術(shù)實(shí)現(xiàn)人體跌倒

    2024年02月08日
    瀏覽(21)
  • 行人車輛檢測(cè)與計(jì)數(shù)系統(tǒng)(Python+YOLOv5深度學(xué)習(xí)模型+清新界面)

    行人車輛檢測(cè)與計(jì)數(shù)系統(tǒng)(Python+YOLOv5深度學(xué)習(xí)模型+清新界面)

    摘要:行人車輛檢測(cè)與計(jì)數(shù)系統(tǒng)用于交通路口行人及車輛檢測(cè)計(jì)數(shù),道路人流量、車流量智能監(jiān)測(cè),方便記錄、顯示、查看和保存檢測(cè)結(jié)果。本文詳細(xì)介紹行人車輛檢測(cè),在介紹算法原理的同時(shí),給出 P y t h o n 的實(shí)現(xiàn)代碼、 P y Q t 的UI界面以及訓(xùn)練數(shù)據(jù)集。在界面中可以選擇

    2024年02月01日
    瀏覽(31)
  • 基于深度學(xué)習(xí)的高精度Caltech行人檢測(cè)系統(tǒng)(PyTorch+Pyside6+YOLOv5模型)

    基于深度學(xué)習(xí)的高精度Caltech行人檢測(cè)系統(tǒng)(PyTorch+Pyside6+YOLOv5模型)

    摘要:基于深度學(xué)習(xí)的高精度Caltech數(shù)據(jù)集行人檢測(cè)識(shí)別系統(tǒng)可用于日常生活中或野外來(lái)檢測(cè)與定位行人目標(biāo),利用深度學(xué)習(xí)算法可實(shí)現(xiàn)圖片、視頻、攝像頭等方式的行人目標(biāo)檢測(cè)識(shí)別,另外支持結(jié)果可視化與圖片或視頻檢測(cè)結(jié)果的導(dǎo)出。本系統(tǒng)采用YOLOv5目標(biāo)檢測(cè)模型訓(xùn)練數(shù)據(jù)

    2024年02月15日
    瀏覽(20)
  • 基于深度學(xué)習(xí)的高精度紅外行人車輛檢測(cè)識(shí)別系統(tǒng)(PyTorch+Pyside6+YOLOv5模型)

    基于深度學(xué)習(xí)的高精度紅外行人車輛檢測(cè)識(shí)別系統(tǒng)(PyTorch+Pyside6+YOLOv5模型)

    摘要:基于深度學(xué)習(xí)的高精度紅外行人車輛檢測(cè)識(shí)別系統(tǒng)可用于日常生活中或野外來(lái)檢測(cè)與定位紅外行人車輛目標(biāo),利用深度學(xué)習(xí)算法可實(shí)現(xiàn)圖片、視頻、攝像頭等方式的紅外行人車輛目標(biāo)檢測(cè)識(shí)別,另外支持結(jié)果可視化與圖片或視頻檢測(cè)結(jié)果的導(dǎo)出。本系統(tǒng)采用YOLOv5目標(biāo)檢

    2024年02月08日
    瀏覽(29)
  • 一種提升SQL改寫效率的方法

    本文分享自天翼云開發(fā)者社區(qū)《一種提升SQL改寫效率的方法》,作者:唐****律 一、 背景 SQL改寫是數(shù)據(jù)庫(kù)產(chǎn)品中使用比較頻繁的一個(gè)技術(shù),在大多數(shù)產(chǎn)品中的調(diào)用頻率也非常高,通常對(duì)性能的需求需要接近對(duì)應(yīng)數(shù)據(jù)庫(kù)產(chǎn)品的上限。例如在天翼云關(guān)系型數(shù)據(jù)庫(kù)中的Mysql語(yǔ)法兼容組

    2024年02月08日
    瀏覽(83)
  • OpenCV、Dlib 和深度學(xué)習(xí)中的各種人臉檢測(cè)方法與性能比較--包含C++ 和 Python 代碼實(shí)現(xiàn)

    文末附基于Python和C++兩種方式實(shí)現(xiàn)的測(cè)試代碼下載鏈接 在本教程中,我們將討論 OpenCV、Dlib 和深度學(xué)習(xí)中的各種人臉檢測(cè)方法,并對(duì)這些方法進(jìn)行定量比較。我們將為以下面部檢測(cè)器共享 C++ 和 Python 代碼: OpenCV 中的 Haar 級(jí)聯(lián)人臉檢測(cè)器 OpenCV 中基于深度學(xué)習(xí)的人臉檢測(cè)器。

    2024年02月10日
    瀏覽(21)
  • 基于YOLOv8深度學(xué)習(xí)的無(wú)人機(jī)視角地面物體檢測(cè)系統(tǒng)【python源碼+Pyqt5界面+數(shù)據(jù)集+訓(xùn)練代碼】深度學(xué)習(xí)實(shí)戰(zhàn)、目標(biāo)檢測(cè)

    基于YOLOv8深度學(xué)習(xí)的無(wú)人機(jī)視角地面物體檢測(cè)系統(tǒng)【python源碼+Pyqt5界面+數(shù)據(jù)集+訓(xùn)練代碼】深度學(xué)習(xí)實(shí)戰(zhàn)、目標(biāo)檢測(cè)

    《博主簡(jiǎn)介》 小伙伴們好,我是阿旭。專注于人工智能、AIGC、python、計(jì)算機(jī)視覺相關(guān)分享研究。 ? 更多學(xué)習(xí)資源,可關(guān)注公-仲-hao:【阿旭算法與機(jī)器學(xué)習(xí)】,共同學(xué)習(xí)交流~ ?? 感謝小伙伴們點(diǎn)贊、關(guān)注! 《------往期經(jīng)典推薦------》 一、AI應(yīng)用軟件開發(fā)實(shí)戰(zhàn)專欄【鏈接】

    2024年03月21日
    瀏覽(77)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包