国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀

2年前作者：瑪卡巴卡_qin分類：Toy博客閱讀(23)違法舉報

這篇具有很好參考價值的文章主要介紹了OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

論文信息

題目：OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV
作者:Karmesh Yadav， Arjun Majumdar， Ram Ramrakhya
來源：arxiv
時間：2023
代碼地址： https://github.com/ykarmesh/OVRL

Abstract

我們提出了一個由與任務(wù)無關(guān)的組件（ViT、卷積和 LSTM）組成的單一神經(jīng)網(wǎng)絡(luò)架構(gòu)，該架構(gòu)在 IMAGENAV（“轉(zhuǎn)到 <這張圖片> 中的位置”）和 OBJECTNAV（“查找椅子”）任務(wù)沒有任何特定于任務(wù)的模塊，如對象檢測、分割、映射或規(guī)劃模塊。這種通用方法具有設(shè)計簡單、利用可用計算進行正擴展以及對多種任務(wù)具有通用性等優(yōu)點。

我們的工作建立在最近成功的預(yù)訓(xùn)練視覺變換器（ViT）自我監(jiān)督學(xué)習(xí)（SSL）的基礎(chǔ)上。然而，雖然卷積網(wǎng)絡(luò)的訓(xùn)練方法是成熟且穩(wěn)健的，但 ViT 的方法是偶然且脆弱的，并且就用于視覺導(dǎo)航的 ViT 而言，還有待充分發(fā)現(xiàn)。具體來說，我們發(fā)現(xiàn)普通 ViT 在視覺導(dǎo)航方面并不優(yōu)于 ResNet。我們建議使用在 ViT 補丁表示上運行的壓縮層來保留空間信息以及策略訓(xùn)練改進。這些改進使我們首次在視覺導(dǎo)航任務(wù)中展示正縮放定律。因此，我們的模型將 IMAGENAV 上的最先進性能從 54.2% 成功率提高到 82.0%，并且與 OBJECTNAV 上同時最先進的性能相比，成功率分別為 64.0% 和 65.0%。

總的來說，這項工作并沒有提出一種全新的方法，而是提出了訓(xùn)練通用架構(gòu)的建議，該架構(gòu)可實現(xiàn)當(dāng)今最先進的性能，并可以作為未來方法的強大基準(zhǔn)。
OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀

Introduction

在這項工作中，我們推進了一個替代研究計劃——訓(xùn)練由與任務(wù)無關(guān)的神經(jīng)組件構(gòu)建的通才智能體，而無需任何特定于任務(wù)的模塊。這種通用方法具有設(shè)計簡單、可用計算積極擴展（結(jié)合“慘痛教訓(xùn)”[35]）以及對多種任務(wù)的通用性等優(yōu)點。

最近一系列關(guān)于圖像和視頻理解的工作發(fā)現(xiàn)，由自監(jiān)督表示學(xué)習(xí)驅(qū)動的視覺變換器 [13] (ViT) 可以為識別 [3, 11, 18] 和生成 [4, 6] 提供通用視覺表示] 任務(wù)。然而，雖然卷積網(wǎng)絡(luò)的訓(xùn)練方法是成熟且穩(wěn)健的，但 ViT 的方法是偶然且脆弱的，并且就用于視覺導(dǎo)航的 ViT 而言，尚未得到充分發(fā)現(xiàn) - 而這種發(fā)現(xiàn)是我們工作的重點。

我們的主要技術(shù)貢獻(xiàn)和發(fā)現(xiàn)如下：

視覺導(dǎo)航中的 ViT 需要壓縮層。我們發(fā)現(xiàn)，與 RESNET 相比，從頭開始訓(xùn)練的基于 ViT 的智能體表現(xiàn)較差（例如，在 IMAGENAV 上僅實現(xiàn) 36.1% 的成功率 (SR)，而在 RESNET 上則為 59.9%）。盡管模型容量要高得多（ViT-SMALL 的參數(shù)比半寬 ResNet50 多約 4 倍）。我們發(fā)現(xiàn)使用 ViT 解決導(dǎo)航問題的一個關(guān)鍵問題是 [CLS] 令牌嵌入和全局平均池都刪除了對任務(wù)很重要的空間結(jié)構(gòu)。我們建議使用壓縮層（由 2D 卷積加扁平化組成）在 ViT patch 表示上運行來保留空間信息，并發(fā)現(xiàn)它導(dǎo)致 ViT 優(yōu)于 RESNET（IMAGENAV 上的 SR 為 67.4% vs. 59.9%）。
視覺預(yù)訓(xùn)練首次解鎖正標(biāo)度法則。我們首次在 IMAGENAV 上展示了基于 ViT 的代理的正標(biāo)度律。具體來說，我們發(fā)現(xiàn)視覺表示學(xué)習(xí)（使用掩碼自動編碼（MAE）[18]）不僅可以提高性能，還可以使用 ViT 進行模型縮放。通過這種預(yù)訓(xùn)練，我們能夠?qū)⒛Ｐ痛笮?ViT-SMALL 增加到 ViT-BASE，并觀察到成功率從 80.5% 增加到 82.0% (+1.5%)，SPL（按路徑效率加權(quán)的成功）從 55.2% 增加到58.7%（+3.5%）。
單一架構(gòu)在IMAGENAV和OBJECTNAV上實現(xiàn)SoTA。將所有這些（ViT、壓縮層、預(yù)訓(xùn)練、策略訓(xùn)練改進和擴展）放在一起，我們提出了 OVRL-V2（離線視覺表示學(xué)習(xí) v2），這是一個簡單的 ViT+壓縮層+LSTM 架構(gòu)，作為現(xiàn)有技術(shù)的后繼者。 - 最先進的方法，OVRL [43]。 OVRL-V2 將 IMAGENAV 上最先進的成功率從 54.2%（在[43]中）提高到 82.0%（+27.8% 絕對改進和 51.3% 相對改進），并且在 OB-JECTNAV 上實現(xiàn)了 64.0% 的成功率，與 stateof 相當(dāng)-最先進的（65.0％，通過并行但正交的工作獲得[31]）。 OVRL-V2代理僅使用RGB和GPS+Compass傳感器；沒有以自我為中心的深度（如[32]所使用），沒有語義分割（如[32]所使用），沒有對象檢測（如[46]所使用），沒有語義或幾何映射（如[8, 49, 29、37、9]）。

Background:Tasks and Visual Pretraining

我們研究兩種視覺導(dǎo)航任務(wù)：圖像目標(biāo)導(dǎo)航（IMAGENAV）[51]和對象目標(biāo)導(dǎo)航（OBJECTNAV）[5]。為了解決這些任務(wù)，我們設(shè)計了一個利用視覺轉(zhuǎn)換器（ViT）的實體代理[13]。

本節(jié)概述了每項任務(wù)，然后描述了我們用于預(yù)訓(xùn)練 ViT 的方法。

Visual Navigation

OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀

圖 2 說明了 IMAGENAV [51] 和 OBJECTNAV [5] 任務(wù)。在這兩種情況下，代理都從未知 3D 場景中的隨機位置和方向開始。代理必須探索環(huán)境才能找到目標(biāo)位置。在 IMAGENAV 中，目標(biāo)是從目標(biāo)位置拍攝的圖像（例如沙發(fā)的照片）。在 OBJECTNAV 中，代理被賦予了它必須找到的對象的名稱（例如“沙發(fā)”）。

在這些任務(wù)中，代理使用以自我為中心的 RGB 相機感知環(huán)境。代理使用離散的動作空間進行導(dǎo)航。在 IMAGENAV 中，標(biāo)準(zhǔn)動作集包括：向前移動 (0.25m)、向左轉(zhuǎn) (30°)、向右轉(zhuǎn) (30°) 和停止，以指示智能體認(rèn)為它已達(dá)到目標(biāo)。在 OBJECTNAV 中，代理還可以“向上查找”(30°) 和“向下查找”(30°)。

代理在以前未見過的環(huán)境中進行評估，這可以測量導(dǎo)航行為的泛化程度。使用兩個標(biāo)準(zhǔn)指標(biāo)來評估代理的導(dǎo)航性能：成功率（SR）和按（逆）路徑長度加權(quán)的成功率（SPL）[2]。 SPL 獎勵采取較短路徑到達(dá)目標(biāo)的智能體，從而衡量智能體探索新環(huán)境的效率。

Masked Autoencoders(MAEs)

視覺導(dǎo)航任務(wù)需要理解視覺提示才能在新環(huán)境中導(dǎo)航。因此，代理需要強大的視覺表示。我們使用屏蔽自動編碼（MAE）[18]——一種高效的自監(jiān)督視覺表示學(xué)習(xí)算法，專為預(yù)訓(xùn)練視覺變換器[13]（ViTs）而設(shè)計——來提高基于 ViT 的代理的性能。 MAE 的效率源自非對稱編碼器-解碼器設(shè)計。具體來說，輸入圖像首先被分成不重疊的補丁，其中很大一部分（75％）在預(yù)訓(xùn)練期間被隨機屏蔽。編碼器僅處理剩余的未屏蔽補丁，這減少了預(yù)訓(xùn)練期間的計算負(fù)擔(dān)。小型解碼器的任務(wù)是重建完整的輸入圖像。編碼器和解碼器都是 ViT，它們自然會處理可變數(shù)量的補丁。由于現(xiàn)實世界圖像中各塊之間的自然冗余，可以實現(xiàn)高掩蔽百分比，這使得僅從組成部分的一小部分子集即可預(yù)測完整圖像。預(yù)訓(xùn)練后，解碼器被丟棄，僅編碼器用于下游任務(wù)。

OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀

Approach

我們對視覺導(dǎo)航任務(wù)（IMAGENAV 和 OBJECTNAV）使用通用代理架構(gòu)。如圖 4 所示，兩個代理主要由視覺編碼器（隨機初始化或使用 MAE 預(yù)訓(xùn)練的 ViT）、目標(biāo)編碼器和循環(huán)策略網(wǎng)絡(luò)組成。本節(jié)描述了我們方法的幾個關(guān)鍵組成部分。
OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀

Compression layers for ViTs

ViT 的壓縮層。如圖 4 所示，我們的視覺導(dǎo)航代理使用基于 ViT 的視覺編碼器 fθobs 處理 RGB 觀察值 Ot。具體來說，輸入圖像在數(shù)據(jù)增強后被轉(zhuǎn)換為不重疊的 16×16 塊，與 [CLS] 令牌連接，然后用 ViT 進行處理，輸出每個塊和 [CLS] 令牌的表示。在圖像分類等任務(wù)中，通常使用（a）[CLS]令牌輸出或（b）補丁表示的平均池化（即全局平均池化）來表示圖像。

Visual Navigation with ViTs

使用 ViT 進行視覺導(dǎo)航如圖 4 所示，視覺編碼器遙控鑰匙的輸出與目標(biāo)表示和嵌入提供姿勢信息的 GPS+羅盤傳感器（僅用于 OBJECTNAV）相連接。連接的輸出由基于 LSTM 的循環(huán)策略網(wǎng)絡(luò)進行處理，該網(wǎng)絡(luò)可預(yù)測操作。

每個任務(wù)的代理之間的區(qū)別在于用于編碼目標(biāo)的方法。在 IMAGENAV 中，圖像目標(biāo) Og 使用視覺編碼器 fθgoal 進行編碼，其架構(gòu)與 fθobs 相同。對于 OBJECTNAV，目標(biāo)對象類別（例如“沙發(fā)”）通過學(xué)習(xí)的嵌入層進行編碼。

我們使用 DD-PPO [39] 以及未來小節(jié)中描述的獎勵函數(shù)通過強化學(xué)習(xí)（RL）來訓(xùn)練我們的 IMAGENAV 代理。對于 OBJECTNAV，我們使用人類演示和分布式行為克隆版本來訓(xùn)練我們的代理 [32]。

Visual Encoder Pretraining

視覺編碼器預(yù)訓(xùn)練。我們提出的在無模型導(dǎo)航代理中使用基于 ViT 的視覺編碼器的方法（圖 4）可以從頭開始進行端到端訓(xùn)練（例如，使用下一節(jié)中描述的 RL 獎勵）。

此外，我們研究了使用第 2 節(jié)中描述的掩碼自動編碼（MAE）算法對基于 ViT 的視覺編碼器進行預(yù)訓(xùn)練。 3.2.對于預(yù)訓(xùn)練，我們從 HM3D [30] 和 Gibson [40] 場景收集域內(nèi)圖像數(shù)據(jù)集。這遵循了先前工作中的觀察結(jié)果（例如，[43]），該觀察表明對域內(nèi)數(shù)據(jù)（而不是像 ImageNet 這樣的數(shù)據(jù)集）進行預(yù)訓(xùn)練可以提高下游性能。

ImageNav rewards

IMAGENAV 獎勵。用于視覺導(dǎo)航的獎勵通常由三個部分組成：（a）成功完成任務(wù)的稀疏獎勵 $c_s$ ，（b）用于激勵效率的每時間步懲罰 γ，以及（c）一個或多個獎勵塑造項來簡化優(yōu)化問題。一個常見的獎勵塑造術(shù)語是到目標(biāo)的（測地線）距離的變化。形式上，令 dt 表示智能體在時間 t 時到目標(biāo)的測地距離；現(xiàn)在，獎勵塑造項可以寫為： $d_{t?1} ? d_t$ 。將所有三個獎勵項放在一起，該獎勵定義為：
OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀
等式中獎勵函數(shù)的一個限制。 (1) 是它對終止時智能體的“航向”無關(guān)緊要——智能體既不會因為注視目標(biāo)物體而受到獎勵（這是一種理想的行為，因為導(dǎo)航通常是操縱的前兆），也不會因注視目標(biāo)物體而受到懲罰。結(jié)束這一集，將目光從物體上移開。為了解決這個問題，[1]提出了兩個額外的角度獎勵項來激勵，1）轉(zhuǎn)向目標(biāo)（使用角度到目標(biāo)（ $θ_t$ ）獎勵塑造項）和2）在看著目標(biāo)時停下來（使用最終獎勵）。這兩種獎勵僅在智能體進入目標(biāo)半徑 rg 后才會授予。雖然 [1] 證明了他們的獎勵可以提高 IMAGENAV 性能，但我們發(fā)現(xiàn)我們的 OVRL-V2 代理能夠通過永不結(jié)束情節(jié)、進入目標(biāo)半徑、轉(zhuǎn)向目標(biāo)、向外移動來破解獎勵函數(shù)目標(biāo)半徑，返回并重復(fù)。我們提供了有關(guān)此獎勵的更多詳細(xì)信息，并在附錄 F 中可視化了代理的行為。我們假設(shè)之前的工作沒有注意到這種可利用性，因為只有當(dāng)實驗規(guī)模適當(dāng)時它才會變得明顯。

我們在[1]中提出了對獎勵函數(shù)的原則性修復(fù)。

我們的主要見解是，我們可以將角度到目標(biāo)的獎勵塑造項轉(zhuǎn)化為潛在函數(shù)的差異，這被證明對于獎勵塑造是最佳的[26]。具體來說，我們定義一個目標(biāo)角度函數(shù) $\hat{θ}_t$ ，它等于目標(biāo)半徑之外的 π，否則等于目標(biāo)角度：
OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀

Experimental findings

在本節(jié)中，我們首先建立與現(xiàn)有 SoTA 方法競爭的 IMAGENAV 基線。然后，我們使用這個強大的基線來系統(tǒng)地解決以下研究問題：

ViT 是否可以在 IMAGENAV 中開箱即用？不。我們發(fā)現(xiàn)，盡管模型容量更高，但從頭開始訓(xùn)練的基于 ViT 的智能體的表現(xiàn)比較小的 ResNet 智能體要差很多。
添加壓縮層對性能有何影響？我們發(fā)現(xiàn)使用壓縮層來維護圖像表示中的空間結(jié)構(gòu)可以顯著提高 IMAGENAV 上的導(dǎo)航性能。
性能是否會隨著 ViT 的增加而擴展？當(dāng)從頭開始訓(xùn)練時，我們觀察到不同的結(jié)果。然而，自我監(jiān)督的視覺預(yù)訓(xùn)練會帶來一致的全面改進以及縮放強大的視覺導(dǎo)航代理能否“破解”等式 3 中的新獎勵函數(shù)？不可以?？梢浴捌平狻盳ER 獎勵 [1] 的智能體不再能夠通過我們提出的修正來“破解”獎勵函數(shù)。
OVRL-V2 性能與 IMAGENAV SoTA 相比如何？ OVRL-V2 比之前的工作有了顯著改進，包括使用額外攝像機提供環(huán)境全景的方法。
架構(gòu)改進是否會轉(zhuǎn)移到 OBJECTNAV 上？是的。 OVRL-V2 在 SR 方面優(yōu)于 OBJECTNAV SoTA，甚至無需使用 OBJECTNAV 常用的深度傳感器或分割模塊

Comparisions with the ImageNav SoTA

OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀,Navigation,論文,論文閱讀

Conclusion

在本文中，我們證明了由任務(wù)無關(guān)組件（ViT、卷積和 LSTM）組成的無模型導(dǎo)航代理 (OVRL-V2) 可以在 IMAGENAV 和 OBJECTNAV 上實現(xiàn)最先進的結(jié)果。為了實現(xiàn)這一目標(biāo)，我們證明需要一個在 ViT 補丁表示上運行的壓縮層，它可以保留空間信息。最后，我們發(fā)現(xiàn)使用 MAE 進行視覺預(yù)訓(xùn)練可以通過更大的 ViT 架構(gòu)實現(xiàn)積極的擴展趨勢。文章來源地址http://www.zghlxwxcb.cn/news/detail-677274.html

到了這里，關(guān)于OVRL-V2: A simple state-of-art baseline for IMAGENAV and OBJECTNAV 論文閱讀的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

State of GPT (ChatGPT 原理及現(xiàn)狀介紹)
演講信息：演講人：Andrej Karpathy (現(xiàn)在OpenAI任職)，之前是特斯拉視覺研發(fā)負(fù)責(zé)人，斯坦福深度學(xué)習(xí)入門課程 CS231N 講師演講主題：受到微軟 BUILD2023 邀請，介紹 GPT 的原理及研發(fā)現(xiàn)狀，介紹大語言模型應(yīng)用生態(tài) 第一部分介紹如何訓(xùn)練 ChatGPT （本演講中有個更通用的名字： GP
2024年02月07日
瀏覽(34)
深度解讀 ChatGPT、技術(shù)原理（AIGC | State Of ChatGPT）
?圖來自：State of GPT | BRK216HFS?:??https://www.youtube.com/watch?v=bZQun8Y4L2A State of GPT ｜ BRK216HFS [bZQun8Y4L2A] ? 目錄類ChatGPT產(chǎn)品的研發(fā)過程
2024年02月09日
瀏覽(38)
Qt中實現(xiàn)界面回放的藝術(shù)：從理論到代碼“ (“The Art of Implementing UI Playback in Qt: From Theory to Code
在這個快速發(fā)展的數(shù)字化時代，界面回放技術(shù)（UI Playback Technology）在軟件開發(fā)中扮演了至關(guān)重要的角色。這項技術(shù)不僅提高了軟件測試的效率，還為用戶交互設(shè)計提供了深刻的洞察。通過回放用戶與界面的交互過程，開發(fā)者能夠更好地理解用戶行為，優(yōu)化用戶體驗。正如計算
2024年01月20日
瀏覽(19)
Kafka - TimeoutException: Expiring 1 record(s) for art-0:120001 ms has passed since batch creation
報錯如下：這種情況，肯定要先看網(wǎng)絡(luò)問題嘛首先查看本機防火墻的配置結(jié)果都是關(guān)閉的（建議開放特定端口）不關(guān)閉防火墻，但是建議本機防火墻開放特定端口，可以使用如下命令（使用root賬戶）比如接著看看kafka中間件的配置，問題就在這里我并沒有大改配置，具
2024年02月04日
瀏覽(16)
論文閱讀筆記A Systematic Review of the State of Cyber-Security in Water Systems
該論文主要回顧了水系統(tǒng)的網(wǎng)絡(luò)安全研究，研究重點是提高供水、廢水收集和處理系統(tǒng)的安全性一、 Introduction 過去的供水系統(tǒng)安全：通過隔離、限制對控制組件的訪問來實現(xiàn)的。基于IoT的供水系統(tǒng)：依靠連接多層網(wǎng)絡(luò)物理系統(tǒng)來促進自主去中心化決策，并改善實時數(shù)據(jù)和預(yù)
2024年02月04日
瀏覽(23)
論文筆記：A Simple and Effective Pruning Approach for Large Language Models
iclr 2024 reviewer 評分 5668 大模型網(wǎng)絡(luò)剪枝的paper 在努力保持性能的同時，舍棄網(wǎng)絡(luò)權(quán)重的一個子集現(xiàn)有方法要么需要重新訓(xùn)練這對于十億級別的LLMs來說往往不現(xiàn)實要么需要解決依賴于二階信息的權(quán)重重建問題這同樣可能帶來高昂的計算成本 ——引入了一種新穎、簡單且有
2024年04月17日
瀏覽(27)
A Simple Framework for 3D Lensless Imaging with Programmablle Masks 論文代碼部分
1.1 data數(shù)據(jù) net 在這里插入圖片描述 2.1 代碼整體介紹這段代碼的作用是加載PSFs數(shù)據(jù)，并進行一系列參數(shù)設(shè)置。首先，通過設(shè)置 data_dir 變量為數(shù)據(jù)目錄的路徑。然后，根據(jù)場景名來選擇特定于場景的參數(shù)。根據(jù)不同的場景名，設(shè)置 d1 和 d2 的值。 net 場景包括一個距離相機約
2024年04月10日
瀏覽(24)
【論文筆記】A Simple Framework for 3D Occupancy Estimation in Autonomous Driving (SimpleOccupancy)
原文鏈接：https://arxiv.org/abs/2303.10076 本文提出基于環(huán)視圖像進行3D占用估計的簡單框架，探索了網(wǎng)絡(luò)設(shè)計、優(yōu)化和評估。網(wǎng)絡(luò)設(shè)計方面，雖然輸出形式與單目深度估計和立體匹配不同，但網(wǎng)絡(luò)結(jié)構(gòu)與立體匹配網(wǎng)絡(luò)相似（如下圖所示），可以使用立體匹配的經(jīng)驗設(shè)計網(wǎng)絡(luò)。優(yōu)化
2024年02月02日
瀏覽(20)
《SimpleNet: A Simple Network for Image Anomaly Detection and Localization》論文閱讀理解
將預(yù)訓(xùn)練特征轉(zhuǎn)換為面向目標(biāo)的特征有助于避免圖像局部偏見的出現(xiàn)；在特征空間中生成合成異常更有效，因為缺陷在圖像空間中可能沒有太多共性存在；一個簡單的鑒別器是非常有效和實用的；提出了一種簡單且容易應(yīng)用的網(wǎng)絡(luò)（SimpleNet），用于檢測和定位異常；在MV
2024年02月08日
瀏覽(54)
【圖像異常檢測】SimpleNet: A Simple Network for Image Anomaly Detection and Localization 論文閱讀
中文標(biāo)題：SimpleNet：一個簡單的圖像異常檢測和定位網(wǎng)絡(luò) 文章信息：發(fā)表于：CVPR 2023 原文鏈接：https://arxiv.org/abs/2303.15140 源代碼：https://github.com/DonaldRR/SimpleNet 我們提出了一種簡單且易于應(yīng)用的網(wǎng)絡(luò)（稱為SimpleNet）來檢測和定位異常。SimpleNet由四個組件組成：（1）預(yù)訓(xùn)練的
2024年04月17日
瀏覽(32)

<rp id="j11hv"></rp>