国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<track id="ostx9"></track>

<address id="ostx9"><form id="ostx9"></form></address>

<track id="ostx9"></track>

【計算機視覺】對比學(xué)習(xí)綜述（自己的一些理解）

2年前作者：sdbhewfoqi分類：Toy博客閱讀(19)違法舉報

這篇具有很好參考價值的文章主要介紹了【計算機視覺】對比學(xué)習(xí)綜述（自己的一些理解）。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

對比loss

對比學(xué)習(xí)的 loss（InfoNCE）即以最大化互信息為目標(biāo)推導(dǎo)而來。其核心是通過計算樣本表示間的距離，拉近正樣本，拉遠(yuǎn)負(fù)樣本，因而訓(xùn)練得到的模型能夠區(qū)分正負(fù)例。

具體做法為：對一個 batch 輸入的圖片，隨機用不同的數(shù)據(jù)增強方法生成兩個 view，對他們用相同的網(wǎng)絡(luò) 結(jié)構(gòu)進(jìn)行特征提取，得到 y 和 y’，來自同一張圖像的兩個不同的表示構(gòu)成一對正樣本對，來自不同圖像任意表示對為一對負(fù)樣本對。隨后對上下兩批表示兩兩計算 cosine similarity，得到 N*N 的矩陣，每一行的對角線位置代表 y 和 y’的相似度，其余代表 y 和 N-1 個負(fù)樣本對的相似度。計算公式如下（T 為超參）：

【計算機視覺】對比學(xué)習(xí)綜述（自己的一些理解）,計算機視覺,學(xué)習(xí),人工智能

?

MOCO（memory bank）

MOCO 的一個核心觀點是，樣本數(shù)量對于對比學(xué)習(xí)很重要。從 InfoNCE loss 我們可以看出，增加負(fù)例的數(shù)量可以防止過擬合，與此同時，負(fù)例越多，這個任務(wù)的難度就越大，因而通過增加負(fù)例的方式可作為一個優(yōu)化方向。但是純粹的增加 batch size 會使得 GPU 超負(fù)荷。一個可行的方法就是增加 memory bank，把之前編碼好的樣本存儲起來，計算 loss 的時候隨機采樣負(fù)例。但是這樣會存在一個問題，就是存儲好的編碼都是之前編碼計算的，而 Xq 經(jīng)過誤差回傳后一直在更新，樣本缺乏一致性，影響目標(biāo)優(yōu)化。因而在此基礎(chǔ)上 Moco 提出了一種動量對比 (Mometum contrast) 的方法提高每個 mini-batch 的負(fù)樣本數(shù)量。

MOCO的改進(jìn)方法：動量更新，主要是為了解決引入隊列維護(hù)字典之后，字典的編碼器無法通過梯度反傳獲得參數(shù)更新的問題。

Moco就提出Momentum Contrast的方法解決Memory Bank的缺點，該方法使用一個隊列來存儲和采樣 negative 樣本，隊列中存儲多個近期用于訓(xùn)練的 batch 的特征向量。隊列容量要遠(yuǎn)小于 Memory Bank，但可以遠(yuǎn)大于 batch 的容量，如下圖所示。這里momentum encoder可以和encoder完全一致參與梯度下降，也可以是對query encoder的平滑拷貝。

【計算機視覺】對比學(xué)習(xí)綜述（自己的一些理解）,計算機視覺,學(xué)習(xí),人工智能

我的疑問：這樣還有類似于memory bank的負(fù)采樣嗎？如果沒有，那么bacthsize豈不是還是不能增大？這只是解決了encoder同步更新的問題。-----》以上下劃線

SimCLR

在 encoder 之后增加了一個非線性映射。研究發(fā)現(xiàn) encoder 編碼后的 h 會保留和數(shù)據(jù)增強變換相關(guān)的信息，而非線性層的作用就是去掉這些信息，讓表示回歸數(shù)據(jù)的本質(zhì)。

自監(jiān)督學(xué)習(xí)速覽 - 搬磚啦姜姜的文章 - 知乎

經(jīng)典論文學(xué)習(xí)筆記——13篇對比學(xué)習(xí)（Contrastive Learning）文章來源地址http://www.zghlxwxcb.cn/news/detail-521114.html

到了這里，關(guān)于【計算機視覺】對比學(xué)習(xí)綜述（自己的一些理解）的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

【論文綜述】一篇關(guān)于GAN在計算機視覺鄰域的綜述
這是一篇關(guān)于GAN在計算機視覺領(lǐng)域的綜述。生成對抗網(wǎng)絡(luò)是一種基于博弈論的生成模型，其中神經(jīng)網(wǎng)絡(luò)用于模擬數(shù)據(jù)分布。應(yīng)用領(lǐng)域：語言生成、圖像生成、圖像到圖像翻譯、圖像生成文本描述、視頻生成。 GAN模型能夠復(fù)制數(shù)據(jù)分布并生成合成數(shù)據(jù)，應(yīng)用一定的標(biāo)準(zhǔn)偏差來
2024年01月17日
瀏覽(17)
【計算機視覺】最新綜述：南洋理工和上海AI Lab提出基于Transformer的視覺分割綜述
SAM （Segment Anything ）作為一個視覺的分割基礎(chǔ)模型，在短短的3個月時間吸引了很多研究者的關(guān)注和跟進(jìn)。如果你想系統(tǒng)地了解SAM背后的技術(shù)，并跟上內(nèi)卷的步伐，并能做出屬于自己的SAM模型，那么接下這篇Transformer-Based的Segmentation Survey是不容錯過！近期，南洋理工大學(xué)和上
2024年02月12日
瀏覽(21)
基于計算機視覺的工業(yè)金屬表面缺陷檢測綜述
基于計算機視覺的工業(yè)金屬表面缺陷檢測綜述 (aas.net.cn) 計算機視覺檢測技術(shù)(Automated optical inspection, AOI)[2]是一種以計算機視覺為基礎(chǔ), 通過自動光學(xué)系統(tǒng)獲取檢測目標(biāo)圖像, 運用算法進(jìn)行分析決策, 判斷目標(biāo)是否符合檢測規(guī)范的非接觸式檢測方法. 表面缺陷檢測系統(tǒng)的基本原理
2024年04月15日
瀏覽(26)
深度學(xué)習(xí)進(jìn)階篇[9]：對抗生成網(wǎng)絡(luò)GANs綜述、代表變體模型、訓(xùn)練策略、GAN在計算機視覺應(yīng)用和常見數(shù)據(jù)集介紹，以及前沿問題解決
【深度學(xué)習(xí)入門到進(jìn)階】必看系列，含激活函數(shù)、優(yōu)化策略、損失函數(shù)、模型調(diào)優(yōu)、歸一化算法、卷積模型、序列模型、預(yù)訓(xùn)練模型、對抗神經(jīng)網(wǎng)絡(luò)等專欄詳細(xì)介紹：【深度學(xué)習(xí)入門到進(jìn)階】必看系列，含激活函數(shù)、優(yōu)化策略、損失函數(shù)、模型調(diào)優(yōu)、歸一化算法、卷積模型、
2024年02月08日
瀏覽(29)
深度學(xué)習(xí)應(yīng)用篇-計算機視覺-語義分割綜述[5]：FCN、SegNet、Deeplab等分割算法、常用二維三維半立體數(shù)據(jù)集匯總、前景展望等
【深度學(xué)習(xí)入門到進(jìn)階】必看系列，含激活函數(shù)、優(yōu)化策略、損失函數(shù)、模型調(diào)優(yōu)、歸一化算法、卷積模型、序列模型、預(yù)訓(xùn)練模型、對抗神經(jīng)網(wǎng)絡(luò)等專欄詳細(xì)介紹：【深度學(xué)習(xí)入門到進(jìn)階】必看系列，含激活函數(shù)、優(yōu)化策略、損失函數(shù)、模型調(diào)優(yōu)、歸一化算法、卷積模型、
2024年02月16日
瀏覽(22)
深度學(xué)習(xí)應(yīng)用篇-計算機視覺-OCR光學(xué)字符識別[7]：OCR綜述、常用CRNN識別方法、DBNet、CTPN檢測方法等、評估指標(biāo)、應(yīng)用場景
【深度學(xué)習(xí)入門到進(jìn)階】必看系列，含激活函數(shù)、優(yōu)化策略、損失函數(shù)、模型調(diào)優(yōu)、歸一化算法、卷積模型、序列模型、預(yù)訓(xùn)練模型、對抗神經(jīng)網(wǎng)絡(luò)等專欄詳細(xì)介紹：【深度學(xué)習(xí)入門到進(jìn)階】必看系列，含激活函數(shù)、優(yōu)化策略、損失函數(shù)、模型調(diào)優(yōu)、歸一化算法、卷積模型、
2024年02月09日
瀏覽(29)
2021綜述：計算機視覺中的注意力機制(續(xù)三）：時間注意力
時間注意力可以看作是一種動態(tài)的時間選擇機制，決定何時注意，因此通常用于視頻處理。以前的工作[171]，[172]經(jīng)常強調(diào)如何捕獲短期和長期跨幀特征依賴。在這里，我們首先總結(jié)了有代表性的時間注意力機制，并指定了表5中描述為等式1的過程 g ( x ) g(x) g ( x ) 和 f ( g ( x
2024年02月08日
瀏覽(15)
【計算機視覺】關(guān)于圖像處理的一些基本操作
圖像平滑是指受傳感器和大氣等因素的影響，遙感圖像上會出現(xiàn)某些亮度變化過大的區(qū)域，或出現(xiàn)一些亮點(也稱噪聲)。這種為了抑制噪聲，使圖像亮度趨于平緩的處理方法就是圖像平滑。圖像平滑實際上是低通濾波，平滑過程會導(dǎo)致圖像邊緣模糊化。均值濾波線性濾波，針
2024年02月14日
瀏覽(46)
【計算機視覺】CLIP：連接文本和圖像（關(guān)于CLIP的一些補充說明）
我們推出了一個名為CLIP的神經(jīng)網(wǎng)絡(luò)，它可以有效地從自然語言監(jiān)督中學(xué)習(xí)視覺概念。CLIP可以應(yīng)用于任何視覺分類基準(zhǔn)，只需提供要識別的視覺類別名稱，類似于GPT-2和GPT-3的“零樣本”功能。盡管深度學(xué)習(xí)徹底改變了計算機視覺，但當(dāng)前的方法存在幾個主要問題：典型的視
2024年02月09日
瀏覽(25)
【計算機視覺 | 目標(biāo)檢測】術(shù)語理解9：AIGC的理解，對比學(xué)習(xí)，解碼器，Mask解碼器，耦合蒸餾，半耦合，圖像編碼器和組合解碼器的耦合優(yōu)化
AIGC指的是使用人工智能技術(shù)自動生成的各類數(shù)字內(nèi)容,包括文本、圖像、音頻、視頻等。它利用機器學(xué)習(xí)模型進(jìn)行智能化內(nèi)容生成。主要的技術(shù)手段包括：自然語言生成(NLG):使用RNN、GPT等語言模型生成文本。生成對抗網(wǎng)絡(luò)(GAN):使用GAN生成高質(zhì)量圖片。自動語音合成(TTS):使用
2024年02月04日
瀏覽(21)

<address id="qhvoj"><small id="qhvoj"></small></address>

<track id="qhvoj"><font id="qhvoj"><dfn id="qhvoj"></dfn></font></track>

<address id="qhvoj"></address>