国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

論文筆記--Prompt Consistency for Zero-Shot Task Generalization

2年前作者：Isawany分類：Toy博客閱讀(25)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了論文筆記--Prompt Consistency for Zero-Shot Task Generalization。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1. 文章簡介

標(biāo)題：Prompt Consistency for Zero-Shot Task Generalization
作者：Chunting Zhou, Junxian He, Xuezhe Ma, Taylor Berg-Kirkpatrick, Graham Neubig
日期：2022
期刊：Arxiv preprint

2. 文章概括

??文章基于prompt的一致性學(xué)習(xí)給出了一種zero-shot task generalization（零樣本泛化學(xué)習(xí)）的無監(jiān)督方法。數(shù)值實(shí)驗(yàn)表明，文章提出的指令一致性學(xué)習(xí)方法只需在幾個(gè)prompt、幾十個(gè)樣本上進(jìn)行訓(xùn)練，就可以在NLI等NLP任務(wù)上追平SOTA水平。
??文章整體架構(gòu)如下
論文筆記--Prompt Consistency for Zero-Shot Task Generalization

3 文章重點(diǎn)技術(shù)

3.1 Prompt-based zero-shot task generalization

??首先簡單介紹下zero-shot task generalization（零樣本泛化學(xué)習(xí)）：給定輸入 $x\in \mathcal{X}$ ，零樣本泛化學(xué)習(xí)旨在學(xué)習(xí)一個(gè)預(yù)訓(xùn)練模型PLM預(yù)測出 $y\in \mathcal{Y}$ ，其中PLM未在數(shù)據(jù)集 $\mathcal{X}$ 上訓(xùn)練過。零樣本泛化學(xué)習(xí)要求模型可以泛化出一個(gè)新的表達(dá)式 $\mathcal{X} \to \mathcal{Y}$ ，而非僅僅在數(shù)據(jù)集上具有泛化能力。
??給定prompt $r$ , $r$ 包含一個(gè)輸入模板 $r_x$ 、輸出模板 $r_y$ 以及待放入模板的元數(shù)據(jù) $x, y$ ，我們可以得到prompt-based輸入： $r_x(x), r_y(y)$ ?；趐rompt的學(xué)習(xí)方法一般用 $p_{\theta} (r_y(y)|r_x(x))$ 來計(jì)算輸出的概率 $q (y ∣ x, r))$ ，其中 $\theta$ 表示模型的參數(shù)。本文重點(diǎn)關(guān)注NLP的分類任務(wù)，則可以通過如下公式計(jì)算輸出的概率： $\frac{p_{\theta} (r_y(y)|r_x(x))}{\sum_{y'\in\mathcal{Y}} p_{\theta} (r_y(y')|r_x(x))}\tag{1}$ 。

3.2 Prompt Consistency Training

?? 文章的方法需要無標 { x 1 , … , x N } \{x_1, \dots, x_N\} 和個(gè)不同的prompt $\dots, (r_x^K, r_y^K)\} class="katex-html">{(rx1?,ry1?),…,(rxK?,ryK?)}$ 。其中無標(biāo)注的數(shù)據(jù)集可以來自任意NLP（分類）任務(wù)的訓(xùn)練數(shù)據(jù)集或測試數(shù)據(jù)集，也可以來自我們要測試的任務(wù)的數(shù)據(jù)集。prompt可直接采用Public Pool of Prompts(p3)數(shù)據(jù)集里的prompt。
?? 傳統(tǒng)的一致性訓(xùn)練會擾亂樣本，使得擾亂后的樣本和之前的樣本得到的輸出盡可能一致。本文希望學(xué)習(xí)prompt級別的一致性，即不同prompt在單個(gè)樣本上的學(xué)習(xí)結(jié)構(gòu)盡可能一致。這樣做可以1) 概念非常簡單 2）緩解PLM“輸入不同prompt結(jié)果不一致”的問題。
??損失函數(shù)定義如下 $-\mathbb{E}_{x\in p_d(x)} \mathbb{E}_{r^i, er^j\in p(r)} \mathbb{E}_{\hat{y} \in \hat{q}(y|x,r^i)} \log p_{\theta} (r_y^j(\hat{y})|r_x^j(x)) class="katex-html">L=?Ex∈pd?(x)?Eri,erj∈p(r)?Ey^?∈q^?(y∣x,ri)?logpθ?(ryj?(y^?)∣rxj?(x))$
, 是數(shù)據(jù)集的分布，表示個(gè)prompt的隨機(jī)prompt對的均勻分布， $class="katex-html">q^?$ 定義為式(1)的條件分布。這里簡單解釋下，如圖所示，給定prompt ，我們首先預(yù)測 $class="katex-html">y^?∈q^?(y∣x,ri)$ ，即當(dāng)promt為時(shí)得到輸出 $class="katex-html">y^?$ 。當(dāng)prompt為時(shí)，我們希望最大化輸出結(jié)果為 $class="katex-html">y^?$ （即和輸出相同）的概率 $t{y})|r_x^j(x)) class="katex-html">pθ?(ryj?(y^?)∣rxj?(x))$ ，取負(fù)對數(shù)和期望之后，即得到上述損失函數(shù)。我們稱上述訓(xùn)練方法為swarm distillation。

3.3 如何防止遺忘和退化？

??如果直接采用上述方法進(jìn)行訓(xùn)練，則我們很容易collapse，得到一個(gè)平凡解：所有prompt、所有樣本均輸出同一個(gè)結(jié)果可以實(shí)現(xiàn)損失函數(shù)最小。另一方面，訓(xùn)練后的模型可以能忘記之前的知識，即castrophic forgetting。為了避免collapse和catastrophic forgetting，文章提出下述兩種方法：

LoRA：文章是在T0模型上層進(jìn)行訓(xùn)練的，為了不發(fā)生災(zāi)難性遺忘，文章采用了LoRA方法，即通過兩個(gè)低階矩陣的乘積進(jìn)行迭代學(xué)習(xí)，具體如下圖所示。在實(shí)際訓(xùn)練時(shí)我們將LoRA應(yīng)用到Transformer每一個(gè)前饋層。
Fleiss’ Kappa：由于我們沒有標(biāo)注數(shù)據(jù)作為validation set，從而很難選擇一個(gè)最佳的checkpoint作為最終模型。為此文章采用了Fleiss’ Kappa指標(biāo)來度量模型的效果。首先，我們定義一致性概率。對給定的樣本 $x_i$ ，記所有 $K$ 個(gè)prompt中預(yù)測輸出為第 $j$ 個(gè)label的prompt數(shù)量為 $n_{ij}$ ，則對該樣本，任意兩個(gè)prompt給出相同的預(yù)測結(jié)果的概率為 $p_i = \sum_j \binom {n_{ij}}2 /\binom K2 = \sum_{j} n_{ij}(n_{ij} - 1) / K(K-1)$ ，所有樣本的絕對一致性為 $\overline{P} = \sum_i p_i$ 。另一方面，第 $j$ 個(gè)label的占比為 $q_j = \sum_i n_{ij}/NK$ ，則 $\overline{P}_e = \sum_j q_j^2$ 表示任意兩個(gè)prompts按照標(biāo)簽的分布隨機(jī)預(yù)測結(jié)果一致的概率。當(dāng)所有 $q_j$ 均相等時(shí)， $\overline{P}_e$ 最小，即預(yù)測的標(biāo)簽隨機(jī)分布。最終得到Fleiss’ kappa度量為 $\kappa = \frac {\overline{P} - \overline{P}_e}{1 - \overline{P}_e} \in (-1, 1)$ ，其中 $\overline{P}_e$ 越大， $\kappa$ 越小，即預(yù)測的結(jié)果如果被一個(gè)類別主導(dǎo)，則 $\kappa$ 會被懲罰。

4. 文章亮點(diǎn)

??文章提出了一種基于prompt一致性的zero-shot task generation學(xué)習(xí)方法swarm distillation，且采用了LoRA和Fleiss’ Kappa方法避免學(xué)習(xí)災(zāi)難性遺忘或?qū)W習(xí)結(jié)果collapse。文章在多個(gè)NLP下游任務(wù)上進(jìn)行了驗(yàn)證，發(fā)現(xiàn)swarm distillation在多個(gè)任務(wù)上表現(xiàn)超過SOTA。此外，數(shù)值實(shí)驗(yàn)表明，swarm distillation只需要4個(gè)prompt，10+個(gè)樣本就可以對源模型(T0)進(jìn)行提升。
??但實(shí)驗(yàn)也表明，swarm distillation方法在增加到一定樣本量之后性能就達(dá)到了飽和，當(dāng)我們有很多標(biāo)記樣本可用的時(shí)候，性能可能不及監(jiān)督微調(diào)。未來可以將swarm distillation與few-shot少樣本學(xué)習(xí)或預(yù)訓(xùn)練相結(jié)合來實(shí)現(xiàn)在標(biāo)記樣本上的性能提升。

5. 原文傳送門

Prompt Consistency for Zero-Shot Task Generalization文章來源地址http://www.zghlxwxcb.cn/news/detail-498102.html

到了這里，關(guān)于論文筆記--Prompt Consistency for Zero-Shot Task Generalization的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【論文筆記】SAM3D: Zero-Shot 3D Object Detection via Segment Anything Model
原文鏈接：https://arxiv.org/pdf/2306.02245.pdf ??分割一切模型（SAM）作為視覺領(lǐng)域的基石模型，有強(qiáng)大的泛化性，能解決很多2D視覺問題。但是SAM是否可以適用于3D視覺任務(wù)，仍需要被探索。 ??目前幾乎沒有關(guān)于3D目標(biāo)檢測的零樣本學(xué)習(xí)，如何使SAM的零樣本能力適用于3D目標(biāo)檢測
2024年02月16日
瀏覽(23)
零樣本參考圖像分割 Zero-shot Referring Image Segmentation with Global-Local Context Features 論文筆記
寫在前面 ??新的一周開始了，沖沖沖~ 最近 Segment Anything 爆火，感覺一些方向可能就此終結(jié)了，比如少樣本、零樣本以及視頻領(lǐng)域，但是新的方向也應(yīng)該會源源不斷涌出，切勿悲觀~ 論文地址：Zero-shot Referring Image Segmentation with Global-Local Context Features 代碼地址：https://github
2024年02月09日
瀏覽(31)
Prompt-“設(shè)計(jì)提示模板：用更少數(shù)據(jù)實(shí)現(xiàn)預(yù)訓(xùn)練模型的卓越表現(xiàn)，助力Few-Shot和Zero-Shot任務(wù)”
通過設(shè)計(jì)提示（prompt）模板，實(shí)現(xiàn)使用更少量的數(shù)據(jù)在預(yù)訓(xùn)練模型（Pretrained Model）上得到更好的效果，多用于：Few-Shot，Zero-Shot 等任務(wù)。 prompt 是當(dāng)前 NLP 中研究小樣本學(xué)習(xí)方向上非常重要的一個(gè)方向。舉例來講，今天如果有這樣兩句評論：什么蘋果啊，都沒有蘋果味，怪怪
2024年02月11日
瀏覽(20)
論文筆記|CVPR2023:Semantic Prompt for Few-Shot Image Recognition
論文地址：https://arxiv.org/pdf/2303.14123.pdf 這是一篇2023年發(fā)表在CVPR上的論文，論文題目是Semantic Prompt for Few-Shot Image Recognitio，即用于小樣本圖像識別的語義提示。第一，最近幾項(xiàng)研究利用語義信息來進(jìn)行小樣本學(xué)習(xí)的研究。一方面因?yàn)橥ㄟ^少量樣本去識別新類別很難，就想使
2024年02月04日
瀏覽(30)
【計(jì)算機(jī)視覺】Zero-shot, One-shot和Few-shot的理解
機(jī)器學(xué)習(xí)任務(wù)按照對樣本量的需求可以分為：傳統(tǒng)監(jiān)督式學(xué)習(xí)、Few-shot Learning、One-shot Learning、Zero-shot Learning。傳統(tǒng)learning，煉丹模式。傳統(tǒng)深度學(xué)習(xí)的學(xué)習(xí)速度慢，往往需要學(xué)習(xí)海量數(shù)據(jù)和反復(fù)訓(xùn)練后才能使網(wǎng)絡(luò)模型具備不錯(cuò)的泛化能力，傳統(tǒng)learning可以總結(jié)為：海量數(shù)據(jù)
2024年02月04日
瀏覽(41)
AIGC零基礎(chǔ)30天學(xué)習(xí)——CLIP與zero-shot
? ? ? ?在前面對CLIP的學(xué)習(xí)中，對 zero-shot prediction 環(huán)節(jié)一直有一些疑惑，zero-shot是什么，它該如何進(jìn)行操作？ ? ? zero-shot是指零樣本學(xué)習(xí)，和zero-shot相關(guān)聯(lián)的概念包括many-shot、few-shot和one-shot，這些其實(shí)都是從訓(xùn)練集樣本類型、測試集樣本類型和對應(yīng)的樣本數(shù)量角度進(jìn)行劃分
2024年02月09日
瀏覽(19)
代碼解讀：Zero-shot 視頻生成任務(wù) Text2Video-Zero
Diffusion Models視頻生成-博客匯總前言：上一篇博客《【ICCV 2023 Oral】解讀Text2Video-Zero：解鎖 Zero-shot 視頻生成任務(wù)》解讀了這篇論文《Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators》。這篇論文的創(chuàng)新點(diǎn)比較多，含金量很高，而且開源了代碼。所以這篇博客結(jié)合
2024年02月03日
瀏覽(17)
105、Zero-1-to-3: Zero-shot One Image to 3D Object
官網(wǎng) ?使用合成數(shù)據(jù)集來學(xué)習(xí)相對攝像機(jī)視點(diǎn)的控制，這允許在指定的攝像機(jī)變換下生成相同對象的新圖像，用于從單個(gè)圖像進(jìn)行三維重建的任務(wù)。 ?輸入圖像 x ∈ R H × W × 3 x in R^{H times W times 3} x ∈ R H × W × 3 ，所需視點(diǎn)的相對攝像機(jī)旋轉(zhuǎn)和平移 R ∈ R 3 × 3 ， T ∈ R
2024年02月01日
瀏覽(27)
huggingface pipeline零訓(xùn)練樣本分類Zero-Shot Classification的實(shí)現(xiàn)
1 ：默認(rèn)的model 。輸出是 education 第一位的。 2 ：使用 morit/chinese_xlm_xnli : 3：使用 facebook/bart-large-mnli 4:
2024年02月20日
瀏覽(26)
diffusion model (七) diffusion model是一個(gè)zero-shot 分類器
Paper: Your Diffusion Model is Secretly a Zero-Shot Classifier Website: diffusion-classifier.github.io/ diffusion model（一）DDPM技術(shù)小結(jié) (denoising diffusion probabilistic) diffusion model（二）—— DDIM技術(shù)小結(jié) diffusion model（三）—— classifier guided diffusion model diffusion model（四）文生圖diffusion model（classifier-free
2024年02月12日
瀏覽(17)