国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<input id="oywhq"><meter id="oywhq"></meter></input>

<span id="oywhq"></span><kbd id="oywhq"><noframes id="oywhq">

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】

2年前作者：來杯Sherry分類：Toy博客閱讀(18)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

5、有監(jiān)督微調(diào)

5.1、提示學(xué)習(xí)&語境學(xué)習(xí)

提示學(xué)習(xí)

完成預(yù)測(cè)的三個(gè)階段：提示添加、答案搜索、答案映射

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

提示添加

“[X] 我感到 [Z]”

x = “我不小心錯(cuò)過了公共汽車?！?/p>
x’ = “我不小心錯(cuò)過了公共汽車。我感到[Z]”

答案搜索

Z = {“太好了”，“好”，“一般”，“不好”，“糟糕”}

將給定提示 x ′ 而模型輸出為 z 的過程記錄為函數(shù) $f_{fill} (x ′ , z)$ ，對(duì)于每個(gè)答案空間 $Z$ 中的候選答案 $z$ ，分別計(jì)算模型輸出它的概率, 從而找到模型對(duì)[Z] 插槽預(yù)測(cè)得分最高的輸出：

$\tilde{z} = search_{z∈Z}P(f_{fill}(x',z);θ)$

答案映射

將模型的輸出與最終的標(biāo)簽做映射。映射規(guī)則是人為制定的，比如，將“太好了”、“好”映射為“正面”標(biāo)簽，將“不好”，“糟糕”映射為“負(fù)面”標(biāo)簽，將“一般”映射為“中立”標(biāo)簽。

提示學(xué)習(xí)方法易于理解且效果顯著，提示工程、答案工程、多提示學(xué)習(xí)方法、基于提示的訓(xùn)練策略等已經(jīng)成為從提示學(xué)習(xí)衍生出的新的研究方向。

語境學(xué)習(xí)

關(guān)鍵思想是從類比中學(xué)習(xí)，整個(gè)過程并不需要對(duì)模型進(jìn)行參數(shù)更新，僅執(zhí)行向前的推理。

向模型輸入特定任務(wù)的一些具體例子以及測(cè)試樣例，讓模型根據(jù)示例續(xù)寫出測(cè)試樣例的答案。

如下情感分類，續(xù)寫情感極性：
LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

5.2、高效微調(diào)

高效微調(diào)：在縮減訓(xùn)練參數(shù)量和GPU顯存占用，同時(shí)使訓(xùn)練后的模型具有與全量微調(diào)相當(dāng)?shù)男阅堋?/p>

全量微調(diào)：微調(diào)全部參數(shù)需要相當(dāng)高的算力。

LoRA（ Low-Rank Adaptation of Large Language Models）

計(jì)算流程

$W_0x + \Delta Wx = W_0x + BAx$

矩陣 A 通過高斯函數(shù)初始化，矩陣 B 為零初始化，使得訓(xùn)練開始之前旁路對(duì)原模型不造成影響，即參數(shù)改變量為 0。

將原權(quán)重與訓(xùn)練后權(quán)重合并后，推理時(shí)不存在額外的開銷。

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

低秩矩陣通常有以下特點(diǎn)：

線性相關(guān)性較高：矩陣中的行或列之間存在較強(qiáng)的線性相關(guān)性，因此可以用較少的線性獨(dú)立分量來近似表示。

信息冗余較多：由于線性相關(guān)性，低秩矩陣中包含了一些冗余信息，可以通過較低秩的近似來減少存儲(chǔ)和計(jì)算成本。

較小的維度：低秩矩陣通常具有較低的維度，因?yàn)樗鼈兛梢杂幂^少的基向量（或特征向量）來表示。

其它高效微調(diào)方式

微調(diào)適配器（Adapter）

分別對(duì) Transformer 層中的自注意力模塊與多層感知（MLP）模塊，在其與其之后的殘差連接之間添加適配器層（Adapter layer）作為可訓(xùn)練參數(shù)。

該方法及其變體會(huì)增加網(wǎng)絡(luò)的深度，從而在模型推理時(shí)帶來額外的時(shí)間開銷。

前綴微調(diào)（ Prefix Tuning）

前綴微調(diào)是指在輸入序列前綴添加連續(xù)可微的軟提示作為可訓(xùn)練參數(shù)。由于模型可接受的最大輸入長(zhǎng)度有限，隨著軟提示的參數(shù)量增多，實(shí)際輸入序列的最大長(zhǎng)度也會(huì)相應(yīng)減小，影響模型性能。

軟提示：連續(xù)提示的方法。

5.3、模型上下文窗口擴(kuò)展

上下文窗口：在自然語言處理中，LLM（Large Language Model，大型語言模型）的上下文窗口指的是模型在處理文本時(shí)所考慮的文本片段或單詞的范圍。

具有外推能力的位置編碼

ALiBi

相對(duì)位置編碼

注意力加上線性偏置

$Softmax(q_iK^T+m·[-(i-1),...,-2,-1,0])$

m為坡度，取值為： $\{\frac{1}{a} , \frac{1}{a^2},...,\frac{1}{256} \} ,其中 a^{num\_heads} =256$

$[? (i ? 1), ..., ? 2, ? 1, 0]$ 表示相對(duì)位置，取值：-（k索引[1,i] - q索引[i]）

插值法

RoPE位置插值：

$f(x,\frac{m}{L'})L$

將更大的位置索引范圍 [0,L′) 縮減至原始的索引范圍 [0,L)

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

5.4、指令數(shù)據(jù)構(gòu)建

指令數(shù)據(jù)的質(zhì)量和多樣性是衡量指令數(shù)據(jù)的重要維度，影響有監(jiān)督微調(diào)過程的關(guān)鍵因素。

指令數(shù)據(jù)由指令、輸入、輸出組成。

指令數(shù)據(jù)示例：

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

手動(dòng)構(gòu)建

手動(dòng)編寫提示與相應(yīng)的回答；
大量人力投入。

自動(dòng)生成指令

Self-instruct

Self-instruct
其數(shù)據(jù)生成過程是一個(gè)迭代引導(dǎo)算法。

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

生成任務(wù)指令

手動(dòng)構(gòu)建175 seed tasks；

每次采樣8個(gè)task 指令（人工6 + 迭代生成2）；

直到停止生成 || 達(dá)到模型長(zhǎng)度限制。

確定指令是否代表分類任務(wù)

處理不同。

不同原因：避免分類任務(wù)時(shí)，生成過多某些特定任務(wù)Input，而忽視其他類別。

生成任務(wù)輸入和輸出

輸出：完整指令數(shù)據(jù)

No：Input-first, Input $\frac{instruction}{}>$ Output

Yes：Output-first, Output $\frac{instruction}{}>$ Input

過濾低質(zhì)量數(shù)據(jù)

多樣性：ROUGE-L相似度<0.7;

質(zhì)量：?jiǎn)l(fā)式規(guī)則：除掉含某些關(guān)鍵字（如“圖片”）、重復(fù)、過長(zhǎng)或過短數(shù)據(jù)。

LLaMA 模型上進(jìn)行有監(jiān)督微調(diào)得到 Alpaca 模型，所使用的指令數(shù)據(jù)集的示例

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能

5.5、開源指令數(shù)據(jù)集

開源數(shù)據(jù)指令集

LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】,LLM,深度學(xué)習(xí),Python,深度學(xué)習(xí),pytorch,人工智能文章來源地址http://www.zghlxwxcb.cn/news/detail-731196.html

到了這里，關(guān)于LLM-TAP隨筆——有監(jiān)督微調(diào)【深度學(xué)習(xí)】【PyTorch】【LLM】的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

利用弱監(jiān)督學(xué)習(xí)實(shí)現(xiàn)從單張圖像到圖像集的準(zhǔn)確3D人臉重建：PyTorch和Python的深度實(shí)踐
在這篇文章中，我將帶你走進(jìn)3D人臉重建的世界，并介紹如何使用弱監(jiān)督學(xué)習(xí)從單張圖像或圖像集中準(zhǔn)確重建3D人臉。我們將使用Python和PyTorch，一種廣泛用于深度學(xué)習(xí)的開源框架，來實(shí)現(xiàn)這一目標(biāo)。 3D人臉重建是計(jì)算機(jī)視覺領(lǐng)域的一項(xiàng)重要任務(wù)，它旨在從2D圖像中恢復(fù)出3D臉部
2024年02月16日
瀏覽(25)
PEFT學(xué)習(xí)：使用LORA進(jìn)行LLM微調(diào)
由于LORA,AdaLORA都集成在PEFT上了，所以在使用的時(shí)候安裝PEFT是必備項(xiàng) 方法一：PyPI To install ?? PEFT from PyPI: 方法二：Source New features that haven’t been released yet are added every day, which also means there may be some bugs. To try them out, install from the GitHub repository: If you’re working on contributing to th
2024年02月10日
瀏覽(24)
深度學(xué)習(xí)中有監(jiān)督，無監(jiān)督，自監(jiān)督學(xué)習(xí)
有監(jiān)督學(xué)習(xí)的特點(diǎn)，是數(shù)據(jù)集通常帶有人工標(biāo)簽的數(shù)據(jù)集。監(jiān)督學(xué)習(xí)提供了一組輸入輸出對(duì)，這樣我們就可以學(xué)習(xí)一個(gè)將輸入映射到正確輸出的中間系統(tǒng)。監(jiān)督學(xué)習(xí)的一個(gè)簡(jiǎn)單示例是根據(jù)圖像數(shù)據(jù)集及其相應(yīng)類別（我們將其稱為標(biāo)簽）確定圖像的類別（即，狗/貓等）。對(duì)于
2024年02月09日
瀏覽(19)
【Pytorch】從MoCo看無監(jiān)督對(duì)比學(xué)習(xí)；從SupCon看有監(jiān)督對(duì)比學(xué)習(xí)
以下內(nèi)容全部來自于：自監(jiān)督學(xué)習(xí)-MoCo-論文筆記. 侵刪論文：Momentum Contrast for Unsupervised Visual Representation Learning CVPR 2020 最佳論文提名用動(dòng)量對(duì)比學(xué)習(xí)的方法做無監(jiān)督的表征學(xué)習(xí)任務(wù)。動(dòng)量的理解即是指數(shù)移動(dòng)平均（EMA），公式理解： moco中利用動(dòng)量來緩慢的更新編碼器，這
2024年02月21日
瀏覽(29)
自監(jiān)督深度學(xué)習(xí)技術(shù)
自監(jiān)督學(xué)習(xí)（SSL）是機(jī)器學(xué)習(xí)的一種范式，用于處理未標(biāo)記數(shù)據(jù)以獲取有用的表示，以幫助下游學(xué)習(xí)任務(wù)。SSL方法最顯著的特點(diǎn)是它們不需要人類標(biāo)注的標(biāo)簽，這意味著它的訓(xùn)練完全基于由未標(biāo)記的數(shù)據(jù)樣本組成的數(shù)據(jù)集。典型的SSL流程包括在第一階段學(xué)習(xí)監(jiān)督信號(hào)（自動(dòng)生
2024年01月24日
瀏覽(23)
深度學(xué)習(xí)|自監(jiān)督學(xué)習(xí)、MAE學(xué)習(xí)策略、消融實(shí)驗(yàn)
前言：最近在閱讀論文，發(fā)現(xiàn)太多機(jī)器學(xué)習(xí)的知識(shí)不懂，把最近看的一篇論文有關(guān)的知識(shí)點(diǎn)匯總了一下。 Pretrain-Finetune（預(yù)訓(xùn)練+精調(diào)）模式：遷移學(xué)習(xí)，通過在源域數(shù)據(jù)上學(xué)習(xí)知識(shí)，再遷移到下游其他目標(biāo)任務(wù)上，提升目標(biāo)任務(wù)上的效果。 Self-supervised Learning（自監(jiān)督學(xué)習(xí)）
2024年02月12日
瀏覽(20)
Pytorch--模型微調(diào)finetune--遷移學(xué)習(xí) （待繼續(xù)學(xué)習(xí)）
https://www.bilibili.com/video/BV1Z84y1T7Zh/?spm_id_from=333.788vd_source=3fd64243313f29b58861eb492f248b34 torchvision 微調(diào) timm 微調(diào) 半精度訓(xùn)練大模型無法避免過擬合，
2024年02月11日
瀏覽(18)
【Pytorch項(xiàng)目實(shí)戰(zhàn)】之遷移學(xué)習(xí)：特征提取、微調(diào)、特征提取+微調(diào)、霧霾清除
2023年04月09日
瀏覽(13)
【人工智能與深度學(xué)習(xí)】自我監(jiān)督學(xué)習(xí) - ClusterFit 和 PIRL
2023年04月22日
瀏覽(23)
【深度學(xué)習(xí)】自監(jiān)督學(xué)習(xí)詳解（self-supervised learning）
深度學(xué)習(xí)被分為：監(jiān)督學(xué)習(xí)，無監(jiān)督學(xué)習(xí)和自監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)近些年獲得了巨大的成功，但是有如下的缺點(diǎn)： 1.人工標(biāo)簽相對(duì)數(shù)據(jù)來說本身是稀疏的，蘊(yùn)含的信息不如數(shù)據(jù)內(nèi)容豐富； 2.監(jiān)督學(xué)習(xí)只能學(xué)到特定任務(wù)的知識(shí)，不是通用知識(shí)，一般難以直接遷移到其他任務(wù)中。
2024年02月07日
瀏覽(24)

<rp id="woyss"><u id="woyss"><option id="woyss"></option></u></rp>

<progress id="woyss"><noframes id="woyss"><rp id="woyss"></rp>

<th id="woyss"></th>