国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

DyLoRA:使用動態(tài)無搜索低秩適應(yīng)的預(yù)訓(xùn)練模型的參數(shù)有效微調(diào)

這篇具有很好參考價值的文章主要介紹了DyLoRA:使用動態(tài)無搜索低秩適應(yīng)的預(yù)訓(xùn)練模型的參數(shù)有效微調(diào)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

又一個針對LoRA的改進方法:

DyLoRA: Parameter-Efficient Tuning of Pretrained Models using Dynamic Search-Free Low Rank Adaptation

https://arxiv.org/pdf/2210.07558v2.pdf

https://github.com/huawei-noah/KD-NLP/tree/main/DyLoRA

Part1前言

LoRA存在的問題

  • rank的值是固定的,訓(xùn)練完成后不能修改。
  • 優(yōu)化rank的值需要大量的搜索和努力。

提出的方法:引入了一種動態(tài)低秩適應(yīng)(Dy-LoRA)技術(shù)。通過對適配器模塊在訓(xùn)練期間的不同秩所學(xué)到的表示進行排序,為一系列的秩而不是單一的秩訓(xùn)練LoRA塊。

主要貢獻

  • 動態(tài)LoRA:在LoRA的基礎(chǔ)上,我們開發(fā)了一種新的算法(DyLoRA),使其在推理時是動態(tài)的,而不會產(chǎn)生額外的費用。
  • 無需搜索的LoRA:我們證明,通過在性能上做出可忽略不計的妥協(xié),有可能避免為LoRA選擇最佳秩的昂貴的搜索過程。

Part2介紹

在每一個LoRA模塊中,有一個向上投影和向下投影的矩陣。設(shè)我們想訓(xùn)練LoRA模塊在的范圍內(nèi)操作,其中可以被視為新的超參數(shù)。為了使LoRA模塊在一系列的秩中工作,而不是單一的秩,我們需要確保增加或減少秩不會明顯阻礙模型的性能。實現(xiàn)這種行為的一種方法是在LoRA模塊的訓(xùn)練過程中對不同秩的信息內(nèi)容進行排序。在這方面,在每個訓(xùn)練步驟中,我們對進行抽樣。形成一個預(yù)先定義的分類分布其(支持度為Range[rmin, rmax]),并相應(yīng)地截斷矩陣。

是W的b截斷版本。

前向傳播計算時是這么計算的:

損失的計算:

另外在訓(xùn)練的時候增加了一個新的模塊:frozen,即只更新截斷塊中第b個相關(guān)的行或者列。

整個流程如下:

需要注意反向傳播時是否是更新整個截斷塊還是第b個行或列。

Part3實驗結(jié)果

首先是說明不同rank對結(jié)果的影響:

接著是該方法和其他方法的對比:文章來源地址http://www.zghlxwxcb.cn/news/detail-419419.html

到了這里,關(guān)于DyLoRA:使用動態(tài)無搜索低秩適應(yīng)的預(yù)訓(xùn)練模型的參數(shù)有效微調(diào)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包