国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

XTuner 微調(diào) 課程學(xué)習(xí)

2年前作者：HsienWei-Chin分類(lèi)：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了XTuner 微調(diào) 課程學(xué)習(xí)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

大語(yǔ)言模型于海量的文本內(nèi)容上，以無(wú)監(jiān)督和半監(jiān)督的方式進(jìn)行訓(xùn)練的
模型微調(diào)的目的：使其在具體的使用場(chǎng)景或領(lǐng)域中輸出更好的回答
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
增量預(yù)訓(xùn)練——給模型喂新的領(lǐng)域知識(shí)；
指令跟隨或指令微調(diào)——

基于海量的預(yù)訓(xùn)練數(shù)據(jù)訓(xùn)練出來(lái)的模型通常叫做——base模型或預(yù)訓(xùn)練模型，在沒(méi)有進(jìn)行指令微調(diào)的模型上進(jìn)行測(cè)試，模型只是單純的對(duì)給定的輸入進(jìn)行在訓(xùn)練數(shù)據(jù)集上的擬合，而不能意識(shí)到在對(duì)模型進(jìn)行提問(wèn)，為了讓模型在測(cè)試過(guò)程中有更好的表現(xiàn)，需要對(duì)基座模型進(jìn)行指令微調(diào)。

指令微調(diào)

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
在對(duì)基座模型進(jìn)行指令微調(diào)時(shí)，首先需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行角色指定
在給模型投喂的一條數(shù)據(jù)中，數(shù)據(jù)由一問(wèn)一答的形式構(gòu)成，問(wèn)題和結(jié)果分別指定為user和assistant兩個(gè)角色，system部分的數(shù)據(jù)按照自己微調(diào)的目標(biāo)領(lǐng)域來(lái)書(shū)寫(xiě)，如果想微調(diào)一個(gè)醫(yī)療的ai助手，那system的內(nèi)容可以為：你是一個(gè)專(zhuān)業(yè)的醫(yī)生，你總能輸出專(zhuān)業(yè)且正確的細(xì)致且耐心的這種回答。
在同一次微調(diào)，同一個(gè)數(shù)據(jù)集中，system的內(nèi)容往往由于目標(biāo)的唯一性，是確定的
以上的內(nèi)容為 對(duì)話(huà)模板的構(gòu)建

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
在與模型進(jìn)行對(duì)話(huà)的過(guò)程中(部署的階段)，用戶(hù)不需要進(jìn)行角色的分配，用戶(hù)輸入的內(nèi)容被默認(rèn)放入user的部分，system部分由模板自動(dòng)添加，具體的模板在啟動(dòng)預(yù)測(cè)的時(shí)候可以進(jìn)行自定義，計(jì)算損失時(shí)，只需要進(jìn)行assistant部分的損失

指令微調(diào)的原理

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)

增量預(yù)訓(xùn)練微調(diào)

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
進(jìn)行指令微調(diào)的過(guò)程中，每條數(shù)據(jù)都由一問(wèn)一答的形式構(gòu)成，但增量訓(xùn)練的數(shù)據(jù)不需要問(wèn)題，只需要回答，或者說(shuō)增量訓(xùn)練的數(shù)據(jù)，都是一個(gè)一個(gè)的陳述句，所以每一條訓(xùn)練的數(shù)據(jù)中system和user的部分只需要留空，增量訓(xùn)練的數(shù)據(jù)放入到assistant中即可，計(jì)算損失時(shí)也只需要計(jì)算assistant的部分的損失

X Turner中使用的原理——LoRA和QLoRA

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
使用LoRA的理由——如果對(duì)整個(gè)模型的所有參數(shù)進(jìn)行調(diào)整，需要非常大的顯存才能訓(xùn)練，而LoRA不需要非常大的顯存開(kāi)銷(xiāo)
LoRA是一種在原有的模型的線(xiàn)路旁，新增一個(gè)旁路分支Adapter，該分支包含兩個(gè)小的部分（LoRA模型文件指的就是旁路分支Adapter文件）
QLoRA是對(duì)LoRA的一種改進(jìn)
全參數(shù)微調(diào)，LoRA和QLoRA的對(duì)比
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
全參數(shù)微調(diào)和LoRA微調(diào)，模型的參數(shù)都需要先加載到顯存中，但對(duì)LoRA，其參數(shù)優(yōu)化器只需要保存LoRA部分的參數(shù)優(yōu)化器即可；而QLoRA，在加載模型時(shí)，就使用4比特量化的方式加載，其優(yōu)化器也可以在cpu和gpu之間進(jìn)行調(diào)度，即若顯存滿(mǎn)了，就自動(dòng)在內(nèi)存中跑

XTuner

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)

一些trick的訓(xùn)練策略文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-791652.html

到了這里，關(guān)于XTuner 微調(diào) 課程學(xué)習(xí)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

人工智能課程設(shè)計(jì)畢業(yè)設(shè)計(jì)——基于機(jī)器學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng)
《機(jī)器學(xué)習(xí)》課程設(shè)計(jì)實(shí)驗(yàn) 報(bào)告題目：基于深度學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng) 目錄基于深度學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng)實(shí)驗(yàn)報(bào)告 1. 緒論 ............................................................................................................................................................ 1 1.1 研究背景及意義..
2024年02月20日
瀏覽(102)
飛漿AI studio人工智能課程學(xué)習(xí)（3）-在具體場(chǎng)景下優(yōu)化Prompt
01 常見(jiàn)應(yīng)用場(chǎng)景與優(yōu)化示例 02 優(yōu)質(zhì)Prompt模板化 03 大作業(yè)指引:Prompt作品積分賽 01 常見(jiàn)應(yīng)用場(chǎng)景與優(yōu)化示例內(nèi)容產(chǎn)業(yè)規(guī)模龐大、領(lǐng)域眾多，大模型強(qiáng)大的生成能力給工作和生活帶來(lái)了極大的想象力。 ?彈幕說(shuō)一說(shuō)，哪些AIGC場(chǎng)景是你最感興趣的?先來(lái)看幾類(lèi)常見(jiàn)的: ·產(chǎn)品海報(bào)背景
2024年02月06日
瀏覽(24)
打造你的專(zhuān)屬大模型，學(xué)完即可使用上崗！技術(shù)人的大模型課程（人工智能/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)）
技術(shù)人的大模型課讓一部分人在大模型時(shí)代，先擁抱AI，為編程專(zhuān)家開(kāi)啟AI新篇章在2024年，大模型不再是可選技能，而是技術(shù)行業(yè)的必備。你是否曾在夜深人靜時(shí)想象，從一名代碼專(zhuān)家轉(zhuǎn)型為AI行業(yè)的引領(lǐng)者？如果你的答案是肯定的，那么這門(mén)課程正是為你量身定制，針對(duì)
2024年04月27日
瀏覽(28)
Python人工智能教學(xué)之掌握機(jī)器學(xué)習(xí)深度學(xué)習(xí)并提升實(shí)戰(zhàn)能力（共72個(gè)視頻教學(xué)+課程資料）云盤(pán)下載
人工智能是未來(lái)的發(fā)展方向，掌握了人工智能，就掌握了錢(qián)圖。。。 Python人工智能教學(xué)之掌握機(jī)器學(xué)習(xí)深度學(xué)習(xí)并提升實(shí)戰(zhàn)能力（共72個(gè)視頻教學(xué)+課程資料）下載地址：鏈接：https://pan.baidu.com/s/1ryJd5PNx1tLDDU-Q6JFXPQ?pwd=n6o8 提取碼：n6o8 --來(lái)自百度網(wǎng)盤(pán)超級(jí)會(huì)員V2的分享 └─ 批
2024年04月29日
瀏覽(30)
Python+Django+Mysql開(kāi)發(fā)簡(jiǎn)單在線(xiàn)課程推薦系統(tǒng)簡(jiǎn)單教程基于用戶(hù)的協(xié)同過(guò)濾推薦算法個(gè)性化課程推薦系統(tǒng) 爬蟲(chóng) 可視化數(shù)據(jù)分析機(jī)器學(xué)習(xí) 人工智能個(gè)性化推薦相關(guān)推薦
1、開(kāi)發(fā)工具和使用技術(shù) Python3及以上版本，Django3.6及以上版本，mysql8，navicat數(shù)據(jù)庫(kù)管理工具或者sqlyog數(shù)據(jù)庫(kù)管理工具，html頁(yè)面，javascript腳本，jquery腳本，echarts.js可視化圖表工具，自定義星星評(píng)分功能（使用font-awesome星星圖標(biāo)字體）等。 2、實(shí)現(xiàn)功能前臺(tái)首頁(yè)地址：http://1
2024年02月05日
瀏覽(376)
《人工智能》課程作業(yè)4
1. (單選題)在證據(jù)理論中，信任函數(shù)與似然函數(shù)對(duì)（Bel（A），Pl（A））的值為（0，0）時(shí)，表示（）。 A. A為假 B. 對(duì)A為真有一定信任 C. A為真 D. 對(duì)A一無(wú)所知正確答案: A 2. (單選題)在可信度方法中，若證據(jù)A的可信度CF（F）=0, 這意味：（）。 A.證據(jù)A可信 B. 證據(jù)A不可信 C. 對(duì)證
2024年01月16日
瀏覽(27)
《人工智能》課程作業(yè)3
1. (單選題, 2分)以下關(guān)于合式公式的性質(zhì)錯(cuò)誤的是（）。 A. (P∧Q)∧R ≡ P∧(Q∧R) B. P=Q ≡ ~P→ ~Q C. P∨Q ≡ ~P→Q D. P=Q ≡ ~Q → ~P 正確答案: B 2. (單選題, 2分)運(yùn)用消解推理規(guī)則的前提是（）。 A. 被作用的兩個(gè)公式都是合取范式 B. 被作用的兩個(gè)子句中存在互補(bǔ)對(duì) C. 任意兩個(gè)公式
2024年02月03日
瀏覽(27)
人工智能課程心得
????????我第一次聽(tīng)說(shuō)人工智能這個(gè)詞源自初中的時(shí)候AlphaGo與李世石的圍棋比賽，印象中的AlphaGo以大比分的優(yōu)勢(shì)擊敗了李世石，后來(lái)經(jīng)過(guò)了解知道了在2016年比賽時(shí)的李世石是近十年來(lái)獲得世界冠軍最多的棋手。從表面上來(lái)看，李世石當(dāng)時(shí)是和一臺(tái)機(jī)器下棋，實(shí)際上也是與
2024年02月12日
瀏覽(25)
《人工智能安全》課程總體結(jié)構(gòu)
人工智能安全觀：人工智能安全問(wèn)題、安全屬性、技術(shù)體系等基本問(wèn)題進(jìn)行了歸納整理。人工智能安全的主要數(shù)據(jù)處理方法，即非平衡數(shù)據(jù)分類(lèi)、噪聲數(shù)據(jù)處理和小樣本學(xué)習(xí)。人工智能技術(shù)賦能網(wǎng)絡(luò)空間安全攻擊與防御：三個(gè)典型實(shí)例及攻擊圖的角度介紹典型人工智能方法
2024年02月03日
瀏覽(30)
北大肖臻老師《區(qū)塊鏈技術(shù)與應(yīng)用》系列課程學(xué)習(xí)筆記[25]以太坊-智能合約-5
智能合約-1 智能合約-2 智能合約-3 智能合約-4 網(wǎng)上競(jìng)拍第二版：由投標(biāo)者自己取回出價(jià) （1）存在的問(wèn)題 ????????重入攻擊，如果有黑客寫(xiě)了一個(gè)如下方程序會(huì)怎么樣？ ????????這個(gè)hack_bid跟前面的那個(gè)黑客合約hack_bid合約是一樣的，通過(guò)調(diào)用拍賣(mài)bid函數(shù)參與競(jìng)拍，ha
2024年03月11日
瀏覽(26)