国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

XTuner 微調(diào) 課程學(xué)習(xí)

這篇具有很好參考價(jià)值的文章主要介紹了XTuner 微調(diào) 課程學(xué)習(xí)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

大語(yǔ)言模型于海量的文本內(nèi)容上,以無(wú)監(jiān)督和半監(jiān)督的方式進(jìn)行訓(xùn)練的
模型微調(diào)的目的:使其在具體的使用場(chǎng)景或領(lǐng)域中輸出更好的回答
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
增量預(yù)訓(xùn)練——給模型喂新的領(lǐng)域知識(shí);
指令跟隨或指令微調(diào)——
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
基于海量的預(yù)訓(xùn)練數(shù)據(jù)訓(xùn)練出來(lái)的模型通常叫做——base模型或預(yù)訓(xùn)練模型,在沒(méi)有進(jìn)行指令微調(diào)的模型上進(jìn)行測(cè)試,模型只是單純的對(duì)給定的輸入進(jìn)行在訓(xùn)練數(shù)據(jù)集上的擬合,而不能意識(shí)到在對(duì)模型進(jìn)行提問(wèn),為了讓模型在測(cè)試過(guò)程中有更好的表現(xiàn),需要對(duì)基座模型進(jìn)行指令微調(diào)。

指令微調(diào)

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
在對(duì)基座模型進(jìn)行指令微調(diào)時(shí),首先需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行角色指定
在給模型投喂的一條數(shù)據(jù)中,數(shù)據(jù)由一問(wèn)一答的形式構(gòu)成,問(wèn)題和結(jié)果分別指定為user和assistant兩個(gè)角色,system部分的數(shù)據(jù)按照自己微調(diào)的目標(biāo)領(lǐng)域來(lái)書(shū)寫(xiě),如果想微調(diào)一個(gè)醫(yī)療的ai助手,那system的內(nèi)容可以為:你是一個(gè)專(zhuān)業(yè)的醫(yī)生,你總能輸出專(zhuān)業(yè)且正確的細(xì)致且耐心的這種回答。
在同一次微調(diào),同一個(gè)數(shù)據(jù)集中,system的內(nèi)容往往由于目標(biāo)的唯一性,是確定的
以上的內(nèi)容為 對(duì)話(huà)模板的構(gòu)建

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
在與模型進(jìn)行對(duì)話(huà)的過(guò)程中(部署的階段),用戶(hù)不需要進(jìn)行角色的分配,用戶(hù)輸入的內(nèi)容被默認(rèn)放入user的部分,system部分由模板自動(dòng)添加,具體的模板在啟動(dòng)預(yù)測(cè)的時(shí)候可以進(jìn)行自定義,計(jì)算損失時(shí),只需要進(jìn)行assistant部分的損失

指令微調(diào)的原理

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)

增量預(yù)訓(xùn)練微調(diào)

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
進(jìn)行指令微調(diào)的過(guò)程中,每條數(shù)據(jù)都由一問(wèn)一答的形式構(gòu)成,但增量訓(xùn)練的數(shù)據(jù)不需要問(wèn)題,只需要回答,或者說(shuō)增量訓(xùn)練的數(shù)據(jù),都是一個(gè)一個(gè)的陳述句,所以每一條訓(xùn)練的數(shù)據(jù)中system和user的部分只需要留空,增量訓(xùn)練的數(shù)據(jù)放入到assistant中即可,計(jì)算損失時(shí)也只需要計(jì)算assistant的部分的損失

X Turner中使用的原理——LoRA和QLoRA

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
使用LoRA的理由——如果對(duì)整個(gè)模型的所有參數(shù)進(jìn)行調(diào)整,需要非常大的顯存才能訓(xùn)練,而LoRA不需要非常大的顯存開(kāi)銷(xiāo)
LoRA是一種在原有的模型的線(xiàn)路旁,新增一個(gè)旁路分支Adapter,該分支包含兩個(gè)小的部分(LoRA模型文件 指的就是旁路分支Adapter文件)
QLoRA是對(duì)LoRA的一種改進(jìn)
全參數(shù)微調(diào),LoRA和QLoRA的對(duì)比
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
全參數(shù)微調(diào)和LoRA微調(diào),模型的參數(shù)都需要先加載到顯存中,但對(duì)LoRA,其參數(shù)優(yōu)化器只需要保存LoRA部分的參數(shù)優(yōu)化器即可;而QLoRA,在加載模型時(shí),就使用4比特量化的方式加載,其優(yōu)化器也可以在cpu和gpu之間進(jìn)行調(diào)度,即若顯存滿(mǎn)了,就自動(dòng)在內(nèi)存中跑

XTuner

XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
XTuner 微調(diào) 課程學(xué)習(xí),學(xué)習(xí),人工智能,機(jī)器學(xué)習(xí)
一些trick的訓(xùn)練策略文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-791652.html

到了這里,關(guān)于XTuner 微調(diào) 課程學(xué)習(xí)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 人工智能課程設(shè)計(jì)畢業(yè)設(shè)計(jì)——基于機(jī)器學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng)

    人工智能課程設(shè)計(jì)畢業(yè)設(shè)計(jì)——基于機(jī)器學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng)

    《機(jī)器學(xué)習(xí)》課程設(shè)計(jì)實(shí)驗(yàn) 報(bào)告 題目:基于深度學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng) 目錄 基于深度學(xué)習(xí)的手寫(xiě)漢字識(shí)別系統(tǒng)實(shí)驗(yàn)報(bào)告 1. 緒論 ............................................................................................................................................................ 1 1.1 研究背景及意義..

    2024年02月20日
    瀏覽(102)
  • 飛漿AI studio人工智能課程學(xué)習(xí)(3)-在具體場(chǎng)景下優(yōu)化Prompt

    飛漿AI studio人工智能課程學(xué)習(xí)(3)-在具體場(chǎng)景下優(yōu)化Prompt

    01 常見(jiàn)應(yīng)用場(chǎng)景與優(yōu)化示例 02 優(yōu)質(zhì)Prompt模板化 03 大作業(yè)指引:Prompt作品積分賽 01 常見(jiàn)應(yīng)用場(chǎng)景與優(yōu)化示例 內(nèi)容產(chǎn)業(yè)規(guī)模龐大、領(lǐng)域眾多,大模型強(qiáng)大的生成能力給工作和生活帶來(lái)了極大的想象力。 ?彈幕說(shuō)一說(shuō),哪些AIGC場(chǎng)景是你最感興趣的?先來(lái)看幾類(lèi)常見(jiàn)的: ·產(chǎn)品海報(bào)背景

    2024年02月06日
    瀏覽(24)
  • 打造你的專(zhuān)屬大模型,學(xué)完即可使用上崗!技術(shù)人的大模型課程(人工智能/機(jī)器學(xué)習(xí)/深度學(xué)習(xí))

    打造你的專(zhuān)屬大模型,學(xué)完即可使用上崗!技術(shù)人的大模型課程(人工智能/機(jī)器學(xué)習(xí)/深度學(xué)習(xí))

    技術(shù)人的大模型課 讓一部分人在大模型時(shí)代,先擁抱AI,為編程專(zhuān)家開(kāi)啟AI新篇章 在2024年,大模型不再是可選技能,而是技術(shù)行業(yè)的必備。你是否曾在夜深人靜時(shí)想象,從一名代碼專(zhuān)家轉(zhuǎn)型為AI行業(yè)的引領(lǐng)者? 如果你的答案是肯定的,那么這門(mén)課程正是為你量身定制, 針對(duì)

    2024年04月27日
    瀏覽(28)
  • Python人工智能教學(xué)之掌握機(jī)器學(xué)習(xí)深度學(xué)習(xí)并提升實(shí)戰(zhàn)能力(共72個(gè)視頻教學(xué)+課程資料)云盤(pán)下載

    Python人工智能教學(xué)之掌握機(jī)器學(xué)習(xí)深度學(xué)習(xí)并提升實(shí)戰(zhàn)能力(共72個(gè)視頻教學(xué)+課程資料)云盤(pán)下載

    人工智能是未來(lái)的發(fā)展方向,掌握了人工智能,就掌握了錢(qián)圖。。。 Python人工智能教學(xué)之掌握機(jī)器學(xué)習(xí)深度學(xué)習(xí)并提升實(shí)戰(zhàn)能力(共72個(gè)視頻教學(xué)+課程資料) 下載地址: 鏈接:https://pan.baidu.com/s/1ryJd5PNx1tLDDU-Q6JFXPQ?pwd=n6o8 提取碼:n6o8 --來(lái)自百度網(wǎng)盤(pán)超級(jí)會(huì)員V2的分享 └─ 批

    2024年04月29日
    瀏覽(30)
  • Python+Django+Mysql開(kāi)發(fā)簡(jiǎn)單在線(xiàn)課程推薦系統(tǒng)簡(jiǎn)單教程 基于用戶(hù)的協(xié)同過(guò)濾推薦算法 個(gè)性化課程推薦系統(tǒng) 爬蟲(chóng) 可視化數(shù)據(jù)分析 機(jī)器學(xué)習(xí) 人工智能 個(gè)性化推薦 相關(guān)推薦

    Python+Django+Mysql開(kāi)發(fā)簡(jiǎn)單在線(xiàn)課程推薦系統(tǒng)簡(jiǎn)單教程 基于用戶(hù)的協(xié)同過(guò)濾推薦算法 個(gè)性化課程推薦系統(tǒng) 爬蟲(chóng) 可視化數(shù)據(jù)分析 機(jī)器學(xué)習(xí) 人工智能 個(gè)性化推薦 相關(guān)推薦

    1、開(kāi)發(fā)工具和使用技術(shù) Python3及以上版本,Django3.6及以上版本,mysql8,navicat數(shù)據(jù)庫(kù)管理工具或者sqlyog數(shù)據(jù)庫(kù)管理工具,html頁(yè)面,javascript腳本,jquery腳本,echarts.js可視化圖表工具,自定義星星評(píng)分功能(使用font-awesome星星圖標(biāo)字體)等。 2、實(shí)現(xiàn)功能 前臺(tái)首頁(yè)地址:http://1

    2024年02月05日
    瀏覽(376)
  • 《人工智能》課程作業(yè)4

    《人工智能》課程作業(yè)4

    1. (單選題)在證據(jù)理論中,信任函數(shù)與似然函數(shù)對(duì)(Bel(A),Pl(A))的值為(0,0)時(shí),表示( )。 A. A為假 B. 對(duì)A為真有一定信任 C. A為真 D. 對(duì)A一無(wú)所知 正確答案: A 2. (單選題)在可信度方法中,若證據(jù)A的可信度CF(F)=0, 這意味:( )。 A.證據(jù)A可信 B. 證據(jù)A不可信 C. 對(duì)證

    2024年01月16日
    瀏覽(27)
  • 《人工智能》課程作業(yè)3

    《人工智能》課程作業(yè)3

    1. (單選題, 2分)以下關(guān)于合式公式的性質(zhì)錯(cuò)誤的是()。 A. (P∧Q)∧R ≡ P∧(Q∧R) B. P=Q ≡ ~P→ ~Q C. P∨Q ≡ ~P→Q D. P=Q ≡ ~Q → ~P 正確答案: B 2. (單選題, 2分)運(yùn)用消解推理規(guī)則的前提是( )。 A. 被作用的兩個(gè)公式都是合取范式 B. 被作用的兩個(gè)子句中存在互補(bǔ)對(duì) C. 任意兩個(gè)公式

    2024年02月03日
    瀏覽(27)
  • 人工智能課程心得

    ????????我第一次聽(tīng)說(shuō)人工智能這個(gè)詞源自初中的時(shí)候AlphaGo與李世石的圍棋比賽,印象中的AlphaGo以大比分的優(yōu)勢(shì)擊敗了李世石,后來(lái)經(jīng)過(guò)了解知道了在2016年比賽時(shí)的李世石是近十年來(lái)獲得世界冠軍最多的棋手。從表面上來(lái)看,李世石當(dāng)時(shí)是和一臺(tái)機(jī)器下棋,實(shí)際上也是與

    2024年02月12日
    瀏覽(25)
  • 《人工智能安全》課程總體結(jié)構(gòu)

    《人工智能安全》課程總體結(jié)構(gòu)

    人工智能安全觀:人工智能安全問(wèn)題、安全屬性、技術(shù)體系等基本問(wèn)題進(jìn)行了歸納整理。 人工智能安全的主要數(shù)據(jù)處理方法,即非平衡數(shù)據(jù)分類(lèi)、噪聲數(shù)據(jù)處理和小樣本學(xué)習(xí)。 人工智能技術(shù)賦能網(wǎng)絡(luò)空間安全攻擊與防御:三個(gè)典型實(shí)例及攻擊圖的角度介紹典型人工智能方法

    2024年02月03日
    瀏覽(30)
  • 北大肖臻老師《區(qū)塊鏈技術(shù)與應(yīng)用》系列課程學(xué)習(xí)筆記[25]以太坊-智能合約-5

    北大肖臻老師《區(qū)塊鏈技術(shù)與應(yīng)用》系列課程學(xué)習(xí)筆記[25]以太坊-智能合約-5

    智能合約-1 智能合約-2 智能合約-3 智能合約-4 網(wǎng)上競(jìng)拍第二版:由投標(biāo)者自己取回出價(jià) (1)存在的問(wèn)題 ????????重入攻擊,如果有黑客寫(xiě)了一個(gè)如下方程序會(huì)怎么樣? ????????這個(gè)hack_bid跟前面的那個(gè)黑客合約hack_bid合約是一樣的,通過(guò)調(diào)用拍賣(mài)bid函數(shù)參與競(jìng)拍,ha

    2024年03月11日
    瀏覽(26)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包