一文帶你UI界面玩轉(zhuǎn)ChatGLM以及Llama的微調(diào)

2年前作者：梅漬小番茄分類：Toy博客閱讀(78)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了一文帶你UI界面玩轉(zhuǎn)ChatGLM以及Llama的微調(diào)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Lora微調(diào)的概念：

????????lora是Low-Rank Adaptation的縮寫，是微軟的Hu等人于2021年掛在ArXiv上（后又發(fā)表在ICLR2022上）的一篇論文《LoRA: Low-Rank Adaptation of Large Language Models》中提出的，通俗來(lái)講，是一種降低模型可訓(xùn)練參數(shù)，又盡量不損失模型表現(xiàn)的大模型微調(diào)方法。為什么時(shí)隔兩年，lora又突然火了一把呢？這一切都要感謝ChatGPT。

????????這里就簡(jiǎn)單介紹這么多，LORA微調(diào)系列(一)：LORA和它的基本原理 - 知乎 (zhihu.com)這篇文章講解的非常詳細(xì)，有興趣的同學(xué)可以去看一看。隨著大模型的爆火，lora已經(jīng)成為必不可少的工具之一了。下面就開(kāi)始講述如何在UI頁(yè)面可視化的微調(diào)大模型。

alpaca_gpt4_data_zh.json,llama,自然語(yǔ)言處理,pytorch,語(yǔ)言模型,nlp

step 1 下載源碼

????????ChatGLM的微調(diào)

?git clone?https://github.com/hiyouga/ChatGLM-Efficient-Tuning.git

????????Llama的微調(diào)：

git clone?https://github.com/hiyouga/LLaMA-Efficient-Tuning.git

step 2 準(zhǔn)備數(shù)據(jù)集

????????準(zhǔn)備好數(shù)據(jù)集（json文件），放入./ChatGLM-Efficient-Tuning-main/data文件夾中

Step 3 查看數(shù)據(jù)集SHA-1哈希值

?sha1sum /path/to/your/file.txt

Step 4 添加數(shù)據(jù)集

????????將SHA-1哈希值添加到dataset_info.json文件中，例如：

"alpaca_gpt4_zh": {
    "file_name": "alpaca_gpt4_data_zh.json",
    "file_sha1": "3eaa3bda364ccdd59925d7448a698256c31ef845"
  },

Step 5 運(yùn)行程序

安裝依賴：

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

?運(yùn)行程序：

python ./ChatGLM-Efficient-Tuning-main/src/train_web.py

Step 6 修改參數(shù)&運(yùn)行

????????UI頁(yè)面：

alpaca_gpt4_data_zh.json,llama,自然語(yǔ)言處理,pytorch,語(yǔ)言模型,nlp

Step 6.1 訓(xùn)練

????????1.修改Model Path：本地模型的地址

????????2.修改Fintuning method：微調(diào)方式（默認(rèn)為lora）

????????3.選擇需要訓(xùn)練的數(shù)據(jù)集

????????4.修改以下的超參數(shù)：

????????????????Learning rate：學(xué)習(xí)率（e-3~e-5），Epochs，Batchsize，Save steps

? ? ? ? ? ? ? ? 這里的Save steps是每多少步就保存一次Checkpoint文件。例如有3000個(gè)Total steps，Save steps為1000，那么就是每1000個(gè)step就保存一次Checkpoint文件，最后一共三個(gè)文件。

????????5.開(kāi)始訓(xùn)練：點(diǎn)擊start

Step 6.2 測(cè)試

????????點(diǎn)擊Evaluate，選擇數(shù)據(jù)集，修改相關(guān)的參數(shù)，點(diǎn)start

Step 6.3 Chat

????????點(diǎn)擊Load model（可以實(shí)時(shí)的查看微調(diào)結(jié)果或者模型結(jié)果）

Step 6.4 導(dǎo)出模型

????????輸入導(dǎo)出模型的地址，以及模型最大文件的大小。

Llama的微調(diào)方式和ChatGLM的微調(diào)方式一樣，這里就不多贅述了。

最后，希望大家都可以煉丹成功！！！文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-777581.html

到了這里，關(guān)于一文帶你UI界面玩轉(zhuǎn)ChatGLM以及Llama的微調(diào)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

[玩轉(zhuǎn)AIGC]LLaMA2之如何微調(diào)模型
首先我們從github上下載Llama 2的微調(diào)代碼：GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model 執(zhí)行命令：下載完成之后，安裝對(duì)應(yīng)環(huán)境，執(zhí)行命令：在這里我補(bǔ)充一下模型下載權(quán)限的申請(qǐng) 需先在Meta上申請(qǐng)權(quán)限（國(guó)家選中國(guó)不行，要選其他國(guó)家） https://ai.meta.com/re
2024年02月03日
瀏覽(21)
安裝LLaMA-Factory微調(diào)chatglm3，修改自我認(rèn)知
安裝git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama_factory python=3.10 conda activate llama_factory cd LLaMA-Factory pip install -r requirements.txt 之后運(yùn)行單卡訓(xùn)練， CUDA_VISIBLE_DEVICES=0 python src/train_web.py，按如下配置 demo_tran.sh ? export_model.sh ? cli_demo.sh 注意合并模型的時(shí)候，最后復(fù)制
2024年02月04日
瀏覽(28)
LLaMA-Factory微調(diào)（sft）ChatGLM3-6B保姆教程
下載LLaMA-Factory 下載ChatGLM3-6B 下載ChatGLM3 windows下載CUDA ToolKit 12.1 （本人是在windows進(jìn)行訓(xùn)練的，顯卡GTX 1660 Ti） CUDA安裝完畢后，通過(guò)指令 nvidia-smi 查看 1、選擇下載目錄：E:llm-trainLLaMA-Factory，并打開(kāi) 2、創(chuàng)建新的python環(huán)境，這里使用conda創(chuàng)建一個(gè)python空環(huán)境，選擇python3.10 參考
2024年04月13日
瀏覽(33)
【LangChain學(xué)習(xí)之旅】—（7）調(diào)用模型：使用OpenAI API還是微調(diào)開(kāi)源Llama2/ChatGLM？
Reference：LangChain 實(shí)戰(zhàn)課之前的內(nèi)容講了提示工程的原理以及 LangChain 中的具體使用方式。今天，我們來(lái)著重討論 Model I/O 中的第二個(gè)子模塊，LLM。讓我們帶著下面的問(wèn)題來(lái)開(kāi)始這一節(jié)課的學(xué)習(xí)。大語(yǔ)言模型，不止 ChatGPT 一種。調(diào)用 OpenAI 的 API，當(dāng)然方便且高效，不過(guò)，如果我
2024年02月01日
瀏覽(24)
LLMs：LLaMA Efficient Tuning(一款可高效微調(diào)【全參數(shù)/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【預(yù)訓(xùn)練+指令監(jiān)督微調(diào)+
LLMs：LLaMA Efficient Tuning(一款可高效微調(diào)【全參數(shù)/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【預(yù)訓(xùn)練+指令監(jiān)督微調(diào)+獎(jiǎng)勵(lì)模型訓(xùn)練+PPO 訓(xùn)練+DPO 訓(xùn)練】)的簡(jiǎn)介、安裝、使用方法之詳細(xì)攻略目錄相關(guān)文章 LLMs之ChatGLM：ChatGLM Efficient Tuning(一款高效微調(diào)ChatGLM-6B/Ch
2024年02月09日
瀏覽(34)
一文帶你玩轉(zhuǎn)ProtoBuf
在網(wǎng)絡(luò)通信和通用數(shù)據(jù)交換等應(yīng)用場(chǎng)景中經(jīng)常使用的技術(shù)是 JSON 或 XML，在微服務(wù)架構(gòu)中通常使用另外一個(gè)數(shù)據(jù)交換的協(xié)議的工具ProtoBuf。 ProtoBuf也是我們做微服務(wù)開(kāi)發(fā)，進(jìn)行Go進(jìn)階實(shí)戰(zhàn)中，必知必會(huì)的知道點(diǎn)。今天就開(kāi)始第一章內(nèi)容：《一文帶你玩轉(zhuǎn)ProtoBuf》你可能不知道
2023年04月16日
瀏覽(24)
手把手帶你實(shí)現(xiàn)ChatGLM2-6B的P-Tuning微調(diào)
參考文獻(xiàn)：chatglm2ptuning 注意問(wèn)題1：AttributeError: ‘Seq2SeqTrainer’ object has no attribute \\\'is_deepspeed_enabl torch.distributed.elastic.multiprocessing.errors.ChildFailedError: 可能是版本太高，可以參考chatglm2的環(huán)境 1. ChatGLM2-6B的P-Tuning微調(diào) ChatGLM2-6B ：https://github.com/THUDM/ChatGLM2-6B 模型地址：https://hug
2024年02月17日
瀏覽(33)
LLM-SFT，新微調(diào)數(shù)據(jù)集-MWP-Instruct(多步計(jì)算 + 一、二元方程)，微調(diào)Bloom, ChatGLM, LlaMA(支持QLoRA, TensorBoardX)
中文大模型微調(diào)(LLM-SFT), 支持模型(ChatGLM, LlaMA, Bloom), 支持(LoRA, QLoRA, DeepSpeed, UI, TensorboardX), 支持(微調(diào), 推理, 測(cè)評(píng), 接口)等. https://github.com/yongzhuo/LLM-SFT 原始數(shù)據(jù)來(lái)自https://github.com/LYH-YF/MWPToolkit 處理后的微調(diào)數(shù)據(jù)(多步計(jì)算+一/二元解方程)-MWP: https://huggingface.co/datasets/Macropodus/
2024年02月12日
瀏覽(21)
一文帶你玩轉(zhuǎn)C語(yǔ)言文件操作
作者主頁(yè)： ?paper jie的博客_CSDN博客本文作者：大家好，我是paper jie，感謝你閱讀本文，歡迎一建三連哦。本文錄入于《系統(tǒng)解析C語(yǔ)言》專欄，本專欄是針對(duì)于大學(xué)生，編程小白精心打造的。筆者用重金(時(shí)間和精力)打造，將算法基礎(chǔ)知識(shí)一網(wǎng)打盡，希望可以幫到讀者們哦
2024年02月17日
瀏覽(26)
Llama 3 開(kāi)源！手把手帶你進(jìn)行大模型推理，部署，微調(diào)和評(píng)估
節(jié)前，我們組織了一場(chǎng)算法崗技術(shù)面試討論會(huì)，邀請(qǐng)了一些互聯(lián)網(wǎng)大廠朋友、參加社招和校招面試的同學(xué)，針對(duì)算法崗技術(shù)趨勢(shì)、大模型落地項(xiàng)目經(jīng)驗(yàn)分享、新手如何入門算法崗、該如何準(zhǔn)備、面試常考點(diǎn)分享等熱門話題進(jìn)行了深入的討論。基于大模型實(shí)踐和技術(shù)交流，我們
2024年04月26日
瀏覽(24)