国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

快速訓練自己的大語言模型：基于LLAMA-7B的lora指令微調(diào)

2年前作者：lokvke分類：Toy博客閱讀(24)違法舉報

這篇具有很好參考價值的文章主要介紹了快速訓練自己的大語言模型：基于LLAMA-7B的lora指令微調(diào)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

前言：

系統(tǒng)：ubuntu 18.04
顯卡：A100-80G（蹭的，嘿嘿~）
（本次主要記錄如何快速進行大模型的指令微調(diào)）

1. 選用工程：lit-llama

地址：https://github.com/Lightning-AI/lit-llama

2. 下載工程

git clone https://github.com/Lightning-AI/lit-llama.git

3. 安裝環(huán)境

cd ./lit-llama

使用pip安裝依賴庫

pip install -r requirements.txt

（當然，這里可能會遇到網(wǎng)絡問題，安裝不了lightning）
可使用以下方式安裝：

下載lightning工程
解壓進入工程目錄，使用以下命令安裝
```
python setup.py install
```
查看lightning是否安裝成功：
```
pip list|grep lightning
```
（這里注意lightning的版本是2.1.0）

4. 下載LLAMA-7B模型

這里我們要基于LLAMA-7B做指令微調(diào)，所以要先下載模型權(quán)重，并作一系列轉(zhuǎn)換。

切換到 lit-llama 所在位置，使用以下命令下載權(quán)重：

python scripts/download.py --repo_id openlm-research/open_llama_7b --local_dir checkpoints/open-llama/7B

（文件有點大，需要等待一些時間）

下載完畢之后，會得到如下的文件：

5. 做模型轉(zhuǎn)換

還是切換到 lit-llama 所在位置，使用以下指令進行轉(zhuǎn)換

python scripts/convert_hf_checkpoint.py --checkpoint_dir checkpoints/open-llama/7B --model_size 7B

轉(zhuǎn)換完畢之后，在 lit-llama/checkpoints/lit-llama/7B 位置，會得到大小為26G左右的 lit-llama.pth 文件，在上一級目錄（lit-llama/checkpoints/lit-llama）還有一個tokenizer.model文件

6. 初步測試

在命令行，使用如下命令運行：

 python generate.py --prompt "Today is a"

快速訓練自己的大語言模型：基于LLAMA-7B的lora指令微調(diào)

使用中文測試，發(fā)現(xiàn)效果不好（開始胡說八道了~）

7. 為什么要進行指令微調(diào)？

因為原始的預訓練LLAMA模型是一個大語言模型（廢話~），會根據(jù)前面的單詞預測下一個詞語，如果你問它問題，它不會正確回答你，你問它一個問題，它可能會續(xù)寫一些跟你一樣的句子，例如，
Prompt為 “What is the capital of China?”，它的回復如下所示：

8. 開始進行指令微調(diào)

8.1. 數(shù)據(jù)準備

這里使用alpaca的52k指令數(shù)據(jù)進行微調(diào)，使用如下指令：
```
python scripts/prepare_alpaca.py
```
如果下載不下來的話，我們直接打開scripts/prepare_alpaca.py文件，如下所示：
直接打開鏈接 https://raw.githubusercontent.com/tloen/alpaca-lora/main/alpaca_data_cleaned_archive.json，然后全選頁面復制，再保存到新建的文件里。
得到alpaca_data_cleaned_archive.json（看名字的clean應該是清洗過的），每條指令包含"instruction"、“input”、"output"三個關鍵字，本次先不具體展開講解，如下所示：
運行指令后，還會作數(shù)據(jù)劃分，train-49759, val-2000如下所示：
最后，會在lit-llama/data/alpaca路徑下得到以下文件：

8.2 開始模型訓練

使用以下指令：
```
python finetune/lora.py
```
訓練過程如下所示:
整個訓練過程大約要1.5個小時（16:51 ~ 18:22）
訓練完畢之后，會在out/lora/alpaca得到一系列l(wèi)ora的權(quán)重文件，如下圖所示：

8.3 模型測試

使用如下指令進行提問，其中prompt為"what is the capital of China?"，
```
python generate/lora.py --prompt "what is the capital of China?"
```
得到的結(jié)果如下所示
可以看到，經(jīng)過指令微調(diào)之后，模型已經(jīng)可以正?；卮鹞覀兊膯栴}了。

（ps：其他細節(jié)可以參考工程的README，寫的很清楚~）

結(jié)束。文章來源地址http://www.zghlxwxcb.cn/news/detail-505054.html

到了這里，關于快速訓練自己的大語言模型：基于LLAMA-7B的lora指令微調(diào)的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權(quán)，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

LLMs之llama_7b_qlora：源代碼解讀inference_qlora.py(模型推理)使用LORA權(quán)重來初始化預訓練的LLAMA模型來進行文本生成(基于用戶交互輸入的上下文生成新文本)
LLMs之llama_7b_qlora：源碼解讀inference_qlora.py(模型推理)使用LORA權(quán)重來初始化預訓練的LLAMA模型來進行文本生成(基于用戶交互輸入的上下文生成新文本) 目錄
2024年02月15日
瀏覽(33)
搭建部署屬于自己的基于gpt3.5的大語言模型（基于flask+html+css+js+mysql實現(xiàn)）
本項目是一個基于GPT-3.5模型的聊天機器人網(wǎng)站，旨在為用戶提供一個簡便、直接的方式來體驗和利用GPT-3.5模型的強大功能。項目以Flask為基礎，構(gòu)建了一個完整的Web應用程序，其中包含了多個前端頁面和后端API接口，能夠處理用戶輸入并與GPT-3.5模型進行交互來生成響應。一
2024年02月07日
瀏覽(93)
Peft庫使用技巧（一）：合并基座模型與Lora模型【使用Peft庫微調(diào)基座模型（比如LLaMA-7B）后會得到Lora參數(shù)模塊，將基座模型與Lora參數(shù)合并后才能得到完整的微調(diào)后的大模型】
使用Peft庫微調(diào)基座模型（比如LLaMA-7B）后會得到Lora參數(shù)模塊，將基座模型與Lora參數(shù)合并后才能得到完整的微調(diào)后的大模型
2024年02月15日
瀏覽(20)
訓練自己的Llama 2！大模型微調(diào)技術介紹
趨動云趨動云是面向 AI 算法工程師的開發(fā)平臺，為工程師提供模型開發(fā)、模型訓練、數(shù)據(jù)和代碼管理等功能。近期有不少粉絲問算力君，趨動云是否支持大模型的訓練？當然支持！最近大火的Llama 2一出來，算力君身邊的小伙伴就已經(jīng)跑過了，本文將介紹Llama 2和相關的大模
2024年02月12日
瀏覽(19)
LLMs之llama_7b_qlora：源代碼解讀inference.py(基于合并后的權(quán)重文件進行模型推理)將基于之前合并Lora模型權(quán)重后的hl_llama_7b模型進行文本生成(基于用戶交互輸入
LLMs之llama_7b_qlora：源碼解讀inference.py(基于合并后的權(quán)重文件進行模型推理)將基于之前合并Lora模型權(quán)重后的hl_llama_7b模型進行文本生成(基于用戶交互輸入的上下文生成新文本) 目錄
2024年02月16日
瀏覽(17)
大語言模型(LLM)綜述(四)：如何適應預訓練后的大語言模型
隨著人工智能和機器學習領域的迅速發(fā)展，語言模型已經(jīng)從簡單的詞袋模型（Bag-of-Words）和N-gram模型演變?yōu)楦鼮閺碗s和強大的神經(jīng)網(wǎng)絡模型。在這一進程中，大型語言模型（LLM）尤為引人注目，它們不僅在自然語言處理（NLP）任務中表現(xiàn)出色，而且在各種跨領域應用中也展示
2024年02月08日
瀏覽(36)
大模型入局傳統(tǒng)算法，LLMZip基于LLaMA-7B實現(xiàn)1MB文本壓縮率90%！
論文鏈接： https://arxiv.org/abs/2306.04050 隨著以 ChatGPT、GPT-4為代表的AI大模型逐漸爆火進入公眾視野，各行各業(yè)都開始思考如何更好的使用和發(fā)展自己的大模型，有一些評論甚至認為大模型是以人工智能為標志的第四次產(chǎn)業(yè)革命的核心競爭產(chǎn)品。例如在5月26日的北京中關村202
2024年02月11日
瀏覽(18)
省顯存（內(nèi)存？）的大語言模型（LLMs）訓練/微調(diào)/推理方法
即使 RTX 3090 有著 24GB 的 RAM，使用一塊 RTX 3090 依然無法 fp32 精度訓練最小號的 LLaMA-6B。估算模型所需的RAM 首先，需要了解如何根據(jù)參數(shù)量估計模型大致所需的 RAM，這在實踐中有很重要的參考意義。需要通過估算設置 batch_size，設置模型精度，選擇微調(diào)方法和參數(shù)分布方法等
2024年02月09日
瀏覽(22)
圖技術在 LLM 下的應用：知識圖譜驅(qū)動的大語言模型 Llama Index
LLM 如火如荼地發(fā)展了大半年，各類大模型和相關框架也逐步成型，可被大家應用到業(yè)務實際中。在這個過程中，我們可能會遇到一類問題是：現(xiàn)有的哪些數(shù)據(jù)，如何更好地與 LLM 對接上。像是大家都在用的知識圖譜，現(xiàn)在的圖譜該如何借助大模型，發(fā)揮更大的價值呢？在本文
2024年02月15日
瀏覽(25)
LLMs之Vicuna：在Linux服務器系統(tǒng)上實Vicuna-7B本地化部署(基于facebookresearch的GitHub)進行模型權(quán)重合并(llama-7b模型與delta模型權(quán)重)、模型部
LLMs之Vicuna：在Linux服務器系統(tǒng)上實Vicuna-7B本地化部署(基于facebookresearch的GitHub)進行模型權(quán)重合并(llama-7b模型與delta模型權(quán)重)、模型部署且實現(xiàn)模型推理全流程步驟的圖文教程(非常詳細) 導讀：因為Vicuna的訓練成本很低，據(jù)說只需要$300左右，所以，還是有必要嘗試本地化部署
2024年02月06日
瀏覽(88)