国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<dfn id="zjtqy"><form id="zjtqy"><menu id="zjtqy"></menu></form></dfn>

Baichuan-13B：130億參數(shù)的開(kāi)源語(yǔ)言模型，引領(lǐng)中文和英文benchmark

2年前作者：無(wú)數(shù)據(jù)不智能分類(lèi)：Toy博客閱讀(29)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Baichuan-13B：130億參數(shù)的開(kāi)源語(yǔ)言模型，引領(lǐng)中文和英文benchmark。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Baichuan-13B：130億參數(shù)的開(kāi)源語(yǔ)言模型，引領(lǐng)中文和英文benchmark,gpt,chatgpt,語(yǔ)言模型

Baichuan-13B: 一個(gè)強(qiáng)大的開(kāi)源大規(guī)模語(yǔ)言模型

標(biāo)題：Baichuan-13B：130億參數(shù)的開(kāi)源語(yǔ)言模型，引領(lǐng)中文和英文benchmark

Baichuan-13B是由百川智能開(kāi)發(fā)的一個(gè)開(kāi)源大規(guī)模語(yǔ)言模型項(xiàng)目，包含了130億參數(shù)。該模型在中文和英文的權(quán)威benchmark上達(dá)到了同尺寸模型的最佳效果。這個(gè)項(xiàng)目發(fā)布了兩個(gè)版本，包括預(yù)訓(xùn)練版本(Baichuan-13B-Base)和對(duì)齊版本(Baichuan-13B-Chat)。

Baichuan-13B具有以下幾個(gè)特點(diǎn)：首先，它比之前的Baichuan-7B模型參數(shù)更多、尺寸更大，達(dá)到了130億參數(shù)，并在高質(zhì)量的語(yǔ)料上進(jìn)行了1.4萬(wàn)億tokens的訓(xùn)練，比LLaMA-13B模型多出了40%的訓(xùn)練數(shù)據(jù)量，是目前開(kāi)源的13B尺寸模型中訓(xùn)練數(shù)據(jù)量最大的。其次，Baichuan-13B支持中英雙語(yǔ)，并且使用了ALiBi位置編碼，上下文窗口長(zhǎng)度為4096。再次，該項(xiàng)目同時(shí)開(kāi)源了預(yù)訓(xùn)練模型和對(duì)齊模型，預(yù)訓(xùn)練模型作為開(kāi)發(fā)者的基礎(chǔ)模型，而對(duì)齊模型則具備強(qiáng)大的對(duì)話(huà)能力，可以直接使用且部署簡(jiǎn)單。最后，為了支持更廣大用戶(hù)的使用，該項(xiàng)目還同時(shí)開(kāi)源了int8和int4量化版本，這些版本在幾乎沒(méi)有效果損失的情況下大大降低了部署所需機(jī)器資源，甚至可以在消費(fèi)級(jí)顯卡（如Nvidia 3090）上進(jìn)行部署。

Baichuan-13B是免費(fèi)開(kāi)源且可商用的，無(wú)論是學(xué)術(shù)研究還是開(kāi)發(fā)者都可以自由使用。只需進(jìn)行官方商用許可的郵件申請(qǐng)，即可免費(fèi)商用。

在各個(gè)權(quán)威的中英文benchmark上，Baichuan-13B進(jìn)行了5-shot評(píng)測(cè)，其結(jié)果如下：

○ STEM：Baichuan-7B：38.2，Chinese-Alpaca-Plus-13B：35.2，Vicuna-13B：37.8

○ Social Sciences：Baichuan-7B：52.0，Chinese-Alpaca-Plus-13B：45.6，Vicuna-13B：48.2

○ Humanities：Baichuan-7B：46.2，Chinese-Alpaca-Plus-13B：40.0，Vicuna-13B：42.6

○ Others：Baichuan-7B：39.3，Chinese-Alpaca-Plus-13B：38.2，Vicuna-13B：39.9

○ Average：Baichuan-7B：42.8，Chinese-Alpaca-Plus-13B：38.8，Vicuna-13B：42.1

通過(guò)這些benchmark結(jié)果可以看出，Baichuan-13B相比其他模型，在多個(gè)領(lǐng)域的測(cè)試中取得了更好的效果。

Baichuan-13B項(xiàng)目的目標(biāo)是提供一個(gè)強(qiáng)大的開(kāi)源大規(guī)模語(yǔ)言模型，以幫助學(xué)術(shù)研究和開(kāi)發(fā)者進(jìn)行自然語(yǔ)言處理任務(wù)。無(wú)論是處理中文還是英文，Baichuan-13B都可以提供高質(zhì)量的語(yǔ)言建模和對(duì)話(huà)功能。該項(xiàng)目的開(kāi)源和免費(fèi)商用政策，使得更多的人可以充分利用這個(gè)強(qiáng)大的資源，加速他們的研究和開(kāi)發(fā)工作。

項(xiàng)目：baichuan-inc/Baichuan-13B文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-585666.html

到了這里，關(guān)于Baichuan-13B：130億參數(shù)的開(kāi)源語(yǔ)言模型，引領(lǐng)中文和英文benchmark的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【AIGC】Baichuan2-13B-Chat模型微調(diào)
微調(diào)框架：LLaMA-Efficient-Tuning 訓(xùn)練機(jī)器：4*RTX3090TI (24G顯存) python環(huán)境：python3.8, 安裝 requirements.txt 依賴(lài)包 1、準(zhǔn)備數(shù)據(jù)集 2、訓(xùn)練及測(cè)試 1）創(chuàng)建模型輸出目錄 2）創(chuàng)建deepspeed配置文件目錄 3）創(chuàng)建deepspeed配置文件 4）訓(xùn)練模型測(cè)試模型 3、注意事項(xiàng)： 1）我用的是3090TI顯卡，使用
2024年02月08日
瀏覽(51)
開(kāi)源模型應(yīng)用落地-baichuan2模型小試-入門(mén)篇（三）
? ? ? ? 相信您已經(jīng)學(xué)會(huì)了如何在Windows環(huán)境下以最低成本、無(wú)需GPU的情況下運(yùn)行baichuan2大模型?，F(xiàn)在，讓我們進(jìn)一步探索如何在Linux環(huán)境下，并且擁有GPU的情況下運(yùn)行baichuan2大模型，以提升性能和效率。 ? ? CentOS是一種基于Linux的自由開(kāi)源操作系統(tǒng)。它是從Red Hat Enterprise Li
2024年04月17日
瀏覽(38)
NLP（六十一）使用Baichuan-13B-Chat模型構(gòu)建智能文檔問(wèn)答助手
??在文章NLP（六十）Baichuan-13B-Chat模型使用體驗(yàn)中，我們介紹了Baichuan-13B-Chat模型及其在向量嵌入和文檔閱讀上的初步嘗試。 ??本文將詳細(xì)介紹如何使用Baichuan-13B-Chat模型來(lái)構(gòu)建智能文檔問(wèn)答助手。文檔問(wèn)答流程 ??智能文檔問(wèn)答助手的流程圖如下：文檔加載（Document
2024年02月15日
瀏覽(32)
中文LLaMa和Alpaca大語(yǔ)言模型開(kāi)源方案 | 擴(kuò)充中文詞表 & 針對(duì)中文語(yǔ)料進(jìn)行高效編碼
歡迎關(guān)注『CVHub』官方微信公眾號(hào)！ Title: Efficient and Effective Text Encoding for Chinese Llama and Alpaca PDF: https://arxiv.org/pdf/2304.08177v1.pdf Code: https://github.com/ymcui/Chinese-LLaMA-Alpaca 大型語(yǔ)言模型 LLM ，如ChatGPT和GPT-4，已經(jīng)徹底改變了自然語(yǔ)言處理研究。然而， LLMs 的昂貴訓(xùn)練和部署對(duì)于透明
2024年02月09日
瀏覽(33)
【AI人工智能】LLM 開(kāi)源中文大語(yǔ)言模型集合
整理開(kāi)源的中文大語(yǔ)言模型，以規(guī)模較小、可私有化部署、訓(xùn)練成本較低的模型為主，包括底座模型，垂直領(lǐng)域微調(diào)及應(yīng)用，數(shù)據(jù)集與教程等。目錄 1.?Model 2.?Application 3.?Dataset 4.?Evaluation 5.?Tutorial 6.?R
2024年02月09日
瀏覽(37)
AI最新開(kāi)源：LMSYS Org開(kāi)源LongChat、法律大語(yǔ)言模型ChatLaw、中文醫(yī)療對(duì)話(huà)模型扁鵲
一周SOTA：LMSYS Org開(kāi)源LongChat、法律大語(yǔ)言模型ChatLaw、中文醫(yī)療對(duì)話(huà)模型扁鵲最近UC伯克利主導(dǎo)的LMSYS Org發(fā)布了大語(yǔ)言模型排位賽，刷新了大家對(duì)當(dāng)下比較出名的開(kāi)源和「閉源」聊天機(jī)器人的認(rèn)識(shí)。傳送門(mén)：UC伯克利LLM排行榜再更新！GPT-4穩(wěn)居第一，Vicuna-33B登頂開(kāi)源模型第一
2024年02月12日
瀏覽(23)
中文大語(yǔ)言模型 Llama-2 7B（或13B）本地化部署（國(guó)內(nèi)云服務(wù)器、GPU單卡16GB、中文模型、WEB頁(yè)面TextUI、簡(jiǎn)單入門(mén)）
? ? ? ? 本文目的是讓大家先熟悉模型的部署，簡(jiǎn)單入門(mén)；所以只需要很小的算力，單臺(tái)服務(wù)器單GPU顯卡（顯存不低于12GB），操作系統(tǒng)需要安裝 Ubuntu 18.04。 ? ? ? ? 準(zhǔn)備一臺(tái)服務(wù)器單張英偉達(dá)GPU顯卡（顯存不低于12GB），操作系統(tǒng)需要安裝 Ubuntu 18.04 （具體安裝過(guò)程忽略）
2024年02月08日
瀏覽(22)
【AIGC】BaiChuan7B開(kāi)源大模型介紹、部署以及創(chuàng)建接口服務(wù)
baichuan-7B 是由百川智能開(kāi)發(fā)的一個(gè)開(kāi)源的大規(guī)模預(yù)訓(xùn)練模型?；赥ransformer結(jié)構(gòu)，在大約1.2萬(wàn)億tokens上訓(xùn)練的70億參數(shù)模型，支持中英雙語(yǔ)，上下文窗口長(zhǎng)度為4096。在標(biāo)準(zhǔn)的中文和英文權(quán)威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。 huggingface github 系統(tǒng)：centos7.8.2003 GPU：
2024年02月09日
瀏覽(21)
【AI開(kāi)源大模型】GLM-130B：開(kāi)放的中英雙語(yǔ)預(yù)訓(xùn)練模型
2024年02月07日
瀏覽(26)
中文版開(kāi)源Llama 2同時(shí)有了語(yǔ)言、多模態(tài)大模型，完全可商用
可以說(shuō)，AI 初創(chuàng)公司 LinkSoul.Al 的這些開(kāi)源項(xiàng)目讓海外開(kāi)源大模型在國(guó)內(nèi)的普及和推廣速度與國(guó)際幾乎保持了一致。 7 月 19 日，Meta 終于發(fā)布了免費(fèi)可商用版本?Llama 2，讓開(kāi)源大模型領(lǐng)域的格局發(fā)生了巨大變化。 Llama 2 模型系列包含 70 億、130 億和 700 億三種參數(shù)變體，相比上
2024年02月14日
瀏覽(29)

<strong id="2v3il"><form id="2v3il"></form></strong>

<acronym id="2v3il"></acronym>