国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark

這篇具有很好參考價(jià)值的文章主要介紹了Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark,gpt,chatgpt,語(yǔ)言模型

Baichuan-13B: 一個(gè)強(qiáng)大的開(kāi)源大規(guī)模語(yǔ)言模型

標(biāo)題:Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark

Baichuan-13B是由百川智能開(kāi)發(fā)的一個(gè)開(kāi)源大規(guī)模語(yǔ)言模型項(xiàng)目,包含了130億參數(shù)。該模型在中文和英文的權(quán)威benchmark上達(dá)到了同尺寸模型的最佳效果。這個(gè)項(xiàng)目發(fā)布了兩個(gè)版本,包括預(yù)訓(xùn)練版本(Baichuan-13B-Base)和對(duì)齊版本(Baichuan-13B-Chat)。

Baichuan-13B具有以下幾個(gè)特點(diǎn):首先,它比之前的Baichuan-7B模型參數(shù)更多、尺寸更大,達(dá)到了130億參數(shù),并在高質(zhì)量的語(yǔ)料上進(jìn)行了1.4萬(wàn)億tokens的訓(xùn)練,比LLaMA-13B模型多出了40%的訓(xùn)練數(shù)據(jù)量,是目前開(kāi)源的13B尺寸模型中訓(xùn)練數(shù)據(jù)量最大的。其次,Baichuan-13B支持中英雙語(yǔ),并且使用了ALiBi位置編碼,上下文窗口長(zhǎng)度為4096。再次,該項(xiàng)目同時(shí)開(kāi)源了預(yù)訓(xùn)練模型和對(duì)齊模型,預(yù)訓(xùn)練模型作為開(kāi)發(fā)者的基礎(chǔ)模型,而對(duì)齊模型則具備強(qiáng)大的對(duì)話(huà)能力,可以直接使用且部署簡(jiǎn)單。最后,為了支持更廣大用戶(hù)的使用,該項(xiàng)目還同時(shí)開(kāi)源了int8和int4量化版本,這些版本在幾乎沒(méi)有效果損失的情況下大大降低了部署所需機(jī)器資源,甚至可以在消費(fèi)級(jí)顯卡(如Nvidia 3090)上進(jìn)行部署。

Baichuan-13B是免費(fèi)開(kāi)源且可商用的,無(wú)論是學(xué)術(shù)研究還是開(kāi)發(fā)者都可以自由使用。只需進(jìn)行官方商用許可的郵件申請(qǐng),即可免費(fèi)商用。

在各個(gè)權(quán)威的中英文benchmark上,Baichuan-13B進(jìn)行了5-shot評(píng)測(cè),其結(jié)果如下:

○ STEM:Baichuan-7B:38.2,Chinese-Alpaca-Plus-13B:35.2,Vicuna-13B:37.8

○ Social Sciences:Baichuan-7B:52.0,Chinese-Alpaca-Plus-13B:45.6,Vicuna-13B:48.2

○ Humanities:Baichuan-7B:46.2,Chinese-Alpaca-Plus-13B:40.0,Vicuna-13B:42.6

○ Others:Baichuan-7B:39.3,Chinese-Alpaca-Plus-13B:38.2,Vicuna-13B:39.9

○ Average:Baichuan-7B:42.8,Chinese-Alpaca-Plus-13B:38.8,Vicuna-13B:42.1

通過(guò)這些benchmark結(jié)果可以看出,Baichuan-13B相比其他模型,在多個(gè)領(lǐng)域的測(cè)試中取得了更好的效果。

Baichuan-13B項(xiàng)目的目標(biāo)是提供一個(gè)強(qiáng)大的開(kāi)源大規(guī)模語(yǔ)言模型,以幫助學(xué)術(shù)研究和開(kāi)發(fā)者進(jìn)行自然語(yǔ)言處理任務(wù)。無(wú)論是處理中文還是英文,Baichuan-13B都可以提供高質(zhì)量的語(yǔ)言建模和對(duì)話(huà)功能。該項(xiàng)目的開(kāi)源和免費(fèi)商用政策,使得更多的人可以充分利用這個(gè)強(qiáng)大的資源,加速他們的研究和開(kāi)發(fā)工作。

項(xiàng)目:baichuan-inc/Baichuan-13B文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-585666.html

到了這里,關(guān)于Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包