Baichuan-13B: 一個(gè)強(qiáng)大的開(kāi)源大規(guī)模語(yǔ)言模型
標(biāo)題:Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark
Baichuan-13B是由百川智能開(kāi)發(fā)的一個(gè)開(kāi)源大規(guī)模語(yǔ)言模型項(xiàng)目,包含了130億參數(shù)。該模型在中文和英文的權(quán)威benchmark上達(dá)到了同尺寸模型的最佳效果。這個(gè)項(xiàng)目發(fā)布了兩個(gè)版本,包括預(yù)訓(xùn)練版本(Baichuan-13B-Base)和對(duì)齊版本(Baichuan-13B-Chat)。
Baichuan-13B具有以下幾個(gè)特點(diǎn):首先,它比之前的Baichuan-7B模型參數(shù)更多、尺寸更大,達(dá)到了130億參數(shù),并在高質(zhì)量的語(yǔ)料上進(jìn)行了1.4萬(wàn)億tokens的訓(xùn)練,比LLaMA-13B模型多出了40%的訓(xùn)練數(shù)據(jù)量,是目前開(kāi)源的13B尺寸模型中訓(xùn)練數(shù)據(jù)量最大的。其次,Baichuan-13B支持中英雙語(yǔ),并且使用了ALiBi位置編碼,上下文窗口長(zhǎng)度為4096。再次,該項(xiàng)目同時(shí)開(kāi)源了預(yù)訓(xùn)練模型和對(duì)齊模型,預(yù)訓(xùn)練模型作為開(kāi)發(fā)者的基礎(chǔ)模型,而對(duì)齊模型則具備強(qiáng)大的對(duì)話(huà)能力,可以直接使用且部署簡(jiǎn)單。最后,為了支持更廣大用戶(hù)的使用,該項(xiàng)目還同時(shí)開(kāi)源了int8和int4量化版本,這些版本在幾乎沒(méi)有效果損失的情況下大大降低了部署所需機(jī)器資源,甚至可以在消費(fèi)級(jí)顯卡(如Nvidia 3090)上進(jìn)行部署。
Baichuan-13B是免費(fèi)開(kāi)源且可商用的,無(wú)論是學(xué)術(shù)研究還是開(kāi)發(fā)者都可以自由使用。只需進(jìn)行官方商用許可的郵件申請(qǐng),即可免費(fèi)商用。
在各個(gè)權(quán)威的中英文benchmark上,Baichuan-13B進(jìn)行了5-shot評(píng)測(cè),其結(jié)果如下:
○ STEM:Baichuan-7B:38.2,Chinese-Alpaca-Plus-13B:35.2,Vicuna-13B:37.8
○ Social Sciences:Baichuan-7B:52.0,Chinese-Alpaca-Plus-13B:45.6,Vicuna-13B:48.2
○ Humanities:Baichuan-7B:46.2,Chinese-Alpaca-Plus-13B:40.0,Vicuna-13B:42.6
○ Others:Baichuan-7B:39.3,Chinese-Alpaca-Plus-13B:38.2,Vicuna-13B:39.9
○ Average:Baichuan-7B:42.8,Chinese-Alpaca-Plus-13B:38.8,Vicuna-13B:42.1
通過(guò)這些benchmark結(jié)果可以看出,Baichuan-13B相比其他模型,在多個(gè)領(lǐng)域的測(cè)試中取得了更好的效果。
Baichuan-13B項(xiàng)目的目標(biāo)是提供一個(gè)強(qiáng)大的開(kāi)源大規(guī)模語(yǔ)言模型,以幫助學(xué)術(shù)研究和開(kāi)發(fā)者進(jìn)行自然語(yǔ)言處理任務(wù)。無(wú)論是處理中文還是英文,Baichuan-13B都可以提供高質(zhì)量的語(yǔ)言建模和對(duì)話(huà)功能。該項(xiàng)目的開(kāi)源和免費(fèi)商用政策,使得更多的人可以充分利用這個(gè)強(qiáng)大的資源,加速他們的研究和開(kāi)發(fā)工作。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-585666.html
項(xiàng)目:baichuan-inc/Baichuan-13B文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-585666.html
到了這里,關(guān)于Baichuan-13B:130億參數(shù)的開(kāi)源語(yǔ)言模型,引領(lǐng)中文和英文benchmark的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!