ChatGPT引爆了AI行業(yè),全球的科技巨頭都先后加入這場AI大戰(zhàn),作為行業(yè)大佬的Meta也不例外,宣布推出大型語言模型LLaMA,加入到了這場由微軟、谷歌等科技巨頭主導的AI“廝殺”中。
LLaMA 模型由 Meta 的FAIR 團隊開發(fā),旨在幫助研究人員和工程師探索人工智能應用和相關功能,在生成文本、對話、總結書面材料、證明數(shù)學定理或預測蛋白質(zhì)結構等更復雜的任務方面“有很大的前景”。
該公司將提供底層代碼供用戶使用,因此用戶可以自行調(diào)整模型,并將其用于與研究相關的用例。LLaMA 模型接受了20種語言訓練,包括拉丁語和西里爾字母語言,所需的計算能力遠低于之前推出的大模型。
另根據(jù)Meta官網(wǎng)發(fā)布的論文,LLaMA目前包含70億、130億、330億和650億這4種參數(shù)規(guī)模的模型。其中,參數(shù)規(guī)模最小的LLaMA 7B也經(jīng)過了超1萬億個tokens的訓練。Meta表示,在大多數(shù)基準測試中,參數(shù)僅為十分之一的LLaMA-13B的性能優(yōu)于OpenAI推出的GPT3(175B),也即支持ChatGPT的GPT3.5的前身。LLaMA-65B也可與業(yè)內(nèi)領先的Chinchilla-70B和PaLM-540B競爭。
同ChatGPT、New Bing不同,LLaMA并不是一個任何人都可以與之對話的產(chǎn)品,也并未接入任何Meta應用。更為確切地說,該產(chǎn)品將是一個開源的“研究工具”。文章來源:http://www.zghlxwxcb.cn/news/detail-543069.html
公司CEO扎克伯格在社交媒體上表示,LLaMA旨在幫助研究人員推進研究工作,LLM(大型語言模型)在文本生成、問題回答、書面材料總結,以及自動證明數(shù)學定理、預測蛋白質(zhì)結構等更復雜的方面也有很大的發(fā)展前景。文章來源地址http://www.zghlxwxcb.cn/news/detail-543069.html
到了這里,關于AI大戰(zhàn),Meta發(fā)布大型語言模型LLaMA的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!