大語言模型
大語言模型(LLM)是指使用大量文本數據訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智能的一條重要途徑。來自百度百科
-
發(fā)展歷史
2020年9月,OpenAI授權微軟使用GPT-3模型,微軟成為全球首個享用GPT-3能力的公司。2022年,Open AI發(fā)布ChatGPT模型用于生成自然語言文本。2023年3月15日,Open AI發(fā)布了多模態(tài)預訓練大模型GPT4.0。
2023年2月,谷歌發(fā)布會公布了聊天機器人Bard,它由谷歌的大語言模型LaMDA驅動。2023年3月22日,谷歌開放Bard的公測,首先面向美國和英國地區(qū)啟動,未來逐步在其它地區(qū)上線。
2023年2月7日,百度正式宣布將推出文心一言,3月16日正式上線。文心一言的底層技術基礎為文心大模型,底層邏輯是通過百度智能云提供服務,吸引企業(yè)和機構客戶使用API和基礎設施,共同搭建AI模型、開發(fā)應用,實現產業(yè)AI普惠。
大語言模型有多強?
下面實例展示LLM的能力,以cahtGLM-6B來展示示例:
通過合適的 prompt 就能實現很多傳統(tǒng) NLP 的功能。
github:cahtGLM-6B
官網:cahtGLM
分詞
輸入:
按照下面的示例輸出結果:
輸入:今天天氣太差了
輸出:今天,天氣,太,差,了
輸入:明天要出去玩
輸出:
輸出:
- 示例2:不同的 prompt 輸出的結果有所不同
prompt1:
prompt2:
詞性標注
輸入:
詞性標注:
今天
天氣
差
輸出:
NER
- NER示例1: LLM 可以根據示例直接輸出json結果
輸入:
按照下面的示例輸出結果:
輸入:糖尿病是一種慢病
輸出:{"disease":"糖尿病"}
輸入:糖尿病的一種癥狀是多尿,還有容易餓
輸出:{"disease":"糖尿病","symptom":"多尿,容易餓"}
輸入:高血壓的癥狀包括血壓偏高、頭暈等
輸出:
輸出:
- NER示例2
輸入:
按照下面的示例輸出結果:
輸入:曾國藩是道光進士,曾任內閣學士,道光末年官至侍郎。
輸出:{"person":"曾國藩"}
輸入:李鴻章為道光二十七年(1847年)進士,早年隨業(yè)師曾國藩鎮(zhèn)壓太平天國運動與捻軍起義,并受命組建淮軍,因戰(zhàn)功擢升至直隸總督,兼北洋通商大臣,累加至文華殿大學士,封一等肅毅伯。
輸出:
輸出:
情感分類
- 示例
輸入:
按照下面的示例輸出結果:
輸入:今天天氣太差了,不舒服
輸出:{"情感":"負面"}
輸入:明天要出去玩,太好了
輸出:
輸出:
多倫對話管理
知識圖譜
- 示例
- 示例
較為復雜的推理
復雜推理還是有些問題:
數據不完整:文章來源:http://www.zghlxwxcb.cn/news/detail-694208.html
總結
總體看來,LLM 在零樣本的情況下, 選擇合適的prompt就能實現很多傳統(tǒng)NLP任務。
LLM 尤其是現在的多模態(tài)模型,是真正通向通用人工智能的基石。文章來源地址http://www.zghlxwxcb.cn/news/detail-694208.html
到了這里,關于【AI實戰(zhàn)】大語言模型(LLM)有多強?還需要做傳統(tǒng)NLP任務嗎(分詞、詞性標注、NER、情感分類、知識圖譜、多倫對話管理等)的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!