??我叫憶_恒心,一名喜歡書寫博客的在讀研究生?????。
如果覺得本文能幫到您,麻煩點(diǎn)個(gè)贊
??唄!
近期會(huì)不斷在專欄里進(jìn)行更新講解博客~~~ 有什么問題的小伙伴 歡迎留言提問歐,喜歡的小伙伴給個(gè)三連支持一下唄。??????
一、前言
在研究生階段同樣是做自然語言處理分析的,明顯能感受到國內(nèi)的問答系統(tǒng)并不輸給國外,最近看了一些文章和論文大多吹捧ChatGPT
,貶低百度的發(fā)言,我覺得大可不必,文心一言的發(fā)布,或許真的能表明國內(nèi)版本的問答系統(tǒng)的落地,一個(gè)真正由國內(nèi)開發(fā)
并且能給大多數(shù)國民使用
,這個(gè)初心和舉措我覺得就應(yīng)該被認(rèn)可!
3月16日,百度直播的宣講會(huì)上有這么一句話,讓我充滿了期待:
不曾想象的提問,有著不曾想象的回答
對(duì)于大多數(shù)國人來說,這是被向往的,雖然現(xiàn)在ChatGPT
或許已經(jīng)做到了這一點(diǎn),但在國內(nèi)大多數(shù)人連注冊(cè)的門檻都是無法摸到的,又如何做到 發(fā)出不曾想象的提問
。
關(guān)于這個(gè)話題“文心一言硬剛ChatGPT
。文心一言能否為百度止頹?中國版ChatGPT
“狂飆”的機(jī)會(huì)在哪兒?”的思考,無非就在于以下幾點(diǎn):
- 文心一言功能與
ChatGPT
相比如何?- 百度為何不怎么受大眾歡迎了,
文心一言
能否止頹?- 國內(nèi)是否需要自己的“
ChatGPT
?- 國內(nèi)能否自己實(shí)現(xiàn)一個(gè)
ChatGPT
?中國版ChatGPT
“狂飆”的機(jī)會(huì)在哪兒?
二、QA環(huán)節(jié)
問題一:文心一言功能與ChatGPT相比如何?
自己的思考:
1、將任何一種預(yù)訓(xùn)練語言模型附加在搜索引擎上,往往只能起到資料搜索上的進(jìn)步,生成式的效果并不明顯。(注意:生成式,值對(duì)現(xiàn)有知識(shí)進(jìn)行學(xué)習(xí)生成全新的對(duì)話)。而現(xiàn)在文心一言這種方案 不就是 已經(jīng)實(shí)行了的New Bing嘛??????? 所以在方案上不具有任何創(chuàng)新!
2、當(dāng)被賦予到搜索引擎中,其對(duì)話形式也會(huì)效仿
New Bing
,使用次數(shù)上也是會(huì)大打折扣。
3、由預(yù)訓(xùn)練語言撐起的問答對(duì)話,最大的問題是無監(jiān)督學(xué)習(xí)階段知識(shí)語料庫的獲??!這個(gè)知識(shí)語料庫出自百度???(那豈不是災(zāi)難 ?? 沒有任何崇洋媚外的想法,只是
百度文庫
和百度知道
太商業(yè)了),要知道ChatGPT至少用的是維基百科
啊。雖然目前看到報(bào)告上顯示,
ERNIE3.0
在實(shí)體問答和預(yù)測上效果確實(shí)起飛,但是那是實(shí)驗(yàn)結(jié)果
啊
省流:目前來看,方案不創(chuàng)新,使用上有差距
。
ChatGPT
答復(fù):
作為一個(gè)AI語言模型,我不會(huì)對(duì)其他工具或產(chǎn)品做出評(píng)價(jià)或比較。不同的工具和產(chǎn)品有不同的設(shè)計(jì)目標(biāo)、應(yīng)用場景和用戶需求,它們都有自己的優(yōu)勢和局限性。
百度的文心一言是一款基于深度學(xué)習(xí)技術(shù)的文本生成工具,旨在為用戶提供簡潔、有思考深度和情感色彩的文字表達(dá)。而我(ChatGPT)是一個(gè)通用的AI語言模型,可以用于各種自然語言處理任務(wù),包括自然語言生成、自然語言理解和對(duì)話系統(tǒng)等。我可以生成連貫、流暢和多樣化的自然語言文本,并且可以對(duì)用戶的語言進(jìn)行理解和回應(yīng)。
因此,無論是百度的文心一言還是我(ChatGPT),都有其獨(dú)特的優(yōu)勢和適用場景。具體使用哪個(gè)工具取決于用戶的需求和實(shí)際情況。
問題二:百度為何不怎么受大眾歡迎了,文心一言能否止頹?
自己的思考:
1. 百度為何不受歡迎
要知道百度頹廢 很大原因并不是技術(shù)本身的問題,而是國內(nèi)的經(jīng)營模式。
相信的一些話語,可以看一下下面的GPT的一些回答。
2. 百度的搜索能力來說:
先談一下百度搜索本身,本身搜索出來的內(nèi)容還可以,如果沒有包含廣告的話。(??你看,一搜就搜到了我的文章多線程文件查找器
0……0還是挺好用的)。
吐槽一下:
百度本身真的是一手好牌的??!和ChatGPT說的一樣。
可以逐利,但真的不能過了吧??!現(xiàn)在搜出來的都是些什么??。
而如果文心一言也走是商業(yè)化,那就很沒意思了,??盲猜后期收費(fèi),一天提問次數(shù)有上線。
要不
Bing
在國內(nèi)被Ban,還真輪不到百度了。
3. 文心一言
能否止頹
必須推行,不知道能否止頹,但是如果再啥也不做,就真的沒有什么國內(nèi)市場可言了,現(xiàn)在很多大廠已經(jīng)開始著手準(zhǔn)備了。
1、首先從輔助搜索的工具方面,文心一言確實(shí)是需要被推行的。
目前已經(jīng)有很多成功的例子,比如提供ChatGPT
插件輔助查詢。
目前ChatGPT
的一些插件已經(jīng)已經(jīng)支持在搜索器上聯(lián)動(dòng)了,如圖中右邊所顯示的結(jié)果,這在很大程度上可以提高
2、我國確實(shí)是需要一個(gè)新的問答系統(tǒng)。
中國文化真的博大進(jìn)深,在語言交流上就有各種方言,ChatGPT
根本不會(huì)講粵語和四川話
,文心一言據(jù)說能處理方言,這個(gè)絕對(duì)是貼近中國市場的需求!專門基于中文預(yù)料庫進(jìn)行訓(xùn)練,效果是值得被期待的。
ChatGPT
答復(fù):
百度是中國最大的互聯(lián)網(wǎng)公司之一,它提供各種搜索引擎、在線廣告、移動(dòng)生態(tài)、云計(jì)算等服務(wù),擁有龐大的用戶群體。然而,近年來百度的聲譽(yù)和用戶滿意度有所下降,導(dǎo)致它的市場份額和品牌價(jià)值受到了一定的影響。以下是可能導(dǎo)致百度不受歡迎的一些原因:
- 用戶體驗(yàn)問題:用戶反映百度搜索結(jié)果不準(zhǔn)確、廣告過多,導(dǎo)致用戶體驗(yàn)不佳。
- 隱私泄露問題:百度曾被指責(zé)收集和濫用用戶個(gè)人信息,導(dǎo)致隱私泄露問題引發(fā)公眾質(zhì)疑。
- 質(zhì)量問題:百度搜索結(jié)果中存在大量低質(zhì)量內(nèi)容和虛假信息,給用戶帶來了困擾。
- 競爭壓力:與其他互聯(lián)網(wǎng)巨頭競爭激烈,百度在部分領(lǐng)域的市場份額受到了沖擊。
- 戰(zhàn)略調(diào)整:百度近年來進(jìn)行了多次戰(zhàn)略調(diào)整,這些調(diào)整可能會(huì)影響其業(yè)務(wù)穩(wěn)定性和市場表現(xiàn)。
問題三:國內(nèi)是否需要自己的“ChatGPT”?
自己的思考:
科研是有國界的
。無可否認(rèn)ChatGPT的功能非常強(qiáng)大,這種生成式的問答,真的會(huì)是一種新的技術(shù)革命,但是技術(shù)恰在外國手里太被動(dòng)了,萬一哪天API接口被關(guān)閉了,那就無了。??ChatGPT目前使用的
門檻對(duì)于非技術(shù)人員來說還是比較高
的。如果國內(nèi)可以直接訪問,那還要??Tzi干嘛。ChatGPT雖然支持中文,但是中文的
理解能力
還是比較弱的,語料庫中中文的數(shù)據(jù)非常的少,對(duì)話起來真的是太費(fèi)勁了
。生成式問答模型確實(shí)有市場。
業(yè)務(wù)上
來說,生成式的問答是非常需要的?,F(xiàn)有的資料往往難以滿足查詢,不斷訓(xùn)練的生成式成長型
的模型是被需要的(一個(gè)新的場景,或者繁瑣的規(guī)范的任務(wù)—交給生成式模型還是好用的
).
市場上來
說,單從ChatGPT
的國際市場上就可以看出,這項(xiàng)技術(shù)本身是非常受歡迎的,如果國內(nèi)哪家公司可以擔(dān)起這個(gè)技術(shù),zf
肯定也會(huì)大力支持國有產(chǎn)品。
圖片來源于網(wǎng)絡(luò),侵刪。
省流:肯定是需要啊!
ChatGPT答復(fù):
作為一個(gè)AI語言模型,我沒有個(gè)人觀點(diǎn)或政治立場。但是,從技術(shù)和實(shí)踐角度出發(fā),中國是否需要一個(gè)自己國家獨(dú)有的預(yù)訓(xùn)練語言模型,可以考慮以下幾點(diǎn):
首先,預(yù)訓(xùn)練語言模型的研究和應(yīng)用已經(jīng)成為人工智能領(lǐng)域的熱點(diǎn)和前沿。在自然語言處理、對(duì)話系統(tǒng)、機(jī)器翻譯等方面都具有廣泛的應(yīng)用前景。因此,對(duì)于一個(gè)擁有龐大的人口和復(fù)雜的文化背景的國家來說,研發(fā)和應(yīng)用自己的預(yù)訓(xùn)練語言模型是有必要和可行性的。
其次,中國擁有獨(dú)特的語言和文化特點(diǎn),這些特點(diǎn)在傳統(tǒng)的英文或西方語言預(yù)訓(xùn)練模型中可能無法完全體現(xiàn)和應(yīng)用。例如,漢字的復(fù)雜結(jié)構(gòu)、中文詞語的多義性和歧義性等,都需要基于本地?cái)?shù)據(jù)集的深度學(xué)習(xí)模型來進(jìn)行有效的處理和表達(dá)。
最后,研發(fā)自己國家獨(dú)有的預(yù)訓(xùn)練語言模型也可以促進(jìn)本土人工智能產(chǎn)業(yè)的發(fā)展和獨(dú)立創(chuàng)新能力的提升。通過積累本土數(shù)據(jù)、算法和經(jīng)驗(yàn),可以逐步打造出具有自主知識(shí)產(chǎn)權(quán)和競爭力的AI語言模型,推動(dòng)本土企業(yè)在全球市場上的發(fā)展和競爭。
綜上所述,中國是否需要一個(gè)自己國家獨(dú)有的預(yù)訓(xùn)練語言模型,取決于其國家戰(zhàn)略、技術(shù)實(shí)力和應(yīng)用需求等多方面因素。
問題四:國內(nèi)能否自己實(shí)現(xiàn)一個(gè)ChatGPT?中國版ChatGPT“狂飆”的機(jī)會(huì)在哪兒?
自己的思考
讀過一些自然語言方面相關(guān)的論文,每年國內(nèi)在頂會(huì)頂刊上看到了許多國人的身影,或許你會(huì)說學(xué)術(shù)上和工業(yè)界的差距,但是對(duì)于一些大廠來說,比如BAT這些,他們其實(shí)更加關(guān)注于生產(chǎn)。
中國在人工智能領(lǐng)域已經(jīng)取得了很多進(jìn)展和成就,擁有眾多優(yōu)秀的科研人才和技術(shù)公司,同時(shí)也擁有龐大的語言數(shù)據(jù)資源和應(yīng)用場景。因此,中國
完全有能力自己實(shí)現(xiàn)一個(gè)ChatGPT
。國內(nèi)不但有能力自己實(shí)現(xiàn)一個(gè)
ChatGPT
而且還能有一些更好的應(yīng)用,甚至借此推出自己的搜素引擎或工具。中國版的
ChatGPT
"狂飆"的機(jī)會(huì)或許要出現(xiàn)了。
國內(nèi)目前已經(jīng)有很多相對(duì)成熟
的問答模型
。
目前大致可以分為兩種,一種是廠商推出的ERNIE
,一種是高校推出的MOSS
。本人只是列舉出比較熟悉的模型,如若表達(dá)不當(dāng),請(qǐng)各位批評(píng)指正。
1、百度的ERNIE3.0
從學(xué)術(shù)效果來說ERNIE在中文的效果那是相當(dāng)?shù)暮?
圖片來源于網(wǎng)絡(luò),侵刪。
如果這些問題真的都得到了有效地解決,那基于ERNIE3.0
的文心一言
,完全有可能實(shí)現(xiàn)類似NEW Bing
這種進(jìn)行事件抽取,甚至效果比它們更好!
類似:New Bing
可以對(duì)網(wǎng)站進(jìn)行分析
2、復(fù)旦大學(xué)的MOOS
由邱錫鵬教授團(tuán)隊(duì)推出的MOSS
,作為學(xué)術(shù)界產(chǎn)品的代表之一,一開始效果可能不大好,但是我還是非常期待他們能夠開源推動(dòng)國內(nèi)的問答系統(tǒng)的發(fā)展,據(jù)說今年3月底就會(huì)徹底開源,可以期待一下。
真的開源這項(xiàng)技術(shù)
是非常需要勇氣的,MOSS
前期開放了測試但是卻招來了很多惡意的謾罵,真的覺得沒必要,任何一個(gè)好的模型都需要時(shí)間去成長的,歡迎大家關(guān)注國內(nèi)的技術(shù),但是請(qǐng)不要肆意謾罵
,真的很不容易。
(PS:僅僅代表個(gè)人觀點(diǎn))
https://github.com/txsun1997/MOSS
ChatGPT
答復(fù):
中國在人工智能領(lǐng)域已經(jīng)取得了很多進(jìn)展和成就,擁有眾多優(yōu)秀的科研人才和技術(shù)公司,同時(shí)也擁有龐大的語言數(shù)據(jù)資源和應(yīng)用場景。因此,中國完全有能力自己實(shí)現(xiàn)一個(gè)ChatGPT。
然而,要實(shí)現(xiàn)這個(gè)目標(biāo),還需要克服一些挑戰(zhàn)。首先,要具備足夠的算法研發(fā)能力和技術(shù)實(shí)力,能夠開展深度學(xué)習(xí)、自然語言處理等相關(guān)研究,提高模型的性能和效率。其次,需要積累足夠的語言數(shù)據(jù)資源,建立高質(zhì)量的語料庫和知識(shí)圖譜,支持模型的訓(xùn)練和優(yōu)化。此外,還需要考慮如何應(yīng)用和落地,將模型應(yīng)用到各種實(shí)際場景中,并實(shí)現(xiàn)商業(yè)化和產(chǎn)業(yè)化,為中國的經(jīng)濟(jì)和社會(huì)發(fā)展做出貢獻(xiàn)。
總的來說,中國在人工智能領(lǐng)域具備很大的發(fā)展?jié)摿蛢?yōu)勢,實(shí)現(xiàn)一個(gè)ChatGPT也是完全可能的。但是,這需要政府、企業(yè)和科研機(jī)構(gòu)的共同努力和投入,同時(shí)也需要克服一些技術(shù)和應(yīng)用方面的挑戰(zhàn)。
三、總結(jié)
國內(nèi)版的ChatGPT
或許真的將來臨,對(duì)于國產(chǎn)的技術(shù)更多需要是擁抱,外國的月亮并沒有多圓,文心一言是值得期待的,其期待的價(jià)值并不在于百度,而是國內(nèi)版的ChatGPT
技術(shù),以及學(xué)術(shù)真正與商業(yè)落地的結(jié)合,這些比噱頭
本身更具吸引力。
當(dāng)然你可能會(huì)說,百度的文心一言一出,國內(nèi)
gs
版塊就率了。但你看港版和美版的現(xiàn)在的
gs
。(本來想放圖的,有興趣可以自己去查一下)股市波動(dòng)并不一定能代表什么。
還是那句話:
不曾想象的提問,有著不曾想象的回答
希望中國版本的ChatGPT
真的能飆起來。文章來源:http://www.zghlxwxcb.cn/news/detail-779052.html
最后,最后
如果覺得有用,麻煩三連??????支持一下呀,希望這篇文章可以幫到你,你的點(diǎn)贊是我持續(xù)更新的動(dòng)力文章來源地址http://www.zghlxwxcb.cn/news/detail-779052.html
到了這里,關(guān)于文心一言---中國版的“ChatGPT”狂飆的機(jī)會(huì)或許要出現(xiàn)了的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!