3月16日,“文心一言”沒(méi)有在問(wèn)答環(huán)節(jié) “翻車”,因?yàn)?,百度?chuàng)始人李彥宏在開發(fā)會(huì)現(xiàn)場(chǎng)展示的這個(gè)自然語(yǔ)言大模型產(chǎn)品,測(cè)試的過(guò)程和結(jié)果是提前錄制好的。
“擺拍”的測(cè)試Demo里,文心一言能用中文回答問(wèn)題,能續(xù)寫《三體》,能理解“洛陽(yáng)紙貴”,能計(jì)算“雞兔同籠”的數(shù)學(xué)問(wèn)題并給出推算過(guò)程,還能生成圖片、語(yǔ)音甚至視頻??瓷先ネ?qiáng)大,但也僅限于看上去,遠(yuǎn)沒(méi)有更早一天OpenAI直接演示GPT-4模型時(shí)帶來(lái)的全網(wǎng)驚艷。
展示看似穩(wěn)妥,但沒(méi)保住股價(jià)。李彥宏登臺(tái)后,港股百度集團(tuán)股價(jià)從130港元開跌,22分鐘后跌幅超9%至120港元,發(fā)布會(huì)結(jié)束后,百度股價(jià)也沒(méi)能回到130港元。
整場(chǎng)發(fā)布會(huì),文心一言沒(méi)有真實(shí)互動(dòng)、沒(méi)有技術(shù)數(shù)據(jù)細(xì)節(jié)、沒(méi)有與其他大模型的對(duì)比,李彥宏與百度CEO王海峰一人一套PPT,公眾一個(gè)多月的期待落空。當(dāng)下,王海峰宣布,“邀測(cè)開啟”,需要邀請(qǐng)碼。
這意味著,普羅大眾還無(wú)法體驗(yàn)文心一言。而那邊廂,GPT-4已經(jīng)被嵌入到ChatGPT和搜索引擎Bing,讓AI技術(shù)直抵普通人。
相較而言,百度對(duì)文心一言更有信心的領(lǐng)域似乎在產(chǎn)業(yè),李彥宏和王海峰都強(qiáng)調(diào)了自然語(yǔ)言大模型對(duì)“千行萬(wàn)業(yè)”的影響,這也是它與ChatGPT的區(qū)別之一,后者的“現(xiàn)象級(jí)”、“殺手級(jí)”評(píng)價(jià)純來(lái)源于用戶“自來(lái)水”。
問(wèn)答演示系提前錄制 股價(jià)應(yīng)聲大跌
李彥宏一上臺(tái)就給“文心一言”定了一個(gè)調(diào)——這個(gè)基于文心大模型底層的產(chǎn)品在公眾的期待中,對(duì)標(biāo)的是ChatGPT甚至GPT-4,“門檻很高?!?/p>
他話鋒一轉(zhuǎn),巧妙地避開了百度與OpenAI的比較,而是把對(duì)比放在了全球大廠的范疇里,“百度是第一個(gè)發(fā)布的,大家知道微軟是直接調(diào)用OpenAI,谷歌、Meta、英偉達(dá)都沒(méi)有真正發(fā)布同類型的、同級(jí)別的產(chǎn)品?!边@句話沒(méi)說(shuō)完,李彥宏清了下嗓子,一如他在過(guò)往發(fā)布會(huì)上一樣,略顯緊張。
后來(lái)的15分鐘里,李彥宏用Demo展示了文心一言的五大能力:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成。對(duì)應(yīng)每個(gè)能力,他以文字的形式輸入了不同的、有上下文聯(lián)系的需求。
比如,展現(xiàn)文學(xué)創(chuàng)作能力時(shí),他讓文心一言總結(jié)《三體》核心內(nèi)容后,提出從哲學(xué)的角度續(xù)寫《三體》的要求;展現(xiàn)商業(yè)文案創(chuàng)作時(shí),他讓文心一言按企業(yè)業(yè)務(wù)給公司起名、生成Slogan、寫公司成立的新聞稿;在展示梳理邏輯推算時(shí),李彥宏用小學(xué)生們躲不開的“雞兔同籠”數(shù)學(xué)題為例,甚至故意輸錯(cuò)了題干,文心一言指出有錯(cuò)后,在修改的題干后給出了正確答案和解題過(guò)程。
此時(shí),發(fā)布會(huì)直播剛好進(jìn)入到第21分鐘,面向全網(wǎng),李彥宏突然解釋了一句:演示不是現(xiàn)場(chǎng)進(jìn)行的,而是提前錄下來(lái)的,“因?yàn)樾枰斎牒芏嘣~,為了節(jié)省時(shí)間?!?/p>
此話一出,全網(wǎng)嘩然,“原來(lái)是擺拍的?!?分鐘后,港股百度集團(tuán)股價(jià)直接下挫至120港元,較發(fā)布會(huì)14點(diǎn)開始時(shí)的130港元跌超9%。
百度港股股價(jià)在發(fā)布會(huì)期間大跌
“擺拍”的測(cè)試Demo繼續(xù)演示了文心一言的“強(qiáng)大”:解答“洛陽(yáng)紙貴”在當(dāng)時(shí)到底有多貴,能拿這個(gè)成語(yǔ)作一首藏頭詩(shī),根植于中國(guó)的百度能拿出比其他自然語(yǔ)言大模型競(jìng)品更好的中文理解能力;它也能在輸入文字需求后生成海報(bào)(圖片)、語(yǔ)音(可以是方言)甚至視頻,即多模態(tài)生成能力。
然而,“提前錄制”這個(gè)轉(zhuǎn)折讓文心一言后續(xù)的展示效果變?nèi)趿恕?/p>
一天前,OpenAI的聯(lián)合創(chuàng)始人Greg Brockman直播演示GPT-4的多模態(tài)能力時(shí),沒(méi)有PPT,沒(méi)有酷炫的開場(chǎng)廣告,將一張手繪的“玩笑網(wǎng)站”模版草圖拍照上傳至新模型后,10秒生成了網(wǎng)站。這場(chǎng)展示不到半小時(shí),但Brockman全程與社群平臺(tái)Discord上的用戶保持互動(dòng),還隨機(jī)選擇了用戶的需求測(cè)試GPT-4。
誰(shuí)對(duì)自己的產(chǎn)品更自信,一目了然。
中文能力顯本土優(yōu)勢(shì) 跨語(yǔ)言“還在學(xué)習(xí)”
如果拋卻信心不談,那么,文心一言對(duì)標(biāo)ChatGPT或GPT-4到底能否勝出?
在數(shù)據(jù)或技術(shù)細(xì)節(jié)上,無(wú)論是李彥宏還是后來(lái)上臺(tái)解釋文心一言技術(shù)背景的CTO王海峰,都沒(méi)有在發(fā)布會(huì)現(xiàn)場(chǎng)給出具體的對(duì)比,僅提到了“5500億”這個(gè)事實(shí)量指標(biāo),而GPT-4并沒(méi)有對(duì)外披露知識(shí)數(shù)。
普通人或許無(wú)法在數(shù)據(jù)對(duì)比中得出結(jié)論。但作為中文用戶,我們將李彥宏給文心一言輸入的中文需求甩給了植入GPT-4模型的ChatGPT,這個(gè)“外國(guó)AI”也可以理解,但很容易給出錯(cuò)誤答案。
比如,做雞兔同籠數(shù)學(xué)題了錯(cuò)不說(shuō),題干錯(cuò)誤也未能指出;將成語(yǔ)“洛陽(yáng)紙貴”解釋成“高分考卷在洛陽(yáng)被大量復(fù)制、傳閱”,“表示名貴、珍重、有價(jià)值”,屬于沒(méi)讀過(guò)《晉書·左思傳》里的《三都賦》典故,不知這個(gè)成語(yǔ)原意是比喻“著作風(fēng)行”之意了。
ChatGPT似乎在從字面上理解中國(guó)成語(yǔ)
有趣的是,ChatGPT又回答出“洛陽(yáng)紙貴”在現(xiàn)代經(jīng)濟(jì)學(xué)原理中代表“供求關(guān)系”的引申義。當(dāng)它用這個(gè)成語(yǔ)作藏頭詩(shī)時(shí),前面三個(gè)字都藏頭入詩(shī)了,但“貴”寫成了“綺”,沒(méi)能對(duì)這個(gè)中文字正確識(shí)別。
正如李彥宏所說(shuō),文心一言根植于中國(guó),一定比其他國(guó)家的自然語(yǔ)言大模型更理解中文和中國(guó)文化。而對(duì)于跨語(yǔ)言,文心一言還在學(xué)習(xí),“英文也能用,但肯定沒(méi)有中文好?!?/p>
GPT-4適應(yīng)的“母語(yǔ)”顯然是英語(yǔ),但為了初步測(cè)試該模型在其他語(yǔ)言上的能力,OpenAI的研究團(tuán)隊(duì)曾使用 Azure Translate 將MMLU 基準(zhǔn)(一套涵蓋 57 個(gè)主題的 14000 個(gè)多項(xiàng)選擇題 )翻譯成多種語(yǔ)言時(shí),GPT-4 的英語(yǔ)精度 (85.5%) 較GPT-3.5 的精度 (70.1%)更高,而跨語(yǔ)言精度放在普通話(Mandarin)上,GPT-4能達(dá)到80.1%,高于日語(yǔ)和韓語(yǔ)等亞洲國(guó)家的語(yǔ)言。
作為中國(guó)本土化的ChatGPT,中文能力好當(dāng)然是應(yīng)盡之責(zé)。對(duì)用戶和客戶來(lái)說(shuō),這也是最明顯的利好,語(yǔ)言門檻低了,申請(qǐng)、使用相應(yīng)地都會(huì)帶來(lái)便捷。但放在全球競(jìng)爭(zhēng)中,這個(gè)優(yōu)勢(shì)最多能體現(xiàn)在使用中文的國(guó)家和地區(qū)中,而OpenAI將輻射英文使用區(qū)。
在多模態(tài)生成上,文心一言的Demo展示了輸出圖片、語(yǔ)音、視頻的能力;GPT-4也披露將具備圖片、視頻的輸出能力,但目前無(wú)法在ChatGPT 上向更廣泛的公眾展現(xiàn),而它對(duì)網(wǎng)絡(luò)“梗圖”的理解力曾讓網(wǎng)友驚嘆,當(dāng)然,最驚訝的還是它用草圖框架生成代碼的能力。
寫代碼這一涉及多模態(tài)的能力,文心一言并沒(méi)有在發(fā)布會(huì)中展示。但已經(jīng)拿到測(cè)試資格的媒體《量子位》成員在晚間的直播中測(cè)試了文心一言寫代碼能力,給出的評(píng)價(jià)是“一般般”,“Python語(yǔ)言還可以,其他語(yǔ)言就不太行了。”他還測(cè)試了文心一言是否具有GPT-4的角色扮演能力,結(jié)論是“沒(méi)辦法”。
聚焦企業(yè)客戶 以用戶反饋促迭代
“從我自己的內(nèi)測(cè)體驗(yàn)看,文心一言確實(shí)也不能叫作完美?!崩顝┖曛t虛了一下又說(shuō),“但是,為什么今天要發(fā)布?”屏幕前一定有人以為他要說(shuō)競(jìng)爭(zhēng)、要說(shuō)文心一言的出品難度,沒(méi)想到的是,他自問(wèn)完自答:因?yàn)橛惺袌?chǎng)需求。
他說(shuō),百度的各個(gè)產(chǎn)品線,從搜索、智能云到自動(dòng)駕駛、到小度都等著要用這樣的的技術(shù),“更重要的是,我們的客戶、我們的合作伙伴在等著用這樣的技術(shù),大家都在催,我們需要盡早的將它發(fā)布出來(lái)?!?/p>
一句話,李彥宏道出了文心一言的企業(yè)級(jí)場(chǎng)景,客戶、合作伙伴成為重中之重,背后的一頁(yè)P(yáng)PT里寫著,“文心一言讓每一家公司都離客戶更近”。
李彥宏解釋大模型的產(chǎn)業(yè)機(jī)會(huì)
在解釋文心一言以及底層的文心大模型會(huì)帶來(lái)哪些創(chuàng)業(yè)機(jī)會(huì)和投資機(jī)會(huì)時(shí),李彥宏說(shuō),大模型將帶來(lái)三大產(chǎn)業(yè)機(jī)會(huì),包括新型云計(jì)算、行業(yè)模型精調(diào)和應(yīng)用開發(fā),而有關(guān)文字、圖像、音視頻生成、數(shù)字人、3D生成等的應(yīng)用開發(fā)是“最大的機(jī)會(huì)”。
萬(wàn)眾期待的文心一言發(fā)布會(huì)在這一刻如同一場(chǎng)“商業(yè)路演”,坐等客戶上門。而在這場(chǎng)發(fā)布會(huì)之前的一個(gè)月里,幾百家企業(yè)紛紛官宣加入了文心一言生態(tài),百度給出的數(shù)據(jù)是650多家。
To B或許是文心一言的重要優(yōu)勢(shì),畢竟,這個(gè)產(chǎn)品是集合了百度多個(gè)大模型的產(chǎn)物,包括ERNIE和PLATO,而這兩個(gè)模型都產(chǎn)出過(guò)多個(gè)企業(yè)級(jí)模型,場(chǎng)景涵蓋金融、醫(yī)療、航天、媒體、汽車等等。文心一言給企業(yè)用,簡(jiǎn)直是水到渠成。
此前,有兩家“官宣”的公司告訴《元宇宙日爆》,“先占坑,測(cè)試后再看怎么用?!逼髽I(yè)需求到底有多強(qiáng)烈,還有待觀察。觀察的窗口期也開始了,在發(fā)布會(huì)上,百度CTO王海峰當(dāng)場(chǎng)宣布,“邀請(qǐng)測(cè)試”當(dāng)天啟動(dòng),獲得邀請(qǐng)碼即可參與測(cè)試,包括合作伙伴和個(gè)人。
很快,文心一言的測(cè)試入口開通,當(dāng)然,需要邀請(qǐng)碼才能開測(cè)。當(dāng)晚10點(diǎn),百度發(fā)布了文心一言的“邀測(cè)”喜報(bào),申請(qǐng)調(diào)用的企業(yè)為6.5萬(wàn)家。
測(cè)試Demo是提前錄制的,真實(shí)的測(cè)試將在有限的用戶中展開,文心一言到底強(qiáng)不強(qiáng),測(cè)試用戶心里會(huì)有數(shù)。那么個(gè)人用戶如何獲得邀測(cè)權(quán)限?百度公布方案: 在測(cè)試入口網(wǎng)站點(diǎn)擊“立即體驗(yàn)”,參與排隊(duì)。更廣泛的個(gè)人用戶想要用到這個(gè)產(chǎn)品,大概率要等它正式上線了。
百度倒不是不重視C端,發(fā)布會(huì)上,李彥宏說(shuō)了,大語(yǔ)言模型這種產(chǎn)品,一旦發(fā)布出來(lái),就會(huì)獲得真實(shí)用戶的反饋,“有了這些反饋,它迭代的速度、能力的提升就會(huì)非常快?!?mark hidden color="red">文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-513075.html
可見,“真實(shí)用戶中”的C端也有他的價(jià)值,為文心一言的大模型貢獻(xiàn)“反饋”,提升它的迭代速度與能力。希望這個(gè)貢獻(xiàn)對(duì)C端是免費(fèi)的,這樣又能與ChatGPT產(chǎn)生差異化。畢竟,那個(gè)“外國(guó)AI”要向體驗(yàn)GPT-4模型的用戶收Plus版的訂閱費(fèi)。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-513075.html
到了這里,關(guān)于產(chǎn)品“擺拍”展示 文心一言露怯的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!