圖文原創(chuàng):親愛的數(shù)據(jù)
美國大模型水平領(lǐng)先,國內(nèi)大模型蓄勢而發(fā)。
國內(nèi)大模型參與者眾多,百度文心一言第一個有勇氣站出來發(fā)布。
此處應(yīng)有掌聲。
事前事后,中國網(wǎng)友的吶喊聲不絕于耳:“文心一言到底什么水平???”
其實網(wǎng)友更想知道:國內(nèi)AI大模型到底什么水平。
因為國內(nèi)目前只發(fā)布了一個AI大模型,所以在打造知名度上,百度領(lǐng)先。
同時,據(jù)“親愛的數(shù)據(jù)”獲得的信息,2023年3月底還會有一個國產(chǎn)AI大模型發(fā)布。但是,未獲許可,不能公開。
有競爭是好事,內(nèi)卷式消耗才是壞事。
社會各界人士的花式問答固然有趣,“親愛的數(shù)據(jù)”還是選擇了一位AI大佬設(shè)計的“蜜熊測試”。
《蜜熊測試:5分鐘感受大模型“實力指數(shù)”》(可點擊跳轉(zhuǎn)閱讀)
對,沒看錯,“蜜熊”就是蜂蜜和熊。
理解它幾乎沒有任何難度,可以說這是個零門檻游戲。
我們從“蜜熊測試”游戲中找?guī)讉€難題。
問:一頭熊一天吃14罐蜂蜜,請問它一年吃多少罐蜂蜜?
文心一言:14×365=5110 罐。
問:一頭熊一天吃14罐蜂蜜,請問它閏年吃多少罐蜂蜜?
文心一言:14×4=56 罐蜂蜜。
測試考察:小學(xué)語文+簡單的數(shù)學(xué)能力。算錯可能不理解閏年。
難題來了。
問:請畫一張小熊吃蜂蜜的 ascii art 圖片?
文心一言:很抱歉,我沒有構(gòu)思好這幅作品,請您稍后再試。
這題誰出的,站出來,為什么這么難?
果然,文心一言被考住了,連我也很難畫得如此“言簡意賅”。
ChatGPT用點和線,“拼出”了一個看上去坐著的熊,耳朵清晰可見,稍顯粗糙,我說它是狗也沒錯,但能“畫”成這樣,也很厲害了。
測試考察:難度略高,涌現(xiàn)能力。
ChatGPT有“涌現(xiàn)能力”。
又來一道難題。
問:一只熊抱著一罐蜂蜜從一個點出發(fā),向南走一公里,再向東走一公里,再向北走一公里,正好又回到了起點,請問:這只熊是什么顏色的?
文心一言:
這只熊是棕色的。
由于蜂蜜罐的存在,熊只能向南、北和東三個方向移動。由于它最終會回到起點,因此只有在熊從任何一個方向出發(fā)時才可以達(dá)到起點。這意味著它可以選擇從南方或北方開始移動,但不能從東方開始移動。因此,由于蜂蜜罐的存在,熊必須向南走一公里才能到達(dá)起點。
如果蜂蜜罐沒有被拿走,熊將繼續(xù)沿著北邊的路線前行,直到它回到原點,因此它是棕色的。
對于難題,不會做或做錯都很正常。
因為國內(nèi)多家大模型參與者的模型還沒有開放或者只是半開放測試機(jī)會,所以,“一高一低”不等于“一個最好,一個最差”。
ChatGPT領(lǐng)先,文心一言還行。
這是一個游戲,大家“感受”模型的實力,而不是測試模型的真正實力。
“游戲”結(jié)束了,那么ChatGPT為什么會做“難題”?
或者說,ChatGPT如何就能觸類旁通地學(xué)習(xí)了?
ChatGPT背后的內(nèi)核模型已經(jīng)升級到GPT4了。顯然,GPT4有涌現(xiàn)能力。
涌現(xiàn)能力,英文名Emergent Ability。
一開始,當(dāng)模型小于一定規(guī)模時,模型性能一般。
然后,模型參數(shù)增長,可惜模型性能效果無提升。
但是,當(dāng)模型超過某個規(guī)模之后,性能突然就上去了,這就是“涌現(xiàn)”。
中國科學(xué)院自動化研究所紫東太初大模型中心常務(wù)副主任、武漢人工智能研究院院長王金橋告訴我:
“研究發(fā)現(xiàn),在100億到1000億參數(shù)區(qū)間產(chǎn)生能力涌現(xiàn)?!?/p>
他還談道:“如果在較小的模型中不存在,但在較大的模型中存在,則該能力就是涌現(xiàn)的?!?/p>
專業(yè)說法是,有了涌現(xiàn)能力的大模型,就能解決未知任務(wù)。
或者說,AI大模型也能回答超綱題。
簡單說,學(xué)武到了一定境界,對從未見過的招式也能觸類旁通。
2023年3月15日,王金橋院長在上市公司航天宏圖的內(nèi)部討論會上以這樣一句話展開他的演講:“ChatGPT的問世,標(biāo)志著NLP(自然語言處理)中間任務(wù)的消亡。”
這句話令人唏噓不已,一個AI的技術(shù)階段悄無聲息地落下帷幕。很多NLP子領(lǐng)域不再具備獨立研究價值。
我問王金橋院長:
“我們?nèi)绾蚊枋鲇楷F(xiàn)能力之于大模型的重要性?”
他的答案是:“涌現(xiàn)能力是認(rèn)知智能是否具備的一個重要現(xiàn)象。就是能夠在模型學(xué)習(xí)的有限任務(wù)的基礎(chǔ)上,做相關(guān)未知任務(wù),舉一反三,具備數(shù)學(xué)邏輯和知識推理的能力。”
他強(qiáng)調(diào):
“沒有涌現(xiàn)能力就沒有認(rèn)知智能,例如語言大模型訓(xùn)練過程中,無論參數(shù)和迭代次數(shù)增加多少,始終不能在多任務(wù)語言任務(wù)上有突然的性能提升,就說明模型失敗了?!?/p>
有了ChatGPT,AI不會搶飯碗,比你更會用AI的人才會搶飯碗。
快來一本這樣的書吧——《ChatGPT高效提問指南》。
(完)
更多閱讀
AI框架系列:
1.搞深度學(xué)習(xí)框架的那幫人,不是瘋子,就是騙子(一)
2.搞AI框架那幫人丨燎原火,賈揚(yáng)清(二)
漫畫系列
1.?解讀硅谷風(fēng)投A16Z“50強(qiáng)”數(shù)據(jù)公司榜單
2.?AI算法是兄弟,AI運維不是兄弟嗎?
3.?大數(shù)據(jù)的社交牛逼癥是怎么得的?
4.?AI for Science這事,到底“科學(xué)不科學(xué)”?
5.?想幫數(shù)學(xué)家,AI算老幾??
6.?給王心凌打Call的,原來是神奇的智能湖倉
7.?原來,知識圖譜是“找關(guān)系”的搖錢樹?
8.?為什么圖計算能正面硬剛黑色產(chǎn)業(yè)薅羊毛?
9.?AutoML:攢錢買個“調(diào)參俠機(jī)器人”?
10.?AutoML:你愛吃的火鍋底料,是機(jī)器人自動進(jìn)貨
11. 強(qiáng)化學(xué)習(xí):人工智能下象棋,走一步,能看幾步?
12.?時序數(shù)據(jù)庫:好險,差一點沒擠進(jìn)工業(yè)制造的高端局
13.?主動學(xué)習(xí):人工智能居然被PUA了?
14.?云計算Serverless:一支穿云箭,千軍萬馬來相見
15.?數(shù)據(jù)中心網(wǎng)絡(luò):數(shù)據(jù)還有5納秒抵達(dá)戰(zhàn)場
16. 數(shù)據(jù)中心網(wǎng)絡(luò)“卷”AI:遲到不可怕,可怕的是別人都沒遲到
17. ChatGPT大火,如何成立一家AIGC公司,然后搞錢?
18.?ChatGPT:絕不欺負(fù)文科生
DPU芯片系列:
1.?造DPU芯片,如夢幻泡影?丨虛構(gòu)短篇小說
2.?永遠(yuǎn)不要投資DPU?
3.?DPU加持下的阿里云如何做加密計算?
4.?哎呦CPU,您可別累著,兄弟CIPU在云上幫把手
長文系列:
1.?我懷疑京東神秘部門Y,悟出智能供應(yīng)鏈真相了
2. 超級計算機(jī)與人工智能:大國超算,無人領(lǐng)航
最后,再介紹一下主編自己吧,
我是譚婧,科技和科普題材作者。
為了在時代中發(fā)現(xiàn)故事,
我圍追科技大神,堵截科技公司。
偶爾寫小說,畫漫畫。
生命短暫,不走捷徑。
個人微信:18611208992
原創(chuàng)不易,多謝轉(zhuǎn)發(fā)文章來源:http://www.zghlxwxcb.cn/news/detail-421834.html
還想看我的文章,就關(guān)注“親愛的數(shù)據(jù)”。??文章來源地址http://www.zghlxwxcb.cn/news/detail-421834.html
到了這里,關(guān)于看百度文心一言實力,再聊ChatGPT觸類旁通的學(xué)習(xí)能力如何而來?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!