国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn)

這篇具有很好參考價(jià)值的文章主要介紹了文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

??????最近,隨著備受關(guān)注的文心一言正式免費(fèi)向全社會(huì)開(kāi)放,再次引起了社會(huì)層面對(duì)國(guó)產(chǎn)大模型的興趣。

以文心一言為代表的國(guó)產(chǎn)大模型性能究竟如何?如果將它們相互比較,并且和GPT系列模型等國(guó)際前沿水平的LLM進(jìn)行比較,會(huì)得到什么樣的結(jié)果呢?筆者對(duì)此非常好奇,于是決定自己動(dòng)手試試。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

01

評(píng)估策略與數(shù)據(jù)準(zhǔn)備

全面評(píng)估大型語(yǔ)言模型的性能是一件相當(dāng)復(fù)雜的任務(wù)。不僅需要制定周全的策略,還需要準(zhǔn)備大量的數(shù)據(jù)和評(píng)估程序,并結(jié)合自動(dòng)化驗(yàn)證指標(biāo)和主觀評(píng)價(jià)來(lái)進(jìn)行綜合判斷。

筆者目前還是一名學(xué)生,沒(méi)有能力投入足夠資源做全面評(píng)估,所以選擇在一個(gè)垂直領(lǐng)域當(dāng)中做一下力所能及的小數(shù)據(jù)集測(cè)試。

當(dāng)下,筆者正在做一個(gè)知識(shí)圖譜項(xiàng)目,整理了一份春秋戰(zhàn)國(guó)時(shí)期的歷史類(lèi)知識(shí)圖譜,根據(jù)圖譜內(nèi)容,正好可以整理出若干問(wèn)題答案。于是,我們選取了20個(gè)與春秋戰(zhàn)國(guó)相關(guān)的問(wèn)題。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

這些問(wèn)題的特點(diǎn)是:既具備知識(shí)性,又是歷史數(shù)據(jù)(不是最新資訊,不用考慮信息是否已經(jīng)存儲(chǔ)在 LLM中的問(wèn)題),同時(shí)還可以根據(jù)現(xiàn)有知識(shí)圖譜直接獲得正確答案。

因此,我們實(shí)際上是生成了一份樣本數(shù)為 20 的問(wèn)題答案對(duì)數(shù)據(jù)集(QA pair dataset)。

借助這個(gè)小小的數(shù)據(jù)集,我們用來(lái)對(duì)文心一言、訊飛星火、GPT-4和GPT3.5進(jìn)行評(píng)估測(cè)試。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

02

文心一言、訊飛星火、GPT-4與GPT3.5的問(wèn)答結(jié)果

我們采用的評(píng)估方式為將這20個(gè)問(wèn)題分別輸入到以上四個(gè)大型語(yǔ)言模型(LLM)的網(wǎng)頁(yè)版界面中,并要求它們進(jìn)行回答。各個(gè)LLM都給出了答案,但效果不同。關(guān)于各個(gè)模型問(wèn)答的詳情請(qǐng)參考本文最后的 “06 附錄:數(shù)據(jù)詳情” 部分,此處,我們先看結(jié)果:

文心一言答對(duì)18題,正確率為90%

訊飛星火答對(duì)13題,正確率為65%

GPT-4答對(duì)12題,正確率為60%

GPT3.5答對(duì)11題,正確率為55%

經(jīng)過(guò)與標(biāo)準(zhǔn)答案的對(duì)比,我們發(fā)現(xiàn)文心一言在準(zhǔn)確率上遠(yuǎn)高于訊飛星火、GPT-4GPT3.5,達(dá)到了驚人的90%。而相較之下,訊飛星火、GPT-4和GPT3.5的準(zhǔn)確率分別為65%、60%和55%,三者比較接近。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

03

用戶體驗(yàn)打分

此外,為了讓實(shí)驗(yàn)數(shù)據(jù)更加細(xì)化以及實(shí)現(xiàn)多樣化的評(píng)估,我們又人工對(duì)每個(gè)模型的答案進(jìn)行了打分,其中每道題的滿分為5分。打分的規(guī)則如下:

  • 5分:答案正確、完整,語(yǔ)言清晰易懂(在無(wú)法給出正確答案的同時(shí),答案意為“不知道”也評(píng)為5分)

  • 4分:答案正確、不完整、語(yǔ)言清晰易懂

  • 3分:答案正確,語(yǔ)言晦澀、不流暢

  • 2分:答案部分正確、語(yǔ)言清晰易懂

  • 1分:答案少部分正確

  • 0分:答案錯(cuò)誤

四個(gè)模型的打分情況詳情請(qǐng)見(jiàn):https://github.com/microsoft/SmartKG/blob/master/Resources/Data/Excel/input/SprintAutumn/大語(yǔ)言模型對(duì)20個(gè)問(wèn)題的回答及打分.xlsx


總之,在打分評(píng)估方面,文心一言仍然顯著領(lǐng)先,獲得了出色的平均分4.3 分,訊飛星火平均分為3.0分,勉強(qiáng)及格。而GPT-4和GPT3.5的平均分分別為 2.8 和 2.35, 均未及格。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

04

比較、分析和猜想

我們發(fā)現(xiàn),GPT3.5和GPT-4對(duì)歷史事件的細(xì)節(jié)掌握較差,尤其是針對(duì)關(guān)于某個(gè)具體歷史事件或人物的問(wèn)題,文心一言可以給出準(zhǔn)確答案時(shí),GPT系列模型卻回答錯(cuò)誤。這可能是因?yàn)镚PT系列模型的訓(xùn)練數(shù)據(jù)集并不包含春秋戰(zhàn)國(guó)時(shí)期的具體信息。而文心一言作為百度開(kāi)發(fā)的大型語(yǔ)言模型,其訓(xùn)練數(shù)據(jù)集很可能包含了大量關(guān)于中國(guó)歷史的資料,從而對(duì)于歷史事件的細(xì)節(jié)掌握更加準(zhǔn)確。

GPT3.5 和GPT-4回答錯(cuò)誤的題目中有6道題目具有較高的重合度,這可能是由于它們所使用的訓(xùn)練數(shù)據(jù)集在春秋戰(zhàn)國(guó)時(shí)期的數(shù)據(jù)較為相似,并且都基于Transformer架構(gòu),底層邏輯較為類(lèi)似,所以導(dǎo)致模型在處理某些問(wèn)題時(shí)得出相似的錯(cuò)誤答案。

然而,相較于其他三個(gè)模型,GPT-4在提供更具體描述的答案方面表現(xiàn)更出色。舉例來(lái)說(shuō),在回答問(wèn)題16:“哪些人物有不止一個(gè)稱號(hào)?”時(shí),GPT-4不僅提供了人物的名字,還額外提供了具體的人物稱號(hào)。針對(duì)問(wèn)題17:“著名的春秋五霸分別來(lái)自哪五個(gè)國(guó)家?”,GPT-4除了回答國(guó)名,還額外給出了春秋五霸是誰(shuí)。GPT-4在這個(gè)方面之所以更出色的原因,可能是因?yàn)槠溆?xùn)練數(shù)據(jù)更加豐富,模型規(guī)模更大,具備通用的語(yǔ)言理解和上下文感知能力,因此能夠提供更為全面的答案。

訊飛星火模型雖然在準(zhǔn)確率和分?jǐn)?shù)上略高于GPT系列模型,但其回答表現(xiàn)仍有待提高,其中一個(gè)主要問(wèn)題是,當(dāng)遇到一些無(wú)法回答的問(wèn)題時(shí),訊飛星火模型可能會(huì)采用一種類(lèi)似于“答非所問(wèn)”的方式來(lái)回應(yīng)。當(dāng)問(wèn)題涉及某個(gè)事件對(duì)某個(gè)國(guó)家或個(gè)人的影響時(shí)(例如問(wèn)題5:“齊國(guó)和魏國(guó)為什么爆發(fā)了桂林之戰(zhàn)?” 和 問(wèn)題 7:“春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展有何影響?”),訊飛星火模型可能會(huì)給出類(lèi)似于“有重大影響”這樣的泛泛答案,試圖以此來(lái)模糊問(wèn)題或逃避具體回答。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

05

結(jié)尾

根據(jù)上面的實(shí)驗(yàn)結(jié)果可以看出,不同模型在回答春秋戰(zhàn)國(guó)問(wèn)題時(shí)各有優(yōu)勢(shì)和不足。文心一言在準(zhǔn)確性和歷史細(xì)節(jié)方面表現(xiàn)出色,適合被應(yīng)用于需要精確的答案的場(chǎng)景。而GPT-4則在提供更具體和豐富描述方面更強(qiáng),適合需要更深入分析的情境。GPT3.5和訊飛星火的總體表現(xiàn)稍顯不足。

當(dāng)然,本文陳述的只是筆者個(gè)人通過(guò)一個(gè)細(xì)分垂直領(lǐng)域的極小數(shù)據(jù)集得出的手動(dòng)測(cè)評(píng)結(jié)果,距離全面完整的評(píng)估、比較各中LLM還相距甚遠(yuǎn)。在此分享感受與做法,也是拋磚引玉,希望能看到更多領(lǐng)域、更大范圍的對(duì)LLM的評(píng)估結(jié)果。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

06

附錄:數(shù)據(jù)詳情

四個(gè)LLM回答中國(guó)春秋戰(zhàn)國(guó)歷史知識(shí)二十個(gè)問(wèn)題的結(jié)果如下所示(其中紅色部分為錯(cuò)誤回答):

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題一

《孫子兵法》的作者是誰(shuí),他是哪個(gè)國(guó)家的軍事家?

正確答案:《孫子兵法》的作者是孫武,他是中國(guó)/齊國(guó)的軍事家。

文心一言

《孫子兵法》的作者是孫武,他是春秋時(shí)期齊國(guó)的軍事家。

訊飛星火

《孫子兵法》的作者是孫武,他是春秋時(shí)期的齊國(guó)人。

GPT-4

《孫子兵法》的作者是孫武,他是中國(guó)的軍事家。

GPT3.5

《孫子兵法》的作者是孫武,他是中國(guó)的軍事家。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題二

成語(yǔ)“千金買(mǎi)骨”的出處是哪里,解釋是什么?

正確答案:成語(yǔ)“千金買(mǎi)骨”出自《戰(zhàn)國(guó)策·燕策一》,意思是指用重金買(mǎi)下千里馬的骨頭,表示對(duì)求賢若渴的態(tài)度和決心。

文心一言

成語(yǔ)“千金買(mǎi)骨”出自《戰(zhàn)國(guó)策·燕策一》,意思是指用重金買(mǎi)下千里馬的骨頭,表示對(duì)求賢若渴的態(tài)度和決心。

訊飛星火

成語(yǔ)“千金買(mǎi)骨”的出處是《戰(zhàn)國(guó)策》。這個(gè)成語(yǔ)的意思是比喻為了得到人才而不惜代價(jià)。

GPT-4

成語(yǔ)“千金買(mǎi)骨”的出處是《左傳》,解釋通常為用重金購(gòu)買(mǎi)戰(zhàn)士的尸骨以表敬重,也可比喻人的才干或品質(zhì)有很高的價(jià)值。

GPT3.5

成語(yǔ)“千金買(mǎi)骨”的出處是《后漢書(shū)·馬援傳》,意為用千金購(gòu)買(mǎi)一塊骨頭,比喻不惜重金購(gòu)得珍貴之物。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題三

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)有哪些?? ?

正確答案:參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)是成得臣(子玉)。

文心一言

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)是成得臣。

訊飛星火

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)有成得臣、斗越椒等。

GPT-4

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)包括樓緩、壤地方等。

GPT3.5

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)包括春申君黃歇、伍子胥等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題四

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有哪些?

正確答案:同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有晉國(guó)和楚國(guó)。

文心一言

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有晉國(guó)和楚國(guó)。

訊飛星火

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有晉國(guó)、楚國(guó)、齊國(guó)、衛(wèi)國(guó)、魯國(guó)、宋國(guó)、陳國(guó)、蔡國(guó)和秦國(guó)。

GPT-4

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有齊國(guó)和宋國(guó)。

GPT3.5

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家是楚國(guó)和秦國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題五

齊國(guó)和魏國(guó)為什么爆發(fā)了桂林之戰(zhàn)?

正確答案:齊國(guó)和魏國(guó)爆發(fā)了桂林之戰(zhàn)是因?yàn)辇R國(guó)干涉了魏國(guó)和趙國(guó)之間的戰(zhàn)爭(zhēng)。

文心一言

齊國(guó)和魏國(guó)爆發(fā)了桂林之戰(zhàn)是因?yàn)辇R國(guó)干涉了魏國(guó)和趙國(guó)之間的戰(zhàn)爭(zhēng)。

訊飛星火

齊國(guó)和魏國(guó)爆發(fā)了桂林之戰(zhàn),這場(chǎng)戰(zhàn)爭(zhēng)對(duì)趙國(guó)和秦國(guó)的發(fā)展有很大影響。

GPT-4

齊國(guó)和魏國(guó)爆發(fā)桂林之戰(zhàn)的原因主要是爭(zhēng)奪土地和權(quán)力。

GPT3.5

齊國(guó)和魏國(guó)爆發(fā)桂林之戰(zhàn)是因?yàn)閮蓢?guó)爭(zhēng)奪桂林地區(qū)的控制權(quán)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題六

戰(zhàn)國(guó)七雄中的哪個(gè)國(guó)家最終統(tǒng)一了中國(guó),開(kāi)創(chuàng)了秦朝?

正確答案:戰(zhàn)國(guó)七雄中的秦國(guó)最終統(tǒng)一了中國(guó),開(kāi)創(chuàng)了秦朝。

文心一言

戰(zhàn)國(guó)七雄中的秦國(guó)最終統(tǒng)一了中國(guó),開(kāi)創(chuàng)了秦朝。

訊飛星火

秦國(guó)最終統(tǒng)一了中國(guó),開(kāi)創(chuàng)了秦朝。

GPT-4

戰(zhàn)國(guó)七雄中秦國(guó)最終統(tǒng)一了中國(guó),開(kāi)創(chuàng)了秦朝。

GPT3.5

戰(zhàn)國(guó)七雄中最終統(tǒng)一中國(guó)、開(kāi)創(chuàng)了秦朝的國(guó)家是秦國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題七

春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展有何影響?

正確答案:長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展造成深遠(yuǎn)影響,趙國(guó)削弱,秦國(guó)得以強(qiáng)大。

文心一言

春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展有何影響。這個(gè)問(wèn)題的答案比較復(fù)雜,可以參考相關(guān)歷史文獻(xiàn)。

訊飛星火

長(zhǎng)平之戰(zhàn)是發(fā)生在戰(zhàn)國(guó)時(shí)期趙國(guó)和秦國(guó)之間的一場(chǎng)著名戰(zhàn)役,這場(chǎng)戰(zhàn)役對(duì)于趙國(guó)和秦國(guó)的發(fā)展都有很大的影響。

GPT-4

春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)使趙國(guó)元?dú)獯髠?,?guó)勢(shì)日衰;對(duì)秦國(guó)而言,鞏固了國(guó)力,為統(tǒng)一六國(guó)奠定了基礎(chǔ)。

GPT3.5

長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展造成深遠(yuǎn)影響,趙國(guó)削弱,秦國(guó)得以強(qiáng)大。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題八

哪件事件標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始?

正確答案:標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始的事件是三家分晉

文心一言

標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始的事件是三家分晉和田陳篡齊。

訊飛星火

春秋時(shí)期結(jié)束和戰(zhàn)國(guó)時(shí)期開(kāi)始的標(biāo)志是公元前475年吳越爭(zhēng)霸戰(zhàn)爭(zhēng)的失敗。

GPT-4

公元前403年館陶之戰(zhàn)(即晉國(guó)滅趙國(guó),將其分化為韓、趙、魏三國(guó))標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始。

GPT3.5

春秋時(shí)期結(jié)束、戰(zhàn)國(guó)時(shí)期開(kāi)始的標(biāo)志事件是鄭國(guó)滅亡(戰(zhàn)國(guó)初期的齊桓公四年)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題九

蘇秦和張儀共同訪問(wèn)過(guò)哪些國(guó)家?

正確答案:蘇秦和張儀共同訪問(wèn)過(guò)趙國(guó)、魏國(guó)、燕國(guó)、齊國(guó)、楚國(guó)、韓國(guó)等。

文心一言

蘇秦和張儀共同訪問(wèn)過(guò)的國(guó)家有趙國(guó)、燕國(guó)和韓國(guó)。

訊飛星火

蘇秦和張儀共同訪問(wèn)過(guò)中山國(guó)、燕國(guó)、齊國(guó)等國(guó)家。

GPT-4

蘇秦和張儀共同訪問(wèn)過(guò)齊、楚、燕、漢、趙、韓、魏等國(guó)家。

GPT3.5

蘇秦和張儀共同訪問(wèn)過(guò)趙國(guó)、魏國(guó)、燕國(guó)等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十

成語(yǔ)“懸梁刺股”是從誰(shuí)的經(jīng)歷衍生的?

正確答案:成語(yǔ)“懸梁刺股”是從蘇秦/孫敬的經(jīng)歷中衍生的。

文心一言

成語(yǔ)“懸梁刺股”是從蘇秦的經(jīng)歷中衍生的。

訊飛星火

“懸梁刺股”是從孫敬的經(jīng)歷中衍生出來(lái)的。

GPT-4

成語(yǔ)“懸梁刺股”是從蘇軾的故事中衍生的。

GPT3.5

成語(yǔ)“懸梁刺股”源于戰(zhàn)國(guó)時(shí)期的鄭國(guó)大夫子產(chǎn)的經(jīng)歷。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十一

“管仲治齊”和“商鞅變法”有哪些共同點(diǎn)?

正確答案:“管仲治齊”和“商鞅變法”的共同點(diǎn)是它們都推行了法家思想,注重法制建設(shè)和經(jīng)濟(jì)改革。

文心一言

“管仲治齊”和“商鞅變法”的共同點(diǎn)是它們都推行了法家思想,注重法制建設(shè)和經(jīng)濟(jì)改革。

訊飛星火

“管仲治齊”和“商鞅變法”有很多共同點(diǎn),比如都強(qiáng)調(diào)以法治國(guó),都有改革措施等。

GPT-4

“管仲治齊”和“商鞅變法”的共同點(diǎn)主要有:加強(qiáng)封建中央集權(quán),推行法治,重視農(nóng)業(yè)和發(fā)展國(guó)民經(jīng)濟(jì),實(shí)行嚴(yán)格的軍隊(duì)管理和征兵制度。

GPT3.5

“管仲治齊”和“商鞅變法”都是戰(zhàn)國(guó)時(shí)期改革的代表,致力于國(guó)家的發(fā)展與強(qiáng)大。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十二

春秋戰(zhàn)國(guó)時(shí)期秦國(guó)在誰(shuí)的治理下變得強(qiáng)盛起來(lái)?

正確答案:秦國(guó)在商鞅/秦穆公的治理下變得強(qiáng)盛起來(lái)。

文心一言

秦國(guó)在商鞅的治理下變得強(qiáng)盛起來(lái)。

訊飛星火

秦國(guó)在秦穆公的治理下變得強(qiáng)盛起來(lái)。

GPT-4

秦國(guó)在商鞅的治理下變得強(qiáng)盛起來(lái)。

GPT3.5

秦國(guó)在秦穆公的治理下變得強(qiáng)盛起來(lái)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十三

齊桓公和秦孝公作為春秋時(shí)期的明君,他們的治國(guó)策略有何相似之處?

正確答案:齊桓公和秦孝公作為春秋時(shí)期的明君,他們的治國(guó)策略相似之處包括:重視法治、強(qiáng)化中央集權(quán)、擴(kuò)大國(guó)土、倡導(dǎo)和平共處。

文心一言

齊桓公和秦孝公作為春秋時(shí)期的明君,他們的治國(guó)策略的相似之處在于都推行了改革,注重經(jīng)濟(jì)發(fā)展和國(guó)家實(shí)力提升。

訊飛星火

齊桓公和秦孝公作為春秋時(shí)期的明君,他們的治國(guó)策略相似之處在于都強(qiáng)調(diào)以德治國(guó)。

GPT-4

齊桓公和秦孝公作為春秋時(shí)期的明君,他們的治國(guó)策略相似之處包括:重視法治、強(qiáng)化中央集權(quán)、擴(kuò)大國(guó)土、倡導(dǎo)和平共處。

GPT3.5

齊桓公和秦孝公都推行了改革政策,重用人才,提升國(guó)力,促進(jìn)國(guó)家繁榮。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十四

歷史上第一次經(jīng)濟(jì)改革是哪個(gè)事件?

正確答案:歷史上第一次經(jīng)濟(jì)改革是管仲改革。

文心一言

歷史上第一次經(jīng)濟(jì)改革是管仲改革。

訊飛星火

歷史上第一次經(jīng)濟(jì)改革是管仲的改革。

GPT-4

歷史上第一次經(jīng)濟(jì)改革通常被認(rèn)為是中國(guó)戰(zhàn)國(guó)時(shí)期的商鞅變法。

GPT3.5

歷史上第一次經(jīng)濟(jì)改革是商鞅變法,發(fā)生在戰(zhàn)國(guó)時(shí)期的秦國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十五

哪些國(guó)家參與了不止一次著名戰(zhàn)役?

正確答案:參與了不止一次著名戰(zhàn)役的國(guó)家有晉國(guó)、齊國(guó)、秦國(guó)、楚國(guó)等。

文心一言

參與了不止一次著名戰(zhàn)役的國(guó)家有晉國(guó)、齊國(guó)、秦國(guó)、楚國(guó)等。

訊飛星火

參與了不止一次著名戰(zhàn)役的國(guó)家有晉國(guó)、楚國(guó)、齊國(guó)、秦國(guó)等。

GPT-4

參與過(guò)不止一次著名戰(zhàn)役國(guó)家的例子包括楚國(guó)、秦國(guó)等。

GPT3.5

參與了不止一次著名戰(zhàn)役的國(guó)家包括秦國(guó)、楚國(guó)、趙國(guó)等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十六

哪些人物有不止一個(gè)稱號(hào)?

正確答案:不止一個(gè)稱號(hào)的人物例子有:孔子(稱號(hào):孔子,孔夫子)、老子(稱號(hào):老子,李耳、太上老君)等。

文心一言

有不止一個(gè)稱號(hào)的人物有姜小白、田文、趙雍等。

訊飛星火

有不止一個(gè)稱號(hào)的人物有孔子(儒家學(xué)派創(chuàng)始人)、荀子(荀況)、韓非子(法家代表人物)等。

GPT-4

不止一個(gè)稱號(hào)的人物例子有:孔子(稱號(hào):孔子,孔夫子)、老子(稱號(hào):老子,李耳、太上老君)等。

GPT3.5

有不止一個(gè)稱號(hào)的人物包括孔子(孔夫子、仲尼)、孟子(孟子、孟軻)等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十七

著名的春秋五霸分別來(lái)自哪五個(gè)國(guó)家?

正確答案:春秋時(shí)期的五霸分別來(lái)自齊國(guó)、晉國(guó)、秦國(guó)、楚國(guó)和燕國(guó)。

文心一言

著名的春秋五霸分別來(lái)自齊國(guó)、晉國(guó)、楚國(guó)、宋國(guó)、秦國(guó)。

訊飛星火

著名的春秋五霸分別來(lái)自齊桓公、晉文公、楚莊王、吳王闔閭和越王勾踐所在的國(guó)家。

GPT-4

著名的春秋五霸分別來(lái)自齊國(guó)(齊桓公)、晉國(guó)(晉景公)、秦國(guó)(秦穆公)、晉國(guó)(晉文公)、楚國(guó)(楚莊王)。

GPT3.5

春秋時(shí)期的五霸分別來(lái)自齊國(guó)、晉國(guó)、秦國(guó)、楚國(guó)和燕國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十八

孔子是什么學(xué)派的創(chuàng)始人?

正確答案:孔子是儒家學(xué)派的創(chuàng)始人。

文心一言

孔子是儒家學(xué)派的創(chuàng)始人。

訊飛星火

孔子是儒家學(xué)派的創(chuàng)始人。

GPT-4

孔子是儒家學(xué)派的創(chuàng)始人。

GPT3.5

孔子是儒家學(xué)派的創(chuàng)始人。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十九

孔子的弟子中有誰(shuí)在晉國(guó)擔(dān)任過(guò)帝師?

正確答案:子夏在晉國(guó)擔(dān)任過(guò)帝師。

文心一言

孔子的弟子中在晉國(guó)擔(dān)任過(guò)帝師的是端木賜。

訊飛星火

孔子的弟子中有曾子在晉國(guó)擔(dān)任過(guò)帝師。

GPT-4

孔子的弟子子夏(字:卜商)在晉國(guó)擔(dān)任過(guò)帝師。

GPT3.5

孔子的弟子子貢曾在晉國(guó)擔(dān)任過(guò)帝師。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題二十

春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中,誰(shuí)是最后一個(gè)被稱為"霸"的國(guó)君?

正確答案:春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中,最后一位被稱為"霸"的國(guó)君是越王勾踐/楚莊王。

文心一言

春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中,最后一位被稱為"霸"的國(guó)君是越王勾踐。

訊飛星火

春秋五霸中最后一個(gè)被稱為“霸”的國(guó)君是越王勾踐。

GPT-4

春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中,楚莊王(春秋末期)是最后一個(gè)被稱為"霸"的國(guó)君。

GPT3.5

春秋戰(zhàn)國(guó)時(shí)期的“春秋五霸”中,最后一個(gè)被稱為“霸”的國(guó)君是韓國(guó)的韓昭侯。

歡迎關(guān)注微軟 ATP 官方賬號(hào)

微軟 ATP 一手資訊搶先了解

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

點(diǎn)擊“閱讀原文” | 了解更多 AI 賦能案例文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-734681.html

到了這里,關(guān)于文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 訊飛星火_VS_文心一言

    訊飛星火_VS_文心一言

    獲得訊飛星火認(rèn)知大模型體驗(yàn)授權(quán),第一時(shí)間來(lái)測(cè)試一下效果,使用申請(qǐng)手機(jī)號(hào)登錄后,需要同意訊飛SparkDesk體驗(yàn)規(guī)則,如下圖所示: 同意之后就可以進(jìn)行體驗(yàn)了,界面如下: 訊飛星火效果體驗(yàn) 以下Prompt來(lái)自https://github.com/THUDM/ChatGLM-6B 自我認(rèn)知 星火 文心一言 在自我認(rèn)知方

    2024年02月09日
    瀏覽(24)
  • 一道題告訴你為什么GPT4被封神!橫向測(cè)評(píng)大模型的推理能力:ChatGPT、Claude、Gemini、文心一言、訊飛星火、通義千問(wèn)、天工、智譜清言、Kimi Chat!

    一道題告訴你為什么GPT4被封神!橫向測(cè)評(píng)大模型的推理能力:ChatGPT、Claude、Gemini、文心一言、訊飛星火、通義千問(wèn)、天工、智譜清言、Kimi Chat!

    大家好,我是木易,一個(gè)持續(xù)關(guān)注AI領(lǐng)域的互聯(lián)網(wǎng)技術(shù)產(chǎn)品經(jīng)理,國(guó)內(nèi)Top2本科,美國(guó)Top10 CS研究生,MBA。我堅(jiān)信AI是普通人變強(qiáng)的“ 外掛 ”,所以創(chuàng)建了“AI信息Gap”這個(gè)公眾號(hào),專注于分享AI全維度知識(shí),包括但不限于 AI科普 , AI工具測(cè)評(píng) , AI效率提升 , AI行業(yè)洞察 。關(guān)

    2024年04月13日
    瀏覽(91)
  • 文心一言沒(méi)有體驗(yàn)上,看看訊飛星火認(rèn)知大模型

    文心一言沒(méi)有體驗(yàn)上,看看訊飛星火認(rèn)知大模型

    目錄 ? 前言 正文 1.簡(jiǎn)單對(duì)話環(huán)節(jié) 1.1什么是訊飛星火認(rèn)知大模型 1.2你都可以干一些什么 1.3你的訓(xùn)練數(shù)據(jù)庫(kù)還在持續(xù)更新么 1.4今天是哪一天 1.5宇宙中有哪些目前認(rèn)為可能存在生命的星球 2.輔助學(xué)習(xí)對(duì)話 2.1我想完成一篇關(guān)于CT檢測(cè)技術(shù)的論文綜述,你有什么好的建議么 ? 2.2可

    2024年02月03日
    瀏覽(36)
  • 大模型圓桌,ChatGPT、文心一言、訊飛星火如何看待「泛自動(dòng)駕駛」

    大模型圓桌,ChatGPT、文心一言、訊飛星火如何看待「泛自動(dòng)駕駛」

    ? 2022年11月30日,ChatGPT橫空出世,掀開(kāi)了人工智能認(rèn)知大模型的進(jìn)化爆發(fā)序幕。半年以來(lái),國(guó)內(nèi)外科技公司不甘落后,相繼推出各自的認(rèn)知模型,試圖在巨大時(shí)代浪潮里分得一杯羹。 那么,層出不窮的大模型如何看待人類(lèi)所處的時(shí)代,如何分析未來(lái)的發(fā)展?作為泛自動(dòng)駕駛領(lǐng)

    2024年02月13日
    瀏覽(21)
  • 文心一言 VS 訊飛星火 VS chatgpt (225)-- 算法導(dǎo)論16.3 7題

    文心一言 VS 訊飛星火 VS chatgpt (225)-- 算法導(dǎo)論16.3 7題

    推廣赫夫曼算法以生成三進(jìn)制碼字需要對(duì)算法進(jìn)行一定的修改,確保在每一步選擇頻率最低的三個(gè)節(jié)點(diǎn)進(jìn)行合并,并生成對(duì)應(yīng)的三進(jìn)制碼。以下是推廣赫夫曼算法的Go語(yǔ)言實(shí)現(xiàn),并附帶證明其能生成最優(yōu)三進(jìn)制碼的思路。 首先,我們需要定義赫夫曼樹(shù)節(jié)點(diǎn)的數(shù)據(jù)結(jié)構(gòu),并實(shí)現(xiàn)

    2024年04月26日
    瀏覽(88)
  • 文心一言 VS 訊飛星火 VS chatgpt (60)-- 算法導(dǎo)論6.4 4題

    文心一言 VS 訊飛星火 VS chatgpt (60)-- 算法導(dǎo)論6.4 4題

    文心一言 VS 訊飛星火 VS chatgpt (60)-- 算法導(dǎo)論6.4 4題 要證明在最壞情況下,HEAPSORT 的時(shí)間復(fù)雜度是 Ω(n log n),我們需要考慮在何種情況下堆排序的時(shí)間復(fù)雜度最低。 在堆排序中,構(gòu)建最大堆的時(shí)間復(fù)雜度為 O(n),這是因?yàn)樵谧顗那闆r下,堆中每個(gè)元素都需要與其他元素進(jìn)行

    2024年02月16日
    瀏覽(20)
  • 文心一言 VS 訊飛星火 VS chatgpt (76)-- 算法導(dǎo)論7.3 1題

    文心一言 VS 訊飛星火 VS chatgpt (76)-- 算法導(dǎo)論7.3 1題

    在分析算法的性能時(shí),期望運(yùn)行時(shí)間是一個(gè)重要的指標(biāo),它描述了算法在平均情況下的表現(xiàn)。期望運(yùn)行時(shí)間考慮了所有可能的情況,包括輸入數(shù)據(jù)的分布和隨機(jī)性等因素。 對(duì)于隨機(jī)化算法,最壞情況下的運(yùn)行時(shí)間可能會(huì)非常糟糕,但是這種最壞情況在實(shí)際應(yīng)用中出現(xiàn)的概率非

    2024年02月12日
    瀏覽(26)
  • 文心一言 VS 訊飛星火 VS chatgpt (68)-- 算法導(dǎo)論6.5 7題

    文心一言 VS 訊飛星火 VS chatgpt (68)-- 算法導(dǎo)論6.5 7題

    文心一言 VS 訊飛星火 VS chatgpt (68)-- 算法導(dǎo)論6.5 7題 優(yōu)先隊(duì)列是一種數(shù)據(jù)結(jié)構(gòu),其中每個(gè)元素都有一個(gè)關(guān)聯(lián)的優(yōu)先級(jí)或權(quán)值。在優(yōu)先隊(duì)列中,元素按照它們的優(yōu)先級(jí)被排序,使得較小的優(yōu)先級(jí)先被處理。因此,我們可以使用優(yōu)先隊(duì)列來(lái)實(shí)現(xiàn)先進(jìn)先出隊(duì)列。 要實(shí)現(xiàn)先進(jìn)先出隊(duì)

    2024年02月14日
    瀏覽(24)
  • 文心一言 VS 訊飛星火 VS chatgpt (24)-- 算法導(dǎo)論4.2 6題

    文心一言 VS 訊飛星火 VS chatgpt (24)-- 算法導(dǎo)論4.2 6題

    Strassen 算法是一種用于矩陣乘法的分治算法,它將原始的矩陣分解為較小的子矩陣,然后使用子矩陣相乘的結(jié)果來(lái)計(jì)算原始矩陣的乘積。 對(duì)于一個(gè) knn 矩陣和一個(gè) nkn 矩陣相乘,如果使用 Strassen 算法進(jìn)行分解,最壞情況下需要進(jìn)行 7 次矩陣乘法運(yùn)算和 6 次加法運(yùn)算。因此,在

    2024年02月06日
    瀏覽(45)
  • 文心一言 VS 訊飛星火 VS chatgpt (58)-- 算法導(dǎo)論6.4 2題

    文心一言 VS 訊飛星火 VS chatgpt (58)-- 算法導(dǎo)論6.4 2題

    文心一言 VS 訊飛星火 VS chatgpt (58)-- 算法導(dǎo)論6.4 2題 在 HEAPSORT 算法中使用以下循環(huán)不變量是正確的: 1.在算法的第 2~5 行 for 循環(huán)每次迭代開(kāi)始時(shí),子數(shù)組 A[1…i] 是一個(gè)包含了數(shù)組 A[1…n] 中第 i 小元素的最大堆。 2.子數(shù)組 A[i+1…n] 包含了數(shù)組 A[1…n] 中已排序的 n-i 個(gè)最大元

    2024年02月16日
    瀏覽(17)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包