国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<address id="do6m9"></address>

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn)

2年前作者：葉錦鯉分類(lèi)：Toy博客閱讀(18)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

??????最近，隨著備受關(guān)注的文心一言正式免費(fèi)向全社會(huì)開(kāi)放，再次引起了社會(huì)層面對(duì)國(guó)產(chǎn)大模型的興趣。

以文心一言為代表的國(guó)產(chǎn)大模型性能究竟如何？如果將它們相互比較，并且和GPT系列模型等國(guó)際前沿水平的LLM進(jìn)行比較，會(huì)得到什么樣的結(jié)果呢？筆者對(duì)此非常好奇，于是決定自己動(dòng)手試試。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

01

評(píng)估策略與數(shù)據(jù)準(zhǔn)備

全面評(píng)估大型語(yǔ)言模型的性能是一件相當(dāng)復(fù)雜的任務(wù)。不僅需要制定周全的策略，還需要準(zhǔn)備大量的數(shù)據(jù)和評(píng)估程序，并結(jié)合自動(dòng)化驗(yàn)證指標(biāo)和主觀評(píng)價(jià)來(lái)進(jìn)行綜合判斷。

筆者目前還是一名學(xué)生，沒(méi)有能力投入足夠資源做全面評(píng)估，所以選擇在一個(gè)垂直領(lǐng)域當(dāng)中做一下力所能及的小數(shù)據(jù)集測(cè)試。

當(dāng)下，筆者正在做一個(gè)知識(shí)圖譜項(xiàng)目，整理了一份春秋戰(zhàn)國(guó)時(shí)期的歷史類(lèi)知識(shí)圖譜，根據(jù)圖譜內(nèi)容，正好可以整理出若干問(wèn)題答案。于是，我們選取了20個(gè)與春秋戰(zhàn)國(guó)相關(guān)的問(wèn)題。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

這些問(wèn)題的特點(diǎn)是：既具備知識(shí)性，又是歷史數(shù)據(jù)（不是最新資訊，不用考慮信息是否已經(jīng)存儲(chǔ)在 LLM中的問(wèn)題），同時(shí)還可以根據(jù)現(xiàn)有知識(shí)圖譜直接獲得正確答案。

因此，我們實(shí)際上是生成了一份樣本數(shù)為 20 的問(wèn)題答案對(duì)數(shù)據(jù)集（QA pair dataset）。

借助這個(gè)小小的數(shù)據(jù)集，我們用來(lái)對(duì)文心一言、訊飛星火、GPT-4和GPT3.5進(jìn)行評(píng)估測(cè)試。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

02

文心一言、訊飛星火、GPT-4與GPT3.5的問(wèn)答結(jié)果

我們采用的評(píng)估方式為將這20個(gè)問(wèn)題分別輸入到以上四個(gè)大型語(yǔ)言模型（LLM）的網(wǎng)頁(yè)版界面中，并要求它們進(jìn)行回答。各個(gè)LLM都給出了答案，但效果不同。關(guān)于各個(gè)模型問(wèn)答的詳情請(qǐng)參考本文最后的 “06 附錄：數(shù)據(jù)詳情” 部分，此處，我們先看結(jié)果：

文心一言答對(duì)18題，正確率為90%

訊飛星火答對(duì)13題，正確率為65%

GPT-4答對(duì)12題，正確率為60%

GPT3.5答對(duì)11題，正確率為55%

經(jīng)過(guò)與標(biāo)準(zhǔn)答案的對(duì)比，我們發(fā)現(xiàn)文心一言在準(zhǔn)確率上遠(yuǎn)高于訊飛星火、GPT-4和GPT3.5，達(dá)到了驚人的90%。而相較之下，訊飛星火、GPT-4和GPT3.5的準(zhǔn)確率分別為65%、60%和55%，三者比較接近。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

03

用戶體驗(yàn)打分

此外，為了讓實(shí)驗(yàn)數(shù)據(jù)更加細(xì)化以及實(shí)現(xiàn)多樣化的評(píng)估，我們又人工對(duì)每個(gè)模型的答案進(jìn)行了打分，其中每道題的滿分為5分。打分的規(guī)則如下：

5分：答案正確、完整，語(yǔ)言清晰易懂（在無(wú)法給出正確答案的同時(shí)，答案意為“不知道”也評(píng)為5分）
4分：答案正確、不完整、語(yǔ)言清晰易懂
3分：答案正確，語(yǔ)言晦澀、不流暢
2分：答案部分正確、語(yǔ)言清晰易懂
1分：答案少部分正確
0分：答案錯(cuò)誤

四個(gè)模型的打分情況詳情請(qǐng)見(jiàn)：https://github.com/microsoft/SmartKG/blob/master/Resources/Data/Excel/input/SprintAutumn/大語(yǔ)言模型對(duì)20個(gè)問(wèn)題的回答及打分.xlsx

總之，在打分評(píng)估方面，文心一言仍然顯著領(lǐng)先，獲得了出色的平均分4.3 分，訊飛星火平均分為3.0分，勉強(qiáng)及格。而GPT-4和GPT3.5的平均分分別為 2.8 和 2.35，均未及格。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

04

比較、分析和猜想

我們發(fā)現(xiàn)，GPT3.5和GPT-4對(duì)歷史事件的細(xì)節(jié)掌握較差，尤其是針對(duì)關(guān)于某個(gè)具體歷史事件或人物的問(wèn)題，文心一言可以給出準(zhǔn)確答案時(shí)，GPT系列模型卻回答錯(cuò)誤。這可能是因?yàn)镚PT系列模型的訓(xùn)練數(shù)據(jù)集并不包含春秋戰(zhàn)國(guó)時(shí)期的具體信息。而文心一言作為百度開(kāi)發(fā)的大型語(yǔ)言模型，其訓(xùn)練數(shù)據(jù)集很可能包含了大量關(guān)于中國(guó)歷史的資料，從而對(duì)于歷史事件的細(xì)節(jié)掌握更加準(zhǔn)確。

GPT3.5 和GPT-4回答錯(cuò)誤的題目中有6道題目具有較高的重合度，這可能是由于它們所使用的訓(xùn)練數(shù)據(jù)集在春秋戰(zhàn)國(guó)時(shí)期的數(shù)據(jù)較為相似，并且都基于Transformer架構(gòu)，底層邏輯較為類(lèi)似，所以導(dǎo)致模型在處理某些問(wèn)題時(shí)得出相似的錯(cuò)誤答案。

然而，相較于其他三個(gè)模型，GPT-4在提供更具體描述的答案方面表現(xiàn)更出色。舉例來(lái)說(shuō)，在回答問(wèn)題16：“哪些人物有不止一個(gè)稱號(hào)？”時(shí)，GPT-4不僅提供了人物的名字，還額外提供了具體的人物稱號(hào)。針對(duì)問(wèn)題17：“著名的春秋五霸分別來(lái)自哪五個(gè)國(guó)家？”，GPT-4除了回答國(guó)名，還額外給出了春秋五霸是誰(shuí)。GPT-4在這個(gè)方面之所以更出色的原因，可能是因?yàn)槠溆?xùn)練數(shù)據(jù)更加豐富，模型規(guī)模更大，具備通用的語(yǔ)言理解和上下文感知能力，因此能夠提供更為全面的答案。

訊飛星火模型雖然在準(zhǔn)確率和分?jǐn)?shù)上略高于GPT系列模型，但其回答表現(xiàn)仍有待提高，其中一個(gè)主要問(wèn)題是，當(dāng)遇到一些無(wú)法回答的問(wèn)題時(shí)，訊飛星火模型可能會(huì)采用一種類(lèi)似于“答非所問(wèn)”的方式來(lái)回應(yīng)。當(dāng)問(wèn)題涉及某個(gè)事件對(duì)某個(gè)國(guó)家或個(gè)人的影響時(shí)（例如問(wèn)題5：“齊國(guó)和魏國(guó)為什么爆發(fā)了桂林之戰(zhàn)？” 和問(wèn)題 7：“春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展有何影響？”），訊飛星火模型可能會(huì)給出類(lèi)似于“有重大影響”這樣的泛泛答案，試圖以此來(lái)模糊問(wèn)題或逃避具體回答。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

05

結(jié)尾

根據(jù)上面的實(shí)驗(yàn)結(jié)果可以看出，不同模型在回答春秋戰(zhàn)國(guó)問(wèn)題時(shí)各有優(yōu)勢(shì)和不足。文心一言在準(zhǔn)確性和歷史細(xì)節(jié)方面表現(xiàn)出色，適合被應(yīng)用于需要精確的答案的場(chǎng)景。而GPT-4則在提供更具體和豐富描述方面更強(qiáng)，適合需要更深入分析的情境。GPT3.5和訊飛星火的總體表現(xiàn)稍顯不足。

當(dāng)然，本文陳述的只是筆者個(gè)人通過(guò)一個(gè)細(xì)分垂直領(lǐng)域的極小數(shù)據(jù)集得出的手動(dòng)測(cè)評(píng)結(jié)果，距離全面完整的評(píng)估、比較各中LLM還相距甚遠(yuǎn)。在此分享感受與做法，也是拋磚引玉，希望能看到更多領(lǐng)域、更大范圍的對(duì)LLM的評(píng)估結(jié)果。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

06

附錄：數(shù)據(jù)詳情

四個(gè)LLM回答中國(guó)春秋戰(zhàn)國(guó)歷史知識(shí)二十個(gè)問(wèn)題的結(jié)果如下所示（其中紅色部分為錯(cuò)誤回答）：

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題一

《孫子兵法》的作者是誰(shuí)，他是哪個(gè)國(guó)家的軍事家？

正確答案：《孫子兵法》的作者是孫武，他是中國(guó)/齊國(guó)的軍事家。

文心一言

《孫子兵法》的作者是孫武，他是春秋時(shí)期齊國(guó)的軍事家。

訊飛星火

《孫子兵法》的作者是孫武，他是春秋時(shí)期的齊國(guó)人。

GPT-4

《孫子兵法》的作者是孫武，他是中國(guó)的軍事家。

GPT3.5

《孫子兵法》的作者是孫武，他是中國(guó)的軍事家。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題二

成語(yǔ)“千金買(mǎi)骨”的出處是哪里，解釋是什么？

正確答案：成語(yǔ)“千金買(mǎi)骨”出自《戰(zhàn)國(guó)策·燕策一》，意思是指用重金買(mǎi)下千里馬的骨頭，表示對(duì)求賢若渴的態(tài)度和決心。

文心一言

成語(yǔ)“千金買(mǎi)骨”出自《戰(zhàn)國(guó)策·燕策一》，意思是指用重金買(mǎi)下千里馬的骨頭，表示對(duì)求賢若渴的態(tài)度和決心。

訊飛星火

成語(yǔ)“千金買(mǎi)骨”的出處是《戰(zhàn)國(guó)策》。這個(gè)成語(yǔ)的意思是比喻為了得到人才而不惜代價(jià)。

GPT-4

成語(yǔ)“千金買(mǎi)骨”的出處是《左傳》，解釋通常為用重金購(gòu)買(mǎi)戰(zhàn)士的尸骨以表敬重，也可比喻人的才干或品質(zhì)有很高的價(jià)值。

GPT3.5

成語(yǔ)“千金買(mǎi)骨”的出處是《后漢書(shū)·馬援傳》，意為用千金購(gòu)買(mǎi)一塊骨頭，比喻不惜重金購(gòu)得珍貴之物。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題三

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)有哪些？? ?

正確答案：參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)是成得臣（子玉）。

文心一言

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)是成得臣。

訊飛星火

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)有成得臣、斗越椒等。

GPT-4

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)包括樓緩、壤地方等。

GPT3.5

參加城濮之戰(zhàn)的楚國(guó)將領(lǐng)包括春申君黃歇、伍子胥等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題四

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有哪些？

正確答案：同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有晉國(guó)和楚國(guó)。

文心一言

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有晉國(guó)和楚國(guó)。

訊飛星火

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有晉國(guó)、楚國(guó)、齊國(guó)、衛(wèi)國(guó)、魯國(guó)、宋國(guó)、陳國(guó)、蔡國(guó)和秦國(guó)。

GPT-4

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家有齊國(guó)和宋國(guó)。

GPT3.5

同時(shí)參加城濮之戰(zhàn)和邲之戰(zhàn)的國(guó)家是楚國(guó)和秦國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題五

齊國(guó)和魏國(guó)為什么爆發(fā)了桂林之戰(zhàn)？

正確答案：齊國(guó)和魏國(guó)爆發(fā)了桂林之戰(zhàn)是因?yàn)辇R國(guó)干涉了魏國(guó)和趙國(guó)之間的戰(zhàn)爭(zhēng)。

文心一言

齊國(guó)和魏國(guó)爆發(fā)了桂林之戰(zhàn)是因?yàn)辇R國(guó)干涉了魏國(guó)和趙國(guó)之間的戰(zhàn)爭(zhēng)。

訊飛星火

齊國(guó)和魏國(guó)爆發(fā)了桂林之戰(zhàn)，這場(chǎng)戰(zhàn)爭(zhēng)對(duì)趙國(guó)和秦國(guó)的發(fā)展有很大影響。

GPT-4

齊國(guó)和魏國(guó)爆發(fā)桂林之戰(zhàn)的原因主要是爭(zhēng)奪土地和權(quán)力。

GPT3.5

齊國(guó)和魏國(guó)爆發(fā)桂林之戰(zhàn)是因?yàn)閮蓢?guó)爭(zhēng)奪桂林地區(qū)的控制權(quán)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題六

戰(zhàn)國(guó)七雄中的哪個(gè)國(guó)家最終統(tǒng)一了中國(guó)，開(kāi)創(chuàng)了秦朝？

正確答案：戰(zhàn)國(guó)七雄中的秦國(guó)最終統(tǒng)一了中國(guó)，開(kāi)創(chuàng)了秦朝。

文心一言

戰(zhàn)國(guó)七雄中的秦國(guó)最終統(tǒng)一了中國(guó)，開(kāi)創(chuàng)了秦朝。

訊飛星火

秦國(guó)最終統(tǒng)一了中國(guó)，開(kāi)創(chuàng)了秦朝。

GPT-4

戰(zhàn)國(guó)七雄中秦國(guó)最終統(tǒng)一了中國(guó)，開(kāi)創(chuàng)了秦朝。

GPT3.5

戰(zhàn)國(guó)七雄中最終統(tǒng)一中國(guó)、開(kāi)創(chuàng)了秦朝的國(guó)家是秦國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題七

春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展有何影響？

正確答案：長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展造成深遠(yuǎn)影響，趙國(guó)削弱，秦國(guó)得以強(qiáng)大。

文心一言

春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展有何影響。這個(gè)問(wèn)題的答案比較復(fù)雜，可以參考相關(guān)歷史文獻(xiàn)。

訊飛星火

長(zhǎng)平之戰(zhàn)是發(fā)生在戰(zhàn)國(guó)時(shí)期趙國(guó)和秦國(guó)之間的一場(chǎng)著名戰(zhàn)役，這場(chǎng)戰(zhàn)役對(duì)于趙國(guó)和秦國(guó)的發(fā)展都有很大的影響。

GPT-4

春秋戰(zhàn)國(guó)時(shí)期的長(zhǎng)平之戰(zhàn)使趙國(guó)元?dú)獯髠?，?guó)勢(shì)日衰；對(duì)秦國(guó)而言，鞏固了國(guó)力，為統(tǒng)一六國(guó)奠定了基礎(chǔ)。

GPT3.5

長(zhǎng)平之戰(zhàn)對(duì)于趙國(guó)和秦國(guó)的發(fā)展造成深遠(yuǎn)影響，趙國(guó)削弱，秦國(guó)得以強(qiáng)大。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題八

哪件事件標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始？

正確答案：標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始的事件是三家分晉

文心一言

標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始的事件是三家分晉和田陳篡齊。

訊飛星火

春秋時(shí)期結(jié)束和戰(zhàn)國(guó)時(shí)期開(kāi)始的標(biāo)志是公元前475年吳越爭(zhēng)霸戰(zhàn)爭(zhēng)的失敗。

GPT-4

公元前403年館陶之戰(zhàn)（即晉國(guó)滅趙國(guó)，將其分化為韓、趙、魏三國(guó)）標(biāo)志著春秋時(shí)期的結(jié)束和戰(zhàn)國(guó)時(shí)期的開(kāi)始。

GPT3.5

春秋時(shí)期結(jié)束、戰(zhàn)國(guó)時(shí)期開(kāi)始的標(biāo)志事件是鄭國(guó)滅亡（戰(zhàn)國(guó)初期的齊桓公四年）。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題九

蘇秦和張儀共同訪問(wèn)過(guò)哪些國(guó)家？

正確答案：蘇秦和張儀共同訪問(wèn)過(guò)趙國(guó)、魏國(guó)、燕國(guó)、齊國(guó)、楚國(guó)、韓國(guó)等。

文心一言

蘇秦和張儀共同訪問(wèn)過(guò)的國(guó)家有趙國(guó)、燕國(guó)和韓國(guó)。

訊飛星火

蘇秦和張儀共同訪問(wèn)過(guò)中山國(guó)、燕國(guó)、齊國(guó)等國(guó)家。

GPT-4

蘇秦和張儀共同訪問(wèn)過(guò)齊、楚、燕、漢、趙、韓、魏等國(guó)家。

GPT3.5

蘇秦和張儀共同訪問(wèn)過(guò)趙國(guó)、魏國(guó)、燕國(guó)等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十

成語(yǔ)“懸梁刺股”是從誰(shuí)的經(jīng)歷衍生的？

正確答案：成語(yǔ)“懸梁刺股”是從蘇秦/孫敬的經(jīng)歷中衍生的。

文心一言

成語(yǔ)“懸梁刺股”是從蘇秦的經(jīng)歷中衍生的。

訊飛星火

“懸梁刺股”是從孫敬的經(jīng)歷中衍生出來(lái)的。

GPT-4

成語(yǔ)“懸梁刺股”是從蘇軾的故事中衍生的。

GPT3.5

成語(yǔ)“懸梁刺股”源于戰(zhàn)國(guó)時(shí)期的鄭國(guó)大夫子產(chǎn)的經(jīng)歷。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十一

“管仲治齊”和“商鞅變法”有哪些共同點(diǎn)？

正確答案：“管仲治齊”和“商鞅變法”的共同點(diǎn)是它們都推行了法家思想，注重法制建設(shè)和經(jīng)濟(jì)改革。

文心一言

“管仲治齊”和“商鞅變法”的共同點(diǎn)是它們都推行了法家思想，注重法制建設(shè)和經(jīng)濟(jì)改革。

訊飛星火

“管仲治齊”和“商鞅變法”有很多共同點(diǎn)，比如都強(qiáng)調(diào)以法治國(guó)，都有改革措施等。

GPT-4

“管仲治齊”和“商鞅變法”的共同點(diǎn)主要有：加強(qiáng)封建中央集權(quán)，推行法治，重視農(nóng)業(yè)和發(fā)展國(guó)民經(jīng)濟(jì)，實(shí)行嚴(yán)格的軍隊(duì)管理和征兵制度。

GPT3.5

“管仲治齊”和“商鞅變法”都是戰(zhàn)國(guó)時(shí)期改革的代表，致力于國(guó)家的發(fā)展與強(qiáng)大。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十二

春秋戰(zhàn)國(guó)時(shí)期秦國(guó)在誰(shuí)的治理下變得強(qiáng)盛起來(lái)？

正確答案：秦國(guó)在商鞅/秦穆公的治理下變得強(qiáng)盛起來(lái)。

文心一言

秦國(guó)在商鞅的治理下變得強(qiáng)盛起來(lái)。

訊飛星火

秦國(guó)在秦穆公的治理下變得強(qiáng)盛起來(lái)。

GPT-4

秦國(guó)在商鞅的治理下變得強(qiáng)盛起來(lái)。

GPT3.5

秦國(guó)在秦穆公的治理下變得強(qiáng)盛起來(lái)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十三

齊桓公和秦孝公作為春秋時(shí)期的明君，他們的治國(guó)策略有何相似之處？

正確答案：齊桓公和秦孝公作為春秋時(shí)期的明君，他們的治國(guó)策略相似之處包括：重視法治、強(qiáng)化中央集權(quán)、擴(kuò)大國(guó)土、倡導(dǎo)和平共處。

文心一言

齊桓公和秦孝公作為春秋時(shí)期的明君，他們的治國(guó)策略的相似之處在于都推行了改革，注重經(jīng)濟(jì)發(fā)展和國(guó)家實(shí)力提升。

訊飛星火

齊桓公和秦孝公作為春秋時(shí)期的明君，他們的治國(guó)策略相似之處在于都強(qiáng)調(diào)以德治國(guó)。

GPT-4

齊桓公和秦孝公作為春秋時(shí)期的明君，他們的治國(guó)策略相似之處包括：重視法治、強(qiáng)化中央集權(quán)、擴(kuò)大國(guó)土、倡導(dǎo)和平共處。

GPT3.5

齊桓公和秦孝公都推行了改革政策，重用人才，提升國(guó)力，促進(jìn)國(guó)家繁榮。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十四

歷史上第一次經(jīng)濟(jì)改革是哪個(gè)事件？

正確答案：歷史上第一次經(jīng)濟(jì)改革是管仲改革。

文心一言

歷史上第一次經(jīng)濟(jì)改革是管仲改革。

訊飛星火

歷史上第一次經(jīng)濟(jì)改革是管仲的改革。

GPT-4

歷史上第一次經(jīng)濟(jì)改革通常被認(rèn)為是中國(guó)戰(zhàn)國(guó)時(shí)期的商鞅變法。

GPT3.5

歷史上第一次經(jīng)濟(jì)改革是商鞅變法，發(fā)生在戰(zhàn)國(guó)時(shí)期的秦國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十五

哪些國(guó)家參與了不止一次著名戰(zhàn)役？

正確答案：參與了不止一次著名戰(zhàn)役的國(guó)家有晉國(guó)、齊國(guó)、秦國(guó)、楚國(guó)等。

文心一言

參與了不止一次著名戰(zhàn)役的國(guó)家有晉國(guó)、齊國(guó)、秦國(guó)、楚國(guó)等。

訊飛星火

參與了不止一次著名戰(zhàn)役的國(guó)家有晉國(guó)、楚國(guó)、齊國(guó)、秦國(guó)等。

GPT-4

參與過(guò)不止一次著名戰(zhàn)役國(guó)家的例子包括楚國(guó)、秦國(guó)等。

GPT3.5

參與了不止一次著名戰(zhàn)役的國(guó)家包括秦國(guó)、楚國(guó)、趙國(guó)等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十六

哪些人物有不止一個(gè)稱號(hào)？

正確答案：不止一個(gè)稱號(hào)的人物例子有：孔子（稱號(hào)：孔子，孔夫子）、老子（稱號(hào)：老子，李耳、太上老君）等。

文心一言

有不止一個(gè)稱號(hào)的人物有姜小白、田文、趙雍等。

訊飛星火

有不止一個(gè)稱號(hào)的人物有孔子（儒家學(xué)派創(chuàng)始人）、荀子（荀況）、韓非子（法家代表人物）等。

GPT-4

不止一個(gè)稱號(hào)的人物例子有：孔子（稱號(hào)：孔子，孔夫子）、老子（稱號(hào)：老子，李耳、太上老君）等。

GPT3.5

有不止一個(gè)稱號(hào)的人物包括孔子（孔夫子、仲尼）、孟子（孟子、孟軻）等。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十七

著名的春秋五霸分別來(lái)自哪五個(gè)國(guó)家？

正確答案：春秋時(shí)期的五霸分別來(lái)自齊國(guó)、晉國(guó)、秦國(guó)、楚國(guó)和燕國(guó)。

文心一言

著名的春秋五霸分別來(lái)自齊國(guó)、晉國(guó)、楚國(guó)、宋國(guó)、秦國(guó)。

訊飛星火

著名的春秋五霸分別來(lái)自齊桓公、晉文公、楚莊王、吳王闔閭和越王勾踐所在的國(guó)家。

GPT-4

著名的春秋五霸分別來(lái)自齊國(guó)（齊桓公）、晉國(guó)（晉景公）、秦國(guó)（秦穆公）、晉國(guó)（晉文公）、楚國(guó)（楚莊王）。

GPT3.5

春秋時(shí)期的五霸分別來(lái)自齊國(guó)、晉國(guó)、秦國(guó)、楚國(guó)和燕國(guó)。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十八

孔子是什么學(xué)派的創(chuàng)始人？

正確答案：孔子是儒家學(xué)派的創(chuàng)始人。

文心一言

孔子是儒家學(xué)派的創(chuàng)始人。

訊飛星火

孔子是儒家學(xué)派的創(chuàng)始人。

GPT-4

孔子是儒家學(xué)派的創(chuàng)始人。

GPT3.5

孔子是儒家學(xué)派的創(chuàng)始人。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題十九

孔子的弟子中有誰(shuí)在晉國(guó)擔(dān)任過(guò)帝師？

正確答案：子夏在晉國(guó)擔(dān)任過(guò)帝師。

文心一言

孔子的弟子中在晉國(guó)擔(dān)任過(guò)帝師的是端木賜。

訊飛星火

孔子的弟子中有曾子在晉國(guó)擔(dān)任過(guò)帝師。

GPT-4

孔子的弟子子夏（字：卜商）在晉國(guó)擔(dān)任過(guò)帝師。

GPT3.5

孔子的弟子子貢曾在晉國(guó)擔(dān)任過(guò)帝師。

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

問(wèn)題二十

春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中，誰(shuí)是最后一個(gè)被稱為"霸"的國(guó)君？

正確答案：春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中，最后一位被稱為"霸"的國(guó)君是越王勾踐/楚莊王。

文心一言

春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中，最后一位被稱為"霸"的國(guó)君是越王勾踐。

訊飛星火

春秋五霸中最后一個(gè)被稱為“霸”的國(guó)君是越王勾踐。

GPT-4

春秋戰(zhàn)國(guó)時(shí)期的"春秋五霸"中，楚莊王（春秋末期）是最后一個(gè)被稱為"霸"的國(guó)君。

GPT3.5

春秋戰(zhàn)國(guó)時(shí)期的“春秋五霸”中，最后一個(gè)被稱為“霸”的國(guó)君是韓國(guó)的韓昭侯。

歡迎關(guān)注微軟 ATP 官方賬號(hào)

微軟 ATP 一手資訊搶先了解

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn),文心一言,人工智能

點(diǎn)擊“閱讀原文” | 了解更多 AI 賦能案例文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-734681.html

到了這里，關(guān)于文心一言、訊飛星火與GPT-4/3.5在回答中文歷史問(wèn)題的表現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

訊飛星火_VS_文心一言
獲得訊飛星火認(rèn)知大模型體驗(yàn)授權(quán)，第一時(shí)間來(lái)測(cè)試一下效果，使用申請(qǐng)手機(jī)號(hào)登錄后，需要同意訊飛SparkDesk體驗(yàn)規(guī)則，如下圖所示：同意之后就可以進(jìn)行體驗(yàn)了，界面如下：訊飛星火效果體驗(yàn) 以下Prompt來(lái)自https://github.com/THUDM/ChatGLM-6B 自我認(rèn)知星火文心一言在自我認(rèn)知方
2024年02月09日
瀏覽(24)
一道題告訴你為什么GPT4被封神！橫向測(cè)評(píng)大模型的推理能力：ChatGPT、Claude、Gemini、文心一言、訊飛星火、通義千問(wèn)、天工、智譜清言、Kimi Chat！
大家好，我是木易，一個(gè)持續(xù)關(guān)注AI領(lǐng)域的互聯(lián)網(wǎng)技術(shù)產(chǎn)品經(jīng)理，國(guó)內(nèi)Top2本科，美國(guó)Top10 CS研究生，MBA。我堅(jiān)信AI是普通人變強(qiáng)的“ 外掛 ”，所以創(chuàng)建了“AI信息Gap”這個(gè)公眾號(hào)，專注于分享AI全維度知識(shí)，包括但不限于 AI科普， AI工具測(cè)評(píng) ， AI效率提升， AI行業(yè)洞察。關(guān)
2024年04月13日
瀏覽(91)
文心一言沒(méi)有體驗(yàn)上，看看訊飛星火認(rèn)知大模型
目錄 ? 前言正文 1.簡(jiǎn)單對(duì)話環(huán)節(jié) 1.1什么是訊飛星火認(rèn)知大模型 1.2你都可以干一些什么 1.3你的訓(xùn)練數(shù)據(jù)庫(kù)還在持續(xù)更新么 1.4今天是哪一天 1.5宇宙中有哪些目前認(rèn)為可能存在生命的星球 2.輔助學(xué)習(xí)對(duì)話 2.1我想完成一篇關(guān)于CT檢測(cè)技術(shù)的論文綜述，你有什么好的建議么？ 2.2可
2024年02月03日
瀏覽(36)
大模型圓桌，ChatGPT、文心一言、訊飛星火如何看待「泛自動(dòng)駕駛」
? 2022年11月30日，ChatGPT橫空出世，掀開(kāi)了人工智能認(rèn)知大模型的進(jìn)化爆發(fā)序幕。半年以來(lái)，國(guó)內(nèi)外科技公司不甘落后，相繼推出各自的認(rèn)知模型，試圖在巨大時(shí)代浪潮里分得一杯羹。那么，層出不窮的大模型如何看待人類(lèi)所處的時(shí)代，如何分析未來(lái)的發(fā)展？作為泛自動(dòng)駕駛領(lǐng)
2024年02月13日
瀏覽(21)
文心一言 VS 訊飛星火 VS chatgpt （225）-- 算法導(dǎo)論16.3 7題
推廣赫夫曼算法以生成三進(jìn)制碼字需要對(duì)算法進(jìn)行一定的修改，確保在每一步選擇頻率最低的三個(gè)節(jié)點(diǎn)進(jìn)行合并，并生成對(duì)應(yīng)的三進(jìn)制碼。以下是推廣赫夫曼算法的Go語(yǔ)言實(shí)現(xiàn)，并附帶證明其能生成最優(yōu)三進(jìn)制碼的思路。首先，我們需要定義赫夫曼樹(shù)節(jié)點(diǎn)的數(shù)據(jù)結(jié)構(gòu)，并實(shí)現(xiàn)
2024年04月26日
瀏覽(88)
文心一言 VS 訊飛星火 VS chatgpt （60）-- 算法導(dǎo)論6.4 4題
文心一言 VS 訊飛星火 VS chatgpt （60）-- 算法導(dǎo)論6.4 4題要證明在最壞情況下，HEAPSORT 的時(shí)間復(fù)雜度是 Ω(n log n)，我們需要考慮在何種情況下堆排序的時(shí)間復(fù)雜度最低。在堆排序中，構(gòu)建最大堆的時(shí)間復(fù)雜度為 O(n)，這是因?yàn)樵谧顗那闆r下，堆中每個(gè)元素都需要與其他元素進(jìn)行
2024年02月16日
瀏覽(20)
文心一言 VS 訊飛星火 VS chatgpt （76）-- 算法導(dǎo)論7.3 1題
在分析算法的性能時(shí)，期望運(yùn)行時(shí)間是一個(gè)重要的指標(biāo)，它描述了算法在平均情況下的表現(xiàn)。期望運(yùn)行時(shí)間考慮了所有可能的情況，包括輸入數(shù)據(jù)的分布和隨機(jī)性等因素。對(duì)于隨機(jī)化算法，最壞情況下的運(yùn)行時(shí)間可能會(huì)非常糟糕，但是這種最壞情況在實(shí)際應(yīng)用中出現(xiàn)的概率非
2024年02月12日
瀏覽(26)
文心一言 VS 訊飛星火 VS chatgpt （68）-- 算法導(dǎo)論6.5 7題
文心一言 VS 訊飛星火 VS chatgpt （68）-- 算法導(dǎo)論6.5 7題優(yōu)先隊(duì)列是一種數(shù)據(jù)結(jié)構(gòu)，其中每個(gè)元素都有一個(gè)關(guān)聯(lián)的優(yōu)先級(jí)或權(quán)值。在優(yōu)先隊(duì)列中，元素按照它們的優(yōu)先級(jí)被排序，使得較小的優(yōu)先級(jí)先被處理。因此，我們可以使用優(yōu)先隊(duì)列來(lái)實(shí)現(xiàn)先進(jìn)先出隊(duì)列。要實(shí)現(xiàn)先進(jìn)先出隊(duì)
2024年02月14日
瀏覽(24)
文心一言 VS 訊飛星火 VS chatgpt （24）-- 算法導(dǎo)論4.2 6題
Strassen 算法是一種用于矩陣乘法的分治算法，它將原始的矩陣分解為較小的子矩陣，然后使用子矩陣相乘的結(jié)果來(lái)計(jì)算原始矩陣的乘積。對(duì)于一個(gè) knn 矩陣和一個(gè) nkn 矩陣相乘，如果使用 Strassen 算法進(jìn)行分解，最壞情況下需要進(jìn)行 7 次矩陣乘法運(yùn)算和 6 次加法運(yùn)算。因此，在
2024年02月06日
瀏覽(45)
文心一言 VS 訊飛星火 VS chatgpt （58）-- 算法導(dǎo)論6.4 2題
文心一言 VS 訊飛星火 VS chatgpt （58）-- 算法導(dǎo)論6.4 2題在 HEAPSORT 算法中使用以下循環(huán)不變量是正確的： 1.在算法的第 2~5 行 for 循環(huán)每次迭代開(kāi)始時(shí)，子數(shù)組 A[1…i] 是一個(gè)包含了數(shù)組 A[1…n] 中第 i 小元素的最大堆。 2.子數(shù)組 A[i+1…n] 包含了數(shù)組 A[1…n] 中已排序的 n-i 個(gè)最大元
2024年02月16日
瀏覽(17)

<table id="l1ww1"><kbd id="l1ww1"></kbd></table>