大家好,我是木易,一個持續(xù)關注AI領域的互聯(lián)網(wǎng)技術產(chǎn)品經(jīng)理,國內Top2本科,美國Top10 CS研究生,MBA。我堅信AI是普通人變強的“外掛”,所以創(chuàng)建了“AI信息Gap”這個公眾號,專注于分享AI全維度知識,包括但不限于AI科普,AI工具測評,AI效率提升,AI行業(yè)洞察。關注我,AI之路不迷路,2024谷歌一起變強。
一些結論
模型名稱 | 正確性 | 邏輯性 | 解釋清晰度 | 推理復雜度 | 總體評價 |
---|---|---|---|---|---|
ChatGPT 3.5 | ? | ? | ? | 中 | 中 |
ChatGPT 4 | ? | ? | ? | 高 | 高 |
Claude2.1 | ? | ? | ? | 低 | 低 |
Gemini Pro | ? | ? | ? | 低 | 低 |
Gemini Ultra | ? | ? | ? | 低 | 低 |
文心一言 | ? | ? | ? | 中 | 中 |
訊飛星火 | ? | ? | ? | 低 | 低 |
通義千問 | ? | ? | ? | 中 | 中 |
天工(開啟Copilot選項) | ? | ? | ? | 低 | 低 |
智譜清言 | ? | ? | ? | 低 | 低 |
Kimi Chat | ? | ? | ? | 低 | 低 |
總體評價:ChatGPT 4表現(xiàn)最為出色,顯示了強大的邏輯推理能力、清晰的解釋能力以及處理復雜問題的能力。國產(chǎn)大模型中,文心一言和通義千問表現(xiàn)最突出。而其他大模型如Claude2.1、Gemini Pro/Ultra、訊飛星火、天工、智譜清言以及Kimi Chat則在這些方面表現(xiàn)不佳,特別是在邏輯性和推理復雜度方面。
針對這些模型,我之前都有寫過每個模型的介紹文章,詳情可以查看我的歷史文章。
關于LLM大語言模型的推理能力
在評價一個LLM大語言模型的能力時,很重要的一個指標是推理能力。推理能力是指模型在處理信息時,能夠進行邏輯推導、分析和解決問題的能力。這種能力通常體現(xiàn)在模型對復雜問題的理解、對信息的整合以及在給定上下文中生成合理、連貫和有說服力的回答。在評價LLM的推理能力時,我們通常會考慮以下幾個方面:
-
邏輯連貫性:模型能否在回答中保持邏輯一致性,避免自相矛盾,確保推理過程的合理性。
-
上下文理解:模型是否能夠理解并利用上下文信息來生成相關且準確的回答。這包括對長文本的理解能力,以及在多輪對話中保持話題的連貫性。
-
問題解決:模型在面對需要創(chuàng)造性思維或特定知識的問題時,能否提供有效的解決方案或建議。
-
常識推理:模型是否能夠運用常識性知識,對現(xiàn)實世界的情況做出合理的推斷。
-
因果推理:模型在分析因果關系時,能否準確地識別原因和結果,并在此基礎上進行推理。
-
數(shù)據(jù)驅動推理:模型能否利用提供的數(shù)據(jù)或信息,進行有效的分析和推理,得出有意義的結論。
-
多模態(tài)推理:對于包含多種信息類型(如文本、圖像、聲音等)的輸入,模型是否能夠綜合這些信息進行推理。
-
抗干擾能力:在面對模糊、不完整或有誤導性的信息時,模型能否保持推理的準確性,不被錯誤信息所干擾。
-
適應性:模型在面對新的、未曾訓練過的任務或領域時,能否快速適應并展現(xiàn)出推理能力。
-
解釋性:模型在給出答案時,是否能夠提供清晰的解釋,使得用戶理解其推理過程。
在實際應用中,推理能力的強弱直接影響到LLM在各個領域的實用性,如教育、醫(yī)療、法律咨詢等。因此,開發(fā)者和研究者會通過各種測試和評估方法來不斷優(yōu)化模型的推理能力,以提高其在實際場景中的有效性和可靠性。
測評對象
今天我們選取曾經(jīng)介紹過的一些大模型/對話工具來橫向測評它們的推理能力,包括:
-
ChatGPT(包括ChatGPT 3.5 及 ChatGPT 4)
-
Claude(Claude2.1)
-
Gemini(包括Gemini Pro 及 Gemini Ultra)
-
文心一言
-
訊飛星火
-
通義千問
-
天工(開啟Copilot選項)
-
智譜清言(GLM-4)
-
Kimi Chat
測試題目
神秘島嶼的守護者
在一個神秘島嶼上,有三個守護者:X、Y、Z,守護著通往寶藏的秘密通道。島上有一個規(guī)則:每個守護者要么總是說謊,要么總是說真話。X說Y總是說謊;Y說Z有時說真話有時說謊;Z說X和Y從不同時說謊(即如果一個人說謊,另一個就說真話)。根據(jù)這些信息,你能判斷出X、Y、Z每個人是說謊者還是說真話者嗎?
測試題目分析
答案:X說真話,Y說謊,Z說真話。
這是一道典型的邏輯推理題,首先考察大模型對題目上下文的理解,條件是“每個守護者要么總是說謊,要么總是說真話”,這句話看起來像是廢話,但當我們繼續(xù)看下面的條件“Y說Z有時說真話有時說謊”,這兩個條件聯(lián)系起來,就能得出結論:Y是說謊者。因為守護著只能總是說謊或者總是說真話。理解這一層邏輯,接下來Z和X就好判斷:因為Y說謊,所以X說真話,而因為X說真話且Y說謊,所以Z說真話。
這類題目的最常見的推理方式應該是假設法,本題通過假設法也能夠解答。同時,題目中還隱藏了另外一層邏輯關系,X說Y在說謊,如果X說真話,那么Y確實說謊;如果X說假話,那么Y說真話,也就是X和Y其中一個說真話,一個說謊。那么Z一定說真話。
測試結果展示
ChatGPT 3.5
根據(jù)題目中提供的信息,我們可以通過邏輯推理來確定每個守護者是說謊者還是說真話者。
-
假設 X 是說真話的。
-
如果 X 是說真話的,那么 Y 說謊,因為 X 說 Y 總是說謊。
-
如果 Y 是說謊的,那么 Z 必須說真話,因為 Y 說 Z 有時說真話有時說謊,但如果 Z 說謊,則與 X 說的不矛盾。這與 Z 說 X 和 Y 從不同時說謊相矛盾。所以 Z 必須說真話。
-
如果 Z 說真話,則與 X 說的不矛盾。
-
因此,假設 X 是說真話的不成立。
-
-
假設 X 是說謊的。
-
如果 X 是說謊的,那么 Y 必須說真話,因為 X 說 Y 總是說謊,而如果 Y 說謊,則與 X 說的不矛盾。
-
如果 Y 是說真話的,那么 Z 必須說謊,因為 Y 說 Z 有時說真話有時說謊,但如果 Z 說真話,則與 Y 說的不矛盾。
-
如果 Z 是說謊的,那么與 Y 說的不矛盾,因此 Z 必須說真話。
-
所以假設 X 是說謊的不成立。
-
因此,我們得出結論:X、Y、Z 分別是說真話者、說謊者、說真話者。
ChatGPT 3.5點評
盡管答案是正確的,但推理過程邏輯混亂,解釋不清不楚。
ChatGPT 4
我們可以通過邏輯推理來解決這個問題。
-
X說Y總是說謊。
-
Y說Z有時說真話有時說謊(這意味著Y聲稱Z不是總說謊也不是總說真話,但根據(jù)規(guī)則,守護者要么總是說謊要么總是說真話,這意味著Y自己在說謊)。
-
Z說X和Y從不同時說謊(這意味著如果一個說謊,另一個就說真話)。
首先,由于Y的陳述自相矛盾(因為根據(jù)規(guī)則,一個守護者不能有時說真話有時說謊),我們知道Y肯定是說謊的。
如果Y是說謊的,那么X關于Y的陳述是真的,因此X是說真話的。
Z說X和Y不會同時說謊。既然我們知道Y是說謊的,而X是說真話的,Z的陳述也是真的,因此Z也是說真話的。
綜上所述:
-
X是說真話的。
-
Y是說謊的。
-
Z是說真話的。
ChatGPT 4點評
完全正確的,推理過程也有理有據(jù),真神!
Claude2.1
好的,讓我仔細分析一下:
X說Y總是說謊。 Y說Z有時說真話有時說謊。 Z說X和Y從不同時說謊(即如果一個人說謊,另一個就說真話)。
首先,關于Y的性質,從X和Z的說法我們可以判斷出: 如果X說真話,那么Y就總是說謊。 如果X說謊,那么根據(jù)Z的說法,Y這時應該說真話。 所以不管X說真話還是說謊,Y都是說真話的。
然后看X的性質: X說Y總是說謊,但我們知道Y是說真話的,所以X在這里是在說謊。
最后Z的性質就很清楚了: Y說Z有時真有時假,所以Z是有時說真話有時說謊的。
綜上所述: X是說謊者 Y是說真話者 Z是有時說真話有時說謊者
我的分析過程和邏輯清晰嗎?有什么需要補充和說明的地方嗎?
Claude2.1點評
Claude在這道題目已經(jīng)完全凌亂了,回答完全錯誤。
Gemini Pro
首先,我們可以根據(jù)Z的說法來判斷X和Y是否同時說謊。如果X和Y同時說謊,那么Z就說謊了。但是,Z說X和Y從不同時說謊,所以X和Y不可能同時說謊。
其次,我們可以根據(jù)X的說法來判斷Y是否是說謊者。如果X是說真話者,那么Y就是說謊者。但是,X說Y總是說謊,而根據(jù)Z的說法,Y不可能總是說謊。因此,X不可能是說真話者,而是說謊者。
最后,我們可以根據(jù)Y的說法來判斷Z是否是說真話者。如果Y是說真話者,那么Z有時說真話有時說謊。但是,根據(jù)X的說法,Y不可能是說真話者。因此,Y也是說謊者。
綜上所述,我們可以判斷出:
-
X是說謊者
-
Y是說謊者
-
Z是說謊者
由于所有守護者都是說謊者,因此他們關于彼此的說法都是錯誤的。
具體來說:
-
X說Y總是說謊,但實際上Y有時說真話有時說謊。
-
Y說Z有時說真話有時說謊,但實際上Z總是說謊。
-
Z說X和Y從不同時說謊,但實際上X和Y總是同時說謊。
因此,要找到通往寶藏的秘密通道,我們需要反過來理解守護者的話。例如,如果X說某個方向是通往寶藏的,那么我們應該選擇另一個方向。
Gemini Pro點評
完全錯誤。
Gemini Ultra
根據(jù)題中信息,我們可以構建如下邏輯表:
守護者 | X | Y | Z |
---|---|---|---|
X 關于 Y | 說謊 | - | - |
Y 關于 Z | 有時說真話有時說謊 | - | - |
Z 關于 X 和 Y | 從不同時說謊 | - | - |
步驟 1:分析 X 關于 Y 的說法
-
如果 X 是說真話者,那么 Y 就是說謊者。
-
如果 X 是說謊者,那么 Y 就是說真話者。
步驟 2:分析 Y 關于 Z 的說法
-
由于我們無法確定 X 的身份,所以無法確定 Y 關于 Z 的說法是真是假。
步驟 3:分析 Z 關于 X 和 Y 的說法
-
如果 Z 是說真話者,那么 X 和 Y 不可能同時說謊。
-
如果 Z 是說謊者,那么 X 和 Y 至少有一個說謊。
步驟 4:綜合分析
-
由于無法確定 Y 關于 Z 的說法,所以我們無法通過 Z 的說法來判斷 X 和 Y 的身份。
- 但是,我們可以根據(jù) Z 關于 X 和 Y 的說法來確定 Z 的身份:
-
如果 X 和 Y 同時說真話,那么 Z 就是說謊者。
-
如果 X 和 Y 同時說謊,那么 Z 就是說真話者。
-
如果 X 和 Y 一人說真話一人說謊,那么 Z 的身份無法確定。
-
最終結論:
-
X 和 Y 的身份無法確定,可能是說真話者也可能是說謊者。
- Z 的身份取決于 X 和 Y 的實際情況:
-
如果 X 和 Y 同時說真話,那么 Z 是說謊者。
-
如果 X 和 Y 同時說謊,那么 Z 是說真話者。
-
如果 X 和 Y 一人說真話一人說謊,那么 Z 的身份無法確定。
-
補充說明:
由于題目沒有提供更多信息,所以無法唯一確定 X、Y、Z 的身份。只有當我們知道其中一個守護者是說真話者或說謊者時,才能推導出其他兩個守護者的身份。
以下是一些可能的情況:
-
X 是說真話者,Y 是說謊者,Z 是說真話者:
-
X 說 Y 是說謊者,這是真話。
-
Y 說 Z 有時說真話有時說謊,這是謊話,因為 Z 實際上總是說真話。
-
Z 說 X 和 Y 從不同時說謊,這是真話,因為 X 和 Y 確實不可能同時說真話。
-
-
X 是說謊者,Y 是說真話者,Z 是說謊者:
-
X 說 Y 是說謊者,這是謊話,因為 Y 實際上總是說真話。
-
Y 說 Z 有時說真話有時說謊,這是真話,因為 Z 實際上總是說謊。
-
Z 說 X 和 Y 從不同時說謊,這是謊話,因為 X 和 Y 確實會同時說真話。
-
-
X 是說謊者,Y 是說謊者,Z 是說真話者:
-
X 說 Y 是說謊者,這是謊話,因為 Y 實際上也是說謊者。
-
Y 說 Z 有時說真話有時說謊,這是謊話,因為 Z 實際上總是說真話。
-
Z 說 X 和 Y 從不同時說謊,這是真話,因為 X 和 Y 確實不可能同時說真話。
-
-
X 是說真話者,Y 是說真話者,Z 是說謊者:
-
X 說 Y 是說謊者,這是謊話,因為 Y 實際上也是說真話者。
-
Y 說 Z 有時說真話有時說謊,這是謊話,因為 Z 實際上總是說謊。
-
Z 說 X 和 Y 從不同時說謊,這是謊話,因為 X 和 Y 確實會同時說真話。
-
由于以上情況都滿足題目的條件,所以無法確定 X、Y、Z 的真實身份。
Gemini Ultra點評
看得出來,Gemini Ultra很努力,還做了一個邏輯表,但回答的完全錯誤。
文心一言
根據(jù)題意可知線索如下:
-
X說Y總是說謊
-
Y說Z有時說真話有時說謊
-
Z說X和Y從不同時說謊 因為每個守護者要么總是說謊,要么總是說真話,所以我們可以分別假設某個守護者總是說真話的情況來進行分析,如果推出矛盾,則假設不成立,該守護者就是說謊者。
-
假設X總是說真話:
-
X說Y總是說謊,由于X說真話,所以Y是說謊者。
-
Y說Z有時說真話有時說謊,由于Y是說謊者,所以Z總是說真話或總是說謊話。
-
Z說X和Y從不同時說謊,由于Z說真話,所以X和Y中只有一個是說謊者,與X說真話,Y說謊話一致。 綜上,假設X總是說真話時,X說真話,Y說謊話,Z的行為無法確定,假設成立。
-
假設Y總是說真話:
-
X說Y總是說謊,由于X說真話,所以Y是說謊者,與Y總是說真話矛盾。 綜上,假設Y總是說真話時,推出矛盾,假設不成立,所以Y是說謊者。
-
已知Y是說謊者,那么根據(jù)Y說Z有時說真話有時說謊,由于Y說謊,所以Z總是說真話。
-
Z說X和Y從不同時說謊,由于Z說真話,所以X和Y中只有一個是說謊者,已知Y是說謊者,所以X說真話。 綜上,X說真話,Y說謊話,Z說真話。
因此,X和Z總是說真話,Y總是說謊。
文心一言點評
給出了正確的答案,但推理過程基本是錯誤的。和ChatGPT 3.5的表現(xiàn)一致。
訊飛星火
要判斷X、Y、Z每個人是說謊者還是說真話者,我們可以通過他們的陳述來分析邏輯上的矛盾。
-
X說Y總是說謊。
-
Y說Z有時說真話有時說謊。
-
Z說X和Y從不同時說謊。
首先,如果X是說真話者,那么Y必須是說謊者,因為X說Y總是說謊。接著,如果Y是說謊者,那么Y的陳述“Z有時說真話有時說謊”也必然是謊言,因此Z只能是說謊者或說真話者中的一個,不能兩者都是。然而,這與Z的陳述“X和Y從不同時說謊”矛盾,因為如果Z是說真話者,那么X和Y不能同時說謊(而根據(jù)我們的假設,X是說真話者,Y是說謊者)。所以,X不能是說真話者。
現(xiàn)在假設X是說謊者,那么Y不能總是說謊,也就是說Y至少在某些時候說真話。由于Y說Z有時說真話有時說謊,這個陳述可以是真的也可以是假的。但如果Y是說真話者,那么Y的陳述就是真的,意味著Z確實有時說真話有時說謊。
接下來看Z的陳述,如果Z是說謊者,那么他的陳述“X和Y從不同時說謊”是假的,這意味著X和Y可以同時說謊。但我們已經(jīng)確定X是說謊者,如果Y也是說謊者,那么這與Y的陳述相矛盾,因為Y作為說謊者不能說Z有時說真話有時說謊。因此,Z不能是說謊者。
所以,Z必須是說真話者,這意味著X和Y確實從不同時說謊。既然我們已經(jīng)知道X是說謊者,那么Y必須是說真話者。
綜上所述:
-
X是說謊者。
-
Y是說真話者。
-
Z是說真話者。
訊飛星火點評
完全錯誤。
通義千問
根據(jù)這三個守護者的話,我們可以用邏輯推理分析他們各自的身份:
-
X 說 Y 總是說謊。
-
如果X說的是真話,那么Y確實總說謊。
-
如果X自己在說謊,那么Y應該是說實話的,但這與X所說的矛盾。
-
-
Y 說 Z 有時說真話有時說謊。
-
如果Y是說真話者,那么Z的確不是總是說謊也不是總是說真話,這是可能的。
-
如果Y是說謊者,那么按照他說的內容(“Z有時說真話有時說謊”),實際上意味著Z必須總是說真話或總是說謊,但由于Y在說謊,所以Z應為總是說真話或總是說謊。
-
-
Z 說 X 和 Y 從不同時說謊。
-
如果Z是說真話者,那么X和Y不會同時都是說謊者。
-
如果Z是說謊者,那么他就是在試圖讓我們相信X和Y同時說謊,但這將與Z作為始終說謊者的身份相悖,因為他現(xiàn)在恰恰是在說真話(因為X和Y不能同時說謊)。
-
綜合考慮上述情況,我們發(fā)現(xiàn):
-
如果Y是說謊者,那么根據(jù)Z的陳述,Z就必須是說真話者。
-
但是,如果Y是說謊者,而Z是說真話者,那么X就不能是說謊者,因為這樣會導致Y和Z同時說謊,與Z的聲明矛盾。
因此,唯一的邏輯結論是:Y 必須是說謊者,因為只有這樣才符合Z的陳述——Z不可能是說謊者(否則Y和Z就會同時說謊)。
進一步推論:
-
Y是說謊者,則Z是說真話者。
-
因為Z是說真話者,他說X和Y從不同時說謊,這意味著X是說真話者。
總結:
-
Y 是說謊者。
-
Z 是說真話者。
-
X 也是說真話者,因為他們沒有同時說謊。
通過這個邏輯鏈條,我們可以確定每個守護者的真實身份。
通義千問點評
通義千問的回答是ChatGPT 4后最接近答案的一個回答,給出了正確答案,雖然在推理過程中存在不清不楚的地方,但總體推理能力的表現(xiàn)比其他大模型強不少。
天工(開啟Copilot選項)
我們可以通過邏輯分析來解決這個問題。首先,我們注意到X說Y總是說謊,這意味著X認為Y不會說真話。Y說Z有時說真話有時說謊,這意味著Y認為Z不是始終說謊的人。而Z說X和Y從不同時說謊,這意味著Z認為X和Y不會同時說謊。
我們可以通過一個簡單的邏輯推理過程來解決這個問題。假設X、Y、Z中有且只有一個說真話,那么根據(jù)Z的話,X和Y不能同時說謊,否則Z的話就不成立。因此,我們可以得出結論,Z一定是在說謊,因為如果他不說謊,那么X和Y就不能同時說謊,這與Z的話相矛盾。
進一步分析,由于Z說X和Y從不同時說謊,我們可以得出X和Y中至少有一個人說真話。如果X和Y都說真話,那么根據(jù)X的話,Y應該說謊,這與實際情況不符。因此,我們可以得出結論,X和Y中只有一個人說真話,而另一個人說謊。
最后,我們來分析X和Y的話。X說Y總是說謊,如果X說謊,那么Y應該說真話,這與X的話相矛盾。因此,我們可以得出結論,X是在說真話,而Y是在說謊。
綜上所述,我們可以得出以下結論:
-
X守護者在說真話。
-
Y守護者在說謊。
-
Z守護者在說謊。
這個結論是基于邏輯推理和三位守護者的話語分析得出的。我們沒有發(fā)現(xiàn)任何違反這些守護者規(guī)則的可能性,因此,我們的推理是合理的。
以上分析基于了對守護者話語的邏輯性理解和推理,結合了邏輯學的基本原理,并通過排除法和邏輯矛盾來確定了守護者的真實情況。在類似的邏輯游戲中,這種方法是常見且有效的解決問題的策略。
天工點評
完全錯誤。
智譜清言
根據(jù)這些信息,我們可以進行如下推理:
-
假設X說真話,那么Y總是說謊。但這會導致矛盾,因為如果Y總是說謊,那么Y關于Z的說法應該是假的,即Z應該總是說真話或總是說謊。然而,Z關于X和Y的說法(X和Y不會同時說謊)將無法成立,因為如果Y說謊,X說真話,那么他們同時說謊了。因此,X不可能是說真話者。
-
假設X說謊,那么Y總是說真話。如果Y說真話,那么Z有時說真話有時說謊。但如果Z有時說真話有時說謊,那么Z關于X和Y的說法(X和Y不會同時說謊)也可能是真的,也可能是假的,因為Z的陳述是變化的。這種情況下,X和Y不會同時說謊,因為如果Y說謊,那么X就必須說真話,反之亦然。這樣,我們可以得出結論:X是說謊者,Y是說真話者,Z的陳述是變化的,有時說真話有時說謊。 因此,我們可以判斷出X是說謊者,Y是說真話者,Z的陳述是變化的,有時說真話有時說謊。
智譜清言點評
回答錯誤。
Kimi Chat
這是一個邏輯謎題,我們可以通過分析每個守護者的陳述來推斷他們的真實性。
首先,我們知道守護者要么是總是說謊,要么是總是說真話。我們可以用以下符號來表示他們的屬性:
-
T 表示總是說真話
-
L 表示總是說謊
現(xiàn)在,我們來分析他們的陳述:
-
X 說 Y 總是說謊。如果 X 說真話(X = T),那么 Y 必須總是說謊(Y = L)。如果 X 說謊(X = L),那么 Y 不是總是說謊,這與 X 的陳述矛盾,因為說謊者不會說別人總是說謊。
-
Y 說 Z 有時說真話有時說謊。如果 Y 說真話(Y = T),那么 Z 不能總是說真話或總是說謊,這與 Z 的陳述矛盾。如果 Y 說謊(Y = L),那么 Z 必須總是說真話或總是說謊,這與 Z 的陳述相符。
-
Z 說 X 和 Y 不同時說謊。如果 Z 說真話(Z = T),那么 X 和 Y 必須至少有一個說真話。如果 Z 說謊(Z = L),那么 X 和 Y 總是同時說謊,這與 X 的陳述相符(因為如果 X 說謊,Y 也說謊)。
現(xiàn)在,讓我們嘗試找出一個一致的解決方案:
-
如果 X 說真話(X = T),那么 Y 總是說謊(Y = L)。但這會導致 Z 的陳述(Z = T)與 Y 的陳述矛盾,因為 Z 說 X 和 Y 不同時說謊。所以,X 不能總是說真話。
-
如果 X 說謊(X = L),那么 Y 不是總是說謊。這意味著 Y 可以是說真話者。如果 Y 是說真話者(Y = T),那么 Z 必須有時說真話有時說謊。但這與 Z 的陳述矛盾,因為 Z 聲稱 X 和 Y 不同時說謊。所以,Y 也不能總是說真話。
-
既然 X 和 Y 都不能總是說真話,那么他們必須總是說謊。這樣,Z 的陳述(Z = T)就是真的,因為 X 和 Y 總是同時說謊。
綜上所述,我們可以得出結論:
-
X 是說謊者(X = L)
-
Y 是說謊者(Y = L)
-
Z 是說真話者(Z = T)
這樣,所有的陳述都變得一致。
Kimi Chat點評
回答錯誤。Kimi Chat主打的是對于長上下文的支持(20萬漢字上下文),以及長對話的一致性。
精選推薦
-
ChatGPT和文心一言哪個更好用?一道題告訴你答案!
-
白嫖GPT4,Dalle3和GPT4V - 字節(jié)開發(fā)的Coze初體驗!附教程及提示詞Prompt
-
字節(jié)開發(fā)的Coze進階使用:用免費的GPT4打造一個專屬的新聞播報機器人!附教程及提示詞Prompt
-
盤點那些免費的AI對話工具(國內篇):國內TOP3 AI聊天機器人產(chǎn)品介紹
-
AI聊天機器人,一個就夠了:文心一言、訊飛星火、通義千問AI聊天機器人深度對比(一)
-
AI聊天機器人,一個就夠了:文心一言、訊飛星火、通義千問AI聊天機器人深度對比(二)
-
人工智能時代的領跑者:你必須了解的全球三大AI聊天機器人!
-
抖音出的AI工具火了!自動生成抖音文案,一鍵腳本數(shù)字人成片!
-
2024年了你還在用百度翻譯?手把手教會你使用AI翻譯!一鍵翻譯網(wǎng)頁和PDF文件!
-
騰訊AI雖遲但到:騰訊文檔AI開啟公測!附申請地址及詳細教程!文章來源:http://www.zghlxwxcb.cn/news/detail-849587.html
都讀到這里了,點個贊鼓勵一下吧????????。關注我,AI之路不迷路,原創(chuàng)技術文章第一時間推送??。文章來源地址http://www.zghlxwxcb.cn/news/detail-849587.html
到了這里,關于一道題告訴你為什么GPT4被封神!橫向測評大模型的推理能力:ChatGPT、Claude、Gemini、文心一言、訊飛星火、通義千問、天工、智譜清言、Kimi Chat!的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!