場景1:處理長文本
和 ChatGPT 相比,Claude 2 最大的優(yōu)勢就是它高達 10 萬的 Token 數(shù)量。要知道標準的 GPT-4 才 8000,而 GPT-32K 也僅僅 3 萬 2。
和 ChatGPT 或 Claude 2 這樣的大模型對話就像與一個擁有短期記憶的朋友聊天。它可以記住你最后說過的幾句話,通過理解上下文,讓對話順利進行。而 Token 數(shù)量就像是大模型的短期記憶,Token 數(shù)量越大,它能記住的東西越多。因此,當你向 ChatGPT 提交過長的文本時,它常常會出現(xiàn)下圖所示的錯誤信息。
解決方案當然也有很多,比如:
- 在 OpenAI Playground 中使用 Token 數(shù)量更大的模型,比如 “GPT-4.5-turbo-16k” 或
“gpt-4-32k”。但是這樣需要額外消耗 API 的費用。 - 寫一個提示詞,告訴 ChatGPT 你將會把提交的內(nèi)容分為若干部分依次上傳。提示詞可以這樣寫 “The text that I’m
about to submit will be divided into several parts. I request that
you wait until all parts have been provided before summarizing or
answering any questions about it.
(我即將提交的文本將分為幾個部分。我請求您等到所有部分都提供完之后,再對其進行總結(jié)或回答任何問題。)”。上傳結(jié)束以后,你再向
ChatGPT 提問題或者分配任務(wù)。 - 使用谷歌瀏覽器插件 “ChatGPT File Uploader Extended”。這個插件會自動幫你把文件里的長文本分為若干部分提交給
ChatGPT。 - 放到記事本文件里并使用 ChatGPT 的代碼解釋器上傳。
場景2:上傳文件
除了和 ChatGPT 進行對話以外,我們常常會讓它幫我們執(zhí)行任務(wù),比如總結(jié) PDF 的內(nèi)容。ChatGPT 本身是不支持文件上傳的,如果要上傳 PDF 并總結(jié)內(nèi)容,需要借助 ChatGPT 插件。大多數(shù)插件是不支持文件上傳的,只能總結(jié)在線 PDF 的內(nèi)容。
AskYourPDF 這個插件雖然支持上傳,但是得脫離 ChatGPT 進入 AskYourPDF 的網(wǎng)站上。 它總結(jié)文件里長文本非常有效,但它們是通過自己的服務(wù)器對長文本進行二次處理,需要你花費額外的等待時間。本身 GPT-4 的響應(yīng)速度就比較慢,再加上插件執(zhí)行任務(wù)的時間,真的需要耐心等待。
比如我上傳了一個學術(shù)論文,并問它論文里的事實,假設(shè)和結(jié)論是什么。它需要調(diào)用三次 API,然后匯總出一個答案。
Claude 2 就不同了,你可以直接在聊天界面上上傳文件,而且還可以一次上傳 5 個文件。它和 PDF 交互非常迅速。對于程序員來說,可以直接把多個代碼文件同時上傳并 Debug。
當然,它對文件的處理停留在文本層面,無法像 ChatGPT 的代碼解釋器一樣通過代碼處理文檔,比如給 PDF 加水印,編輯圖片等等。
場景3:進行冗長的多輪對話
說到這里,你可能在想,既然 ChatGPT 的 Token 容量這么小,那么當我和它進行了那么多輪冗長的對話之后,它怎么還記得我開頭說的內(nèi)容。
其實它會根據(jù)你最近一次的請求內(nèi)容,有選擇性的截取你和它對話中最相關(guān)的內(nèi)容,甚至還可以進行多次迭代來理解上下文。但本質(zhì)上還是沒有突破 Token 的限制,如果對話超出此范圍,模型就會開始“忘記”之前的部分。比如一開始你給它設(shè)定一個角色,它在后續(xù)的對話過程中會忘記之前的部分。如果想讓它一直記住某些關(guān)鍵信息,一個技巧就是時不時地提醒它。
因此,當我要進行很多輪冗長的對話時,也會考慮使用 Claude 2,取決于我對回答質(zhì)量的要求。Claude 2 雖然 Token 容量很大,但是模型本身的參數(shù)比較小,所以它回答的質(zhì)量很多時候比不上 GPT-4。
場景4:我的提示詞里涉及2021年9月之后的信息
大家都知道 ChatGPT 3.5 和 ChatGPT 4 的訓練數(shù)據(jù)是在 2021 年 9 月之前,對于之后發(fā)生的事件并不了解。但是 Claude 2 的訓練時間要晚很多,大概停留在 2022 年11 月。比如我問它 2022 年11 月的重大事件它就知道,而 12月的事件它就不知道了。
雖然這 1 年多的訓練數(shù)據(jù)聽上去不算什么,但是缺了這些知識有時候會很尷尬。比如我經(jīng)常需要 ChatGPT 協(xié)助我在 Midjourney 上繪圖。雖然它知道很多藝術(shù)類的知識,但是卻完全不懂什么是 Midjourney,因為 Midjourney 的測試版 22 年才發(fā)布。
盡管我多次把有關(guān) Midjourney 的一長串背景知識告訴 GPT-4,但是在后續(xù)的對話中它經(jīng)常就忘記 Midjourney 是什么,然后生成了很多啼笑皆非的回答。為什么它會忘記呢,其實還是受制于 Token 限制,這一點我剛才解釋過了。
Claude 2 則不同了,它知道 Midjourney 是什么,甚至知道如何寫 Midjourney 提示詞,雖然它對此的理解還停留在 2022 年。比如我問它如何寫 Midjourney 提示詞,它給的答案幾乎沒有問題。文章來源:http://www.zghlxwxcb.cn/news/detail-703353.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-703353.html
到了這里,關(guān)于Claude 2,它有 GPT-4 一些無法超越的能力的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!