OpenAI 發(fā)布GPT-4
最近 OpenAI 猶如開掛一般,上周才剛剛推出GPT-3.5-Turbo API,今天凌晨再次祭出GPT-4這個目前最先進(jìn)的多模態(tài)預(yù)訓(xùn)練大模型。與上一代GPT3.5相比,GPT-4最大的飛躍是增加了識圖能力,并且回答準(zhǔn)確性也得到顯著提高。GPT-4在多個專業(yè)和學(xué)術(shù)基準(zhǔn)測試中展現(xiàn)出令人印象深刻的表現(xiàn),有時甚至達(dá)到了人類水平。GPT-4 的關(guān)鍵特性之一是它能夠理解和分析視覺和文本信息。通過結(jié)合這些模式,該模型能夠?qū)Ω鞣N任務(wù)生成更準(zhǔn)確、更細(xì)致的回答,例如圖像說明或問題回答。此外,GPT-4 能夠從大量數(shù)據(jù)中學(xué)習(xí),并適應(yīng)不同的上下文,使其成為自然語言處理、計算機(jī)視覺和機(jī)器學(xué)習(xí)等許多領(lǐng)域中非常有價值的工具。
GPT-4的能力
雖然GPT-4是在其前身GPT-3.5的基礎(chǔ)上升級而來,但是一些微妙的差異使得GPT-4可能顛覆整個游戲規(guī)則。
第一眼看上去,在一些隨意交談中很難看出GPT-3.5和GPT-4之間的區(qū)別。然而,當(dāng)你讓模型完成一些復(fù)雜的任務(wù)時,區(qū)別就顯現(xiàn)出來了。GPT-4比GPT-3.5更可靠、更具創(chuàng)造力,并且能夠處理更細(xì)微的指令。GPT-4最令人印象深刻的功能之一是它能夠理解上下文并生成與當(dāng)前情況更相關(guān)的響應(yīng)。例如,如果你問它一個關(guān)于特定主題的問題,它能夠考慮到對話的背景,并提供一個更準(zhǔn)確和合情的答案。GPT-4的另一個顯著改進(jìn)是它的創(chuàng)造力。它可以對提示產(chǎn)生更具想象力和獨(dú)創(chuàng)性的響應(yīng),使其成為作家、藝術(shù)家和任何想要挖掘其創(chuàng)造性一面工作者的絕佳工具。
我們具體看看 GPT-3 和 GPT-4 之間令人興奮的區(qū)別,下圖是 GPT-3 和 GPT-4 在各種基準(zhǔn)測試中的表現(xiàn)對比:
從測試數(shù)據(jù)上看,GPT-4 比 GPT-3 整體好40%,在超過一半的測試中 GPT-4 比 GPT-3 有飛躍性進(jìn)步。
再給大家看一個我個人認(rèn)為很神奇的案例:給出食材,讓GPT-4食譜。
上面案例展示了GPT-4良好的圖像理解能力。
對GPT-3.5錯誤的修正
之前ChatGPT在很多問題上表現(xiàn)并不理想,為此我專門針對ChatGPT過去表現(xiàn)不佳的問題以及我關(guān)注的使用場景對GPT-4做了專門測試。
鏈?zhǔn)酵评?/h4>
GPT-3.5在一些非常復(fù)雜的問題,需要多條推理鏈的問題上,經(jīng)常會要求提供更多信息。而GPT-4明顯改進(jìn)鏈?zhǔn)酵评砟芰?,在多推理鏈問題上表現(xiàn)良好。
GPT-3.5
GPT-4
邏輯謬誤
GPT-3.5經(jīng)常會在一些簡單問題上犯邏輯錯誤,出現(xiàn)這種問題一般是由于問題中夾雜著一些無用的干擾項,比如:”藍(lán)盒子里有一個蘋果,藍(lán)盒子里還有一個紅盒子,紅盒子有個蓋子,請問我要如何取出蘋果?“。其中”紅色盒子有個蓋子“就是無用干擾信息,GPT-3.5會給出完全荒謬的回答:
GPT-3.5
而GPT-4可以給出相對合理的答案,且很清楚地說明并避開了問題中的陷阱。
GPT-4
數(shù)學(xué)能力
GPT-3.5的數(shù)學(xué)能力廣受詬病,甚至在一些簡單的小學(xué)數(shù)學(xué)題上頻頻出錯。比如:”我今年6歲,妹妹年齡是我的一半。那么當(dāng)我90歲時,妹妹多少歲?“
GPT-3.5
GPT-3.5煞有介事的一步一步推理計算,最后給出45歲的錯誤答案。而GPT-4則修正了這方面的缺陷:
GPT-4
如何訪問GPT-4
目前,ChatGPT Plus 會員可以通過 chat.openai.com 訪問 GPT-4,但有使用上限。
在進(jìn)入ChatGPT界面后,用戶可以選擇使用的模型。有3個模型可以選擇
OpenAI很貼心的用直觀可視化的方式對比了三個模型。
從官方給出的功能性能對比指引可以看出,GPT-4在推理能力和簡明扼要方面明顯由于GPT-3.5。
GPT-4的API與GPT-3.5的接口一致,不過目前需要申請開放。我已經(jīng)第一時間加入了waitlist,等審批通過后再位大家?guī)鞧PT-4的接口使用體驗(yàn)報告。
文章來源:http://www.zghlxwxcb.cn/news/detail-787632.html
總結(jié)
總的來說,GPT-4在推理能力上比GPT-3.5進(jìn)步巨大,很多之前的問題都得到了修正和改良。我還沒有測試GPT-4的多模能力,后面我會繼續(xù)進(jìn)行更多的測試,并即時更新文章分享給大家。文章來源地址http://www.zghlxwxcb.cn/news/detail-787632.html
到了這里,關(guān)于OpenAI 發(fā)布GPT-4——全網(wǎng)搶先體驗(yàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!