国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

這篇具有很好參考價值的文章主要介紹了【譯】Claude 3, ChatGPT, 和 LLM 的消亡。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

原作:伊格納西奧·德格雷戈里奧

引言:語言時代的終結?

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

昨天,AI 領域的另一個關鍵參與者 Anthropic 宣布了生成式 AI 王座的新競爭者,即 Claude 的最新版本 Claude 3。

它展示了三種模型Opus、Sonnet 和 Haiku ,每種模型都適用于特定的場景,一些初步結果顯示它們是當今最強大的多模態(tài)大型語言模型(MLLMs)系列,超越了谷歌的 Gemini 1.5 和 OpenAI 的 GPT-4。

但這個消息遠不止表面上看到的那么簡單。

這也許是我們這個時代偉大 MLLM 模型的最后之作,為進入全新的 AI 模型讓路,比如 GPT-5 或臭名昭著的 Q*,它們將與我們今天看到的模型截然不同且出奇地優(yōu)越。

實際上,這個模型可能會如此強大,以至于埃隆·馬斯克 (Elon Musk) 起訴 OpenAI,指控他們涉嫌隱瞞他們在內部實現(xiàn)通用人工智能 (AGI) 的事實。

他們對這些模型的了解可能比您想象的還要多。

新的王位繼承人

昨天,一家由谷歌和亞馬遜等全球一些最強大的組織投資的公司Anthropic,宣布推出了他們有史以來最強大的模型。

Opus、Sonnet 和 Haiku

這款新的Claude 3系列模型被Anthropic歸類為“智能intelligence”:

  • Opus:根據(jù)其在任務自動化、研發(fā)和戰(zhàn)略分析方面出色的表現(xiàn),Opus 可能是世界上最有能力和最智慧的模型。它是 Gemini 1.5 和 GPT-4 的直接競爭對手。

  • Sonnet是“性價比最高”的版本,雖然在某些方面落后于最頂尖的模型,但速度更快、成本更低。初步結果顯示,對于企業(yè)使用情景而言,可能是目前最佳選擇。

  • Haiku是體積較小、能力較弱的模型,但仍然強大且速度極快,最初設計用于需要低延遲和實時交互的場景,同時擁有更低的成本。

如果我們查看基準,就基于文本的評估而言,結果無疑將它們定位為最佳合體(盡管與 2023 年 3 月的 GPT-4 結果相比,因此請記住這一點):

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

在計算機視覺評估方面,它們緊隨Gemini 1.0(以及可能的Gemini 1.5)之后:

?

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

結果令人印象深刻。

展望未來,從 Claude 的發(fā)布中我們還意識到,長序列建模已成為先進研究實驗室的默認選項。

達到 100 萬……甚至更多

幾周前,谷歌聲稱將 Gemini 的上下文窗口增加到一百萬token以上,令全世界感到驚訝。

而現(xiàn)在, Claude 也在做著同樣的事情。

但什么是上下文窗口?

在 LLMs 的情況下,它是模型在任何給定時間可以處理的token、單詞或子詞的最大數(shù)量。

通俗地說,它是模型的工作空間,或者說是它的記憶,它被定義為一個特定的最大值,以避免 Transformer 的2次方計算復雜度,因為序列加倍會使計算量增加四倍。

例如,如果 Claude 3 的上下文窗口是 100 萬個 token,這意味著該模型可以一次性同時攝取大約 75萬個單詞。作為參考,這比《哈利·波特》前五本書的總和還要多,這意味著您可以將它們全部輸入模型并提出問題。

它通過近乎完美的檢索來完成這一切,如下圖所示(盡管只顯示了 200k 個令牌)。當面對“大海撈針”問題時(即研究人員在極長序列中放置一個不相關的、具體的信息片段,并要求模型檢索它),平均準確率超過 99%。

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

?

但昨天發(fā)生的另一件事讓人們震驚了。

擁有自我意識的模型?

在測試“大海撈針”問題時,Anthropic的一組研究人員注意到了一些非同尋常的事情:

這個模型似乎意識到自己正在接受測試,仿佛它‘知道’自己正經歷著什么。

具體來說,它回應道:

“我懷疑這個披薩配料的‘事實’可能是作為一個玩笑被插入到文檔,或者是用來測試我是否在集中注意力,因為它根本不符合其他主題。這些文檔中沒有包含任何關于披薩配料的信息。”

這種元認知水平無疑令人印象深刻,也同樣令人恐懼。

不過,有一個可能的解釋。

在人類反饋強化學習(RLHF)階段,研究人員可能會與模型分享幾個這樣的回應,以便讓它學習這種模式,即每當提出一個非常具體、看似無關的問題時,懷疑這是一個評估,并提出這個問題。

盡管如此,還是令人印象深刻。

此外,據(jù)稱該模型現(xiàn)在回答問題更加細致入微,這已成為最近的熱門話題,基于Gemini最近受到反擊,導致谷歌的估值下跌了900億美元,因為 Gemini 由于對白人存在嚴重偏見而給出了事實上不真實的回答。

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

話雖如此,說實話,這似乎并未超越我們之前的技術水平。

它是一種改進,但它也幾乎比競爭對手晚了一年,并且在某種程度上超過了它(至少從基準測試的角度來看,這需要再三斟酌)。

換句話說,我們可能正在見證獨立LLMs 所能實現(xiàn)的極限

事實上,OpenAI 似乎完全不關心 ChatGPT 可以被認為是迄今為止生產中第三好的模型,這讓我相信他們正在準備的不僅僅是對 Gemini 1.5 或 Claude 3 的簡單改進。

而是一種新型野獸。

從 GPT-4 到 GPT-5……或者 Q*?

我越來越相信 OpenAI 的下一個模型將是革命性的。

DALL-E 之父、參與 OpenAI 最新頂尖模型 Sora 開發(fā)的主要研究人員之一 Aditya Ramesh 昨天發(fā)布的推文讓我對其更加確信。

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

我們是否即將見證前沿模型的支柱發(fā)生轉變?

如果是這樣,可能會有兩種方式。

將語言與搜索結合

許多著名的研究人員,包括Google Deepmind的CEO Demis Hassabis在內,長期以來一直建議LLMs的未來是將它們與搜索算法結合,類似于AlphaGo,這是2017年首個擊敗世界頂尖人類棋手的AI。

1996年,加里·卡斯帕羅夫(Garry Kaspárov)被深藍擊敗,但冠軍仍然以4-2獲勝。

在AlphaGo的案例中,它羞辱了人類。

這種新架構范式的本質很簡單,并且基于一個被廣泛接受但尚未完全理解的關鍵原則。

token越多,結果就越好。

或者,通俗地說,模型思考的時間越長,結果越好。

但這是什么意思呢?

嗯,這涉及對人類思維的兩種模式進行簡要審視。

思考快與慢

當您prompt一個模型時,它會自動開始工作并以極快的速度做出響應,回答迅速,毫不猶豫。

這與人類在被問到“2+2等于多少?”時的思考方式非常相似,這會促使你的大腦毫無疑問地本能地回答“4”。

根據(jù)丹尼爾·卡尼曼的兩種思維模式理論,這被稱為“系統(tǒng)1”思維,即快速且無意識的思維。

但如果我問你“24323.78 的平方根是多少?”。嗯,在這種情況下,您將花費更多時間,進入“系統(tǒng)2”思維模式,這是緩慢、深思熟慮且完全有意識的思維模式,這樣才能給出最佳的結果。

因此,如果我們知道他們在解決問題時投入的計算和token越多越好,我們如何將這種“系統(tǒng) 2”思維灌輸?shù)?LLMs 中呢?

對于當前的 LLMs,您最好的機會是使用思想鏈 (CoT) 技術,在最簡單的情況下,該技術要求模型“慢慢來”。

這對模型有很大幫助,因為它會吸引模型真正花時間回答和改進結果。

但更先進的提示技術,如姚等人的“思維樹”(ToT),走得更遠,實質上‘強制’LLM探索任何給定prompt的可能答案領域。

【譯】Claude 3, ChatGPT, 和 LLM 的消亡

簡單來說,它引誘 LLM 去探索不同的可能答案,就像你在嘗試解決復雜的數(shù)學問題時所做的那樣。

不幸的是,ToT意味著使用一個非常復雜的框架,其中必須多次提示 LLM 才能創(chuàng)建這種探索機制。

然而,我們已經有了這類實現(xiàn)的例子。

Alphacode 2,首創(chuàng)之作

與谷歌在11月發(fā)布Gemini 1.0同時,他們還發(fā)布了Alphacode 2,這是一款與搜索算法相結合的 Gemini Pro LLM,在運行時,對用戶提示采樣了多達一百萬個可能的答案,就像一個人嘗試了一百萬種不同方式來解決問題,直到找到滿意的答案。

這種解決方案極大地增加了成功的機會,使Alphacode 2在競爭編程中躋身85%的排位(在全球最優(yōu)秀15%中),與一些世界頂尖開發(fā)人員競爭。

盡管這些模型的部署成本非常昂貴,但它們所帶來的前景是巨大的,以至于許多人認為OpenAI泄露的模型Q包含某種類似的實現(xiàn)方式,但結合使用了 Q-learning 和 A* 搜索算法。

這些技術是什么?

簡單來說,Q 學習幫助模型找到 Q 函數(shù),即允許模型做出最大化未來獎勵的最佳決策的策略。您可以將其視為一種決策策略,模型將考慮未來可能的最大回報來選擇前進的道路。

A*(A-star)算法是一種搜索算法,它將幫助模型探索不同問題的可能答案。

結合使用,您會得到一個“超級LLM”,它不像今天那樣匆忙地回答問題,而是會仔細評估解決問題的不同方法和解決方案,直到選擇最好的方法和解決方案。

然而,我們可以更進一步。

視頻,下一件大事

最近,我看到了幾篇研究論文,表明我們可能即將看到人工智能的一場巨大轉變,從語言作為大多數(shù)前沿模型的支柱(即LLM),轉向視頻模型。

換句話說,像Sora這樣的模型可能是一個時代的黎明,基礎模型通過無監(jiān)督視頻觀察來學習世界,而不是通過文本。

考慮到視頻比文本更能表達世界,實現(xiàn)這一點可能會導致人工智能能力的巨大飛躍,以至于它可以讓我們更接近通用人工智能。

OpenAI 發(fā)布的 Sora(他們將其定義為“世界模擬器”)是否可能不僅僅是對 LLMs 的偏離,而是表明我們正在從文本轉向領域視頻?

我們不知道這一點,但是OpenAI對Anthropic發(fā)布的沉默告訴我,我們很快就會看到一個完全不同的野獸。文章來源地址http://www.zghlxwxcb.cn/news/detail-837698.html

到了這里,關于【譯】Claude 3, ChatGPT, 和 LLM 的消亡的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • ChatGPT最強對手Claude使用教程

    ChatGPT最強對手Claude使用教程

    Cladue最近很火,作為ChatGPT4的平替版,它無需付費,使用方便,很多網(wǎng)友通過效果對比,發(fā)現(xiàn)它的性能要好于ChatGPT3.5,可以媲美ChatGPT4。最主要是使用很方便,十分鐘就可以輕松部署,下面記錄一下自己的使用歷程,希望能給大家一點幫助。 目錄 一、Claude簡介 二、Cladue可以

    2023年04月17日
    瀏覽(24)
  • 比ChatGPT更好用的Claude來了

    比ChatGPT更好用的Claude來了

    比ChatGPT更好用的Claude來了,不需要魔法上網(wǎng)?。。?claude官網(wǎng) 點擊 add to slack slack跟discord有點類似,先要去slack注冊賬號 登錄之后就添加創(chuàng)建一個工作區(qū) 添加 不過現(xiàn)在已經停止添加了,會出現(xiàn)App unavailable的問題 可以留下郵箱(必須是谷歌郵箱)我邀請 我(claude)和chatgpt的區(qū)

    2024年02月05日
    瀏覽(18)
  • 真正的ChatGPT平替產品:Claude

    真正的ChatGPT平替產品:Claude

    ChatGPT 已經流行了很長的時間了,但是 ChatGPT 由于種種的限制,我們無法用上,也有很多的平替產品,但是這些平替產品也有很多的問題。 現(xiàn)在 Claude 出來了,沒有任何的限制。 Claude 不用魔法,注冊簡單。為什么 Claude 這么厲害,我們來問問他和 chatgpt 的區(qū)別。 我和 ChatGP

    2023年04月19日
    瀏覽(22)
  • ChatGPT 的平替 Claude 使用指南

    ChatGPT 的平替 Claude 使用指南

    Claude的獨立體驗版本姍姍來遲,經過近半個月的等待后,收到了體驗郵件,不過之前早已體驗過poe和slack的集成版,響應速度上要比ChatGPT快很多。 目前提供的Model有: \\\"claude-v1\\\":我們最大的型號,適用于各種更復雜的任務。claude-v1使用此型號名稱將在一段時間的早期訪問評估

    2023年04月15日
    瀏覽(17)
  • 玩轉ChatGPT:論文輔助寫作(附Claude測評)

    玩轉ChatGPT:論文輔助寫作(附Claude測評)

    一、寫在前面 嘿! 嘿!嘿!大家好,今天我們來聊一下使用GPT們進行論文輔助寫作。不過,我要先交代一下,GPT的使用門檻比較高,不少童鞋都用不上。所以,我極力推薦一個平替產品——Claude。今天我將從潤色能力、根據(jù)摘要擬題目、根據(jù)全文凝練摘要、輔助寫討論、輔

    2024年02月07日
    瀏覽(24)
  • ChatGPT最強對手Claude上線,國內免費使用

    ChatGPT最強對手Claude上線,國內免費使用

    今天為大家分享一款與 ChatGPT 極其相似的 AI 工具:Claude。Claude 是一款基于 AI 大模型的對話系統(tǒng),由原 OpenAI 研究副總裁 Dario Amodei 、 OpenAI 安全與政策副總裁 Daniela Amodei,以及近 10 名核心研究人員創(chuàng)辦的名為 Anthropic 的 AI 公司所開發(fā)。 與ChatGPT不同,Claude采用了一種被Anthro

    2023年04月22日
    瀏覽(26)
  • Claude:除ChatGPT外的另一種選擇

    Claude:除ChatGPT外的另一種選擇

    Claude 是 Anthropic 開發(fā)的人工智能產品。Anthropic 是由 11 名前 OpenAI 員工于 2022 年創(chuàng)立的人工智能公司,旨在構建安全、可解釋和有益于人類的人工智能系統(tǒng)。Claude 是該公司的第一個產品,得到了谷歌 3 億美元的投資。 如上是 Claude 給出的回答,簡單概括:ChatGPT 扯淡更流暢,

    2023年04月26日
    瀏覽(96)
  • ChatGPT重量級對手產品:Claude對外發(fā)布

    ChatGPT重量級對手產品:Claude對外發(fā)布

    Claude是下一代人工智能助手,基于 Anthropic 對訓練有用、誠實和無害的人工智能系統(tǒng)的研究。Claude 可通過我們的開發(fā)人員控制臺中的聊天界面和 API 進行訪問,能夠執(zhí)行各種對話和文本處理任務,同時保持高度的可靠性和可預測性。 克勞德可以幫助處理總結、搜索、創(chuàng)意和協(xié)

    2024年02月01日
    瀏覽(25)
  • Claude 2、ChatGPT、Google Bard優(yōu)劣勢比較

    Claude 2、ChatGPT、Google Bard優(yōu)劣勢比較

    ? ?Claude 2: 優(yōu)勢:Claude 2能夠一次性處理多達10萬個tokens(約7.5萬個單詞)。 tokens數(shù)量反映了模型可以處理的文本長度和上下文數(shù)量。tokens越多,模型理解語義的能力就越強)。它在法律、數(shù)學和編碼等多個領域表現(xiàn)出色,在標準化測試中獲得更高分。它可以自我改進和適

    2024年02月13日
    瀏覽(40)
  • ChatGPT Claude Bard 生成式 AI 免責聲明

    ChatGPT can make mistakes. Consider checking important information. Claude.ai is in beta release and may display incorrect or harmful information Bard may display inaccurate info, including about people, so double-check its responses. Your privacy Bard

    2024年01月25日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包