国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

這篇具有很好參考價值的文章主要介紹了GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

量子位 | 公眾號 QbitAI

繼Windows Copilot發(fā)布后,微軟Build大會熱度又被一場演講引爆。

前特斯拉AI總監(jiān)Andrej Karpathy在演講中認為思維樹(tree of thoughts)與AlphaGo的蒙特卡洛樹搜索(MCTS)有異曲同工之妙!

網(wǎng)友高呼:這是關(guān)于如何使用大語言模型和GPT-4模型的最詳盡有趣的指南!

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

此外Karpathy透露,由于訓(xùn)練和數(shù)據(jù)的擴展,LLAMA 65B“明顯比GPT-3 175B更強大”,并介紹了大模型匿名競技場ChatBot Arena:

Claude得分介于ChatGPT 3.5和ChatGPT 4之間。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

網(wǎng)友表示,Karpathy的演講一向很棒,而這次的內(nèi)容也一如既往沒有令大家失望。

隨著演講而爆火的,還有推特網(wǎng)友根據(jù)演講整理的一份筆記,足足有31條,目前轉(zhuǎn)贊量已超過3000+:

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

所以,這段備受關(guān)注的演講,具體提到了哪些內(nèi)容呢?

如何訓(xùn)練GPT助手?

Karpathy這次的演講主要分為兩個部分。

第一部分,他講了如何訓(xùn)練一個“GPT助手”。

Karpathy主要講述了AI助手的四個訓(xùn)練階段:
預(yù)訓(xùn)練(pre-training)、監(jiān)督微調(diào)(supervised fine tuning)、獎勵建模(reward modeling)和強化學(xué)習(xí)(reinforcement learning)。

每一個階段都需要一個數(shù)據(jù)集。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

在預(yù)訓(xùn)練階段,需要動用大量的計算資源,收集大量的數(shù)據(jù)集。在大量無監(jiān)督的數(shù)據(jù)集上訓(xùn)練出一個基礎(chǔ)模型。

Karpathy用了更多例子作補充:

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

接下來進入微調(diào)階段。

使用較小的有監(jiān)督數(shù)據(jù)集,通過監(jiān)督學(xué)習(xí)對這個基礎(chǔ)模型進行微調(diào),就能創(chuàng)建一個能夠回答問題的助手模型。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

他還展示了一些模型的進化過程,相信很多人之前已經(jīng)看過上面這張“進化樹”的圖了。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

Karpathy認為目前最好的開源模型是Meta的LLaMA系列(因為OpenAI沒有開源任何關(guān)于GPT-4的內(nèi)容)。

在這里需要明確指出的是,基礎(chǔ)模型不是助手模型。

雖然基礎(chǔ)模型可以回答問題,但它所給出的回答并不可靠,可用于回答問題的是助手模型。在基礎(chǔ)模型上進行訓(xùn)練的助手模型,通過監(jiān)督微調(diào),在生成回復(fù)和理解文本結(jié)構(gòu)方面的表現(xiàn)將優(yōu)于基礎(chǔ)模型。

在訓(xùn)練語言模型時,強化學(xué)習(xí)是另一個關(guān)鍵的過程。

通過用人工標(biāo)記的高質(zhì)量的數(shù)據(jù)進行訓(xùn)練,可以使用獎勵建模來創(chuàng)建一個損失函數(shù),以改善其性能。然后,通過增加正向的標(biāo)記,并降低負面標(biāo)記的概率,來進行強化訓(xùn)練。

而在具有創(chuàng)造性的任務(wù)中,利用人類的判斷力對于改進AI模型至關(guān)重要,加入人類的反饋可以更有效地訓(xùn)練模型。

經(jīng)過人類反饋的強化學(xué)習(xí)后,就可以得到一個RLHF模型了。

模型訓(xùn)練好了,接下來就是如何有效利用這些模型解決問題了。

如何更好地使用模型?

第二部分,Karpathy主要討論了提示策略、微調(diào)、快速發(fā)展的工具生態(tài)系統(tǒng)以及未來的擴展等問題。

Karpathy又給出了具體示例來說明:

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

當(dāng)我們在寫文章時候,我們會進行很多的心理活動,需要考慮自己的表述是否正確。而對于GPT來說,這只是一個序列標(biāo)記(a sequence of tokens)。

提示(prompt)可以彌補這種認知差異。

Karpathy進一步解釋了思維鏈提示的工作方式。

對于推理問題,要想讓自然語言處理中Transformer的表現(xiàn)更好,需要讓它一步一步地處理信息,而不能直接拋給它一個非常復(fù)雜的問題。

如果你給它幾個例子,它會模仿這個例子的模版,最終生成的結(jié)果會更好。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

模型只能按照它的序列來回答問題,如果它生成的內(nèi)容是錯誤的,你可以進行提示,讓它重新生成。

如果你不要求它檢查,它自己是不會檢查的。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

這就涉及到了System1和System2的問題。

諾貝爾經(jīng)濟學(xué)獎得主丹尼爾卡尼曼在《思考快與慢》中提出,人的認知系統(tǒng)包含System1和System2兩個子系統(tǒng)。System1主要靠直覺,而System2是邏輯分析系統(tǒng)。

通俗來說,System1是一個快速自動生成的過程,而System2是經(jīng)過深思熟慮的部分。

這在最近一篇挺火的論文“Tree of thought”(思維樹)中也有被提及。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

深思熟慮指的是,不是簡單的給出問題的答案,而更像是與Python膠水代碼一起使用的prompt,將許多prompt串聯(lián)在一起。模型必須要維護多個提示,還必須要執(zhí)行一些樹搜索算法,來找出要擴展的提示。

Karpathy認為這種思路與AlphaGo非常相似:

AlphaGo在下圍棋時,需要考慮下一枚棋子下在哪里。最初它是靠模仿人類來學(xué)習(xí)的。

但除此之外,它還進行了蒙特卡洛樹搜索,可以得到具有多種可能性的策略。它可以對多種可能的下法進行評估,僅保留那些較好的策略。我認為這在某種程度上相當(dāng)于AlphaGo。

對此,Karpathy還提到了AutoGPT:

我認為目前它的效果還不是很好,我不建議大家進行實際應(yīng)用。我只是認為,隨著時間的推移,我們或許可以從它的發(fā)展思路中汲取靈感。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

其次,還有一個小妙招是檢索增強生成(retrieval agumented generation)和有效提示。

窗口上下文的內(nèi)容就是transformers在運行時的記憶(working memory),如果你可以將與任務(wù)相關(guān)的信息加入到上下文中,那么它的表現(xiàn)就會非常好,因為它可以立即訪問這些信息。

簡而言之,就是可以為相關(guān)數(shù)據(jù)建立索引讓模型可以高效訪問。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

如果Transformers也有可參考的主要文件,它的表現(xiàn)會更好。

最后,Karpathy簡單講了一下在大語言模型中的約束提示(Constraint prompting)和微調(diào)。
可以通過約束提示和微調(diào)來改進大語言模型。約束提示在大語言模型的輸出中強制執(zhí)行模板,而微調(diào)則調(diào)整模型的權(quán)重以提高性能。

我建議在低風(fēng)險的應(yīng)用中使用大語言模型,始終將它們與人工監(jiān)督相結(jié)合,將它們看作是靈感和建議的來源,考慮copilots而不是讓它們完全自主代理。

關(guān)于Andrej Karpathy

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

Andrej Karpathy博士畢業(yè)后的第一份工作,是在OpenAI研究計算機視覺。

后來OpenAI聯(lián)合創(chuàng)始人之一的馬斯克看上了Karpathy,把人挖到了特斯拉。但也因為這件事,馬斯克和OpenAI徹底鬧翻,最后還被踢出局。在特斯拉,Karpathy是Autopilot、FSD等項目的負責(zé)人。

今年二月份,在離開特斯拉7個月后,Karpathy再次加入了OpenAI。

最近他發(fā)推特表示,目前對開源大語言模型生態(tài)系統(tǒng)的發(fā)展饒有興趣,有點像早期寒武紀爆發(fā)的跡象。

GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才

傳送門:
[1]https://www.youtube.com/watch?v=xO73EUwSegU(演講視頻)
[2]https://arxiv.org/pdf/2305.10601.pdf(“Tree?of thought”論文)文章來源地址http://www.zghlxwxcb.cn/news/detail-467607.html

到了這里,關(guān)于GPT現(xiàn)狀終于有人講清楚了!OpenAI大牛最新演講爆火,還得是馬斯克欽點的天才的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 云計算 IaaS PaaS SaaS 基礎(chǔ)概念和區(qū)別終于搞清楚了

    云服務(wù)模式,普遍接受的只有三種主 基礎(chǔ)架構(gòu)即服務(wù) (lnfrastructure as a Service, IaaS) 平臺即服務(wù) (Platform as a Service, PaaS) 軟件即服務(wù) (Software as a Service, SaaS) 基礎(chǔ)架構(gòu)即服務(wù)(IaaS) 平臺即服務(wù)(Paas) 軟件即服務(wù)SaaS 云服務(wù)提供商維護和控制 底層架構(gòu) 云提供商負責(zé)操作系統(tǒng)和托管環(huán)境,

    2024年02月08日
    瀏覽(22)
  • 記錄--為什么沒有人能講清楚 BFC?

    記錄--為什么沒有人能講清楚 BFC?

    CSS 規(guī)范(英文) | 中文翻譯 浮動,絕對定位的元素,非塊盒的塊容器(例如inline-blocks,table-cells和table-captions),以及’overflow’不為’visible’的塊盒(當(dāng)該值已被傳播到視口時除外(except when that value has been propagated to the viewport))會為其內(nèi)容建立新的塊格式化上下文 在一個

    2024年02月05日
    瀏覽(22)
  • 最新消息:OpenAI GPT Store 正式上線,GPTs 應(yīng)用商店來了!

    最新消息:OpenAI GPT Store 正式上線,GPTs 應(yīng)用商店來了!

    原文鏈接 https://openaigptguide.com/gpt-store-and-chatgpt-team/ OpenAI推出的兩款新產(chǎn)品和服務(wù):GPT Store和ChatGPT Team,提供了許多全新的解決方案和功能,旨在幫助用戶更輕松地使用和構(gòu)建GPT工具,同時也增加了公司的收入來源。GPT Store是一個全新的在線平臺,允許用戶創(chuàng)建和分享自定義

    2024年02月03日
    瀏覽(25)
  • 終于有人把大數(shù)定律講明白了

    終于有人把大數(shù)定律講明白了

    導(dǎo)讀: 在一些情況下,概率是由頻率推導(dǎo)而來的,要得到可信的概率,就要大量重復(fù)地試驗。而且,重復(fù)試驗的次數(shù)越多,結(jié)論就越讓人信服。那么,為何人們直覺上更愿意相信從大數(shù)據(jù)中得到的統(tǒng)計結(jié)果,而不是從小數(shù)據(jù)中得到的經(jīng)驗?zāi)兀?作者:徐晟 來源:大數(shù)據(jù)DT(I

    2023年04月14日
    瀏覽(30)
  • 【ChatGPT4 vs. Bard】谷歌終于能與OpenAI 打擂臺了!全新PaLM 2比肩GPT-4:一部手機就可運行,精通Python等20種語言

    【ChatGPT4 vs. Bard】谷歌終于能與OpenAI 打擂臺了!全新PaLM 2比肩GPT-4:一部手機就可運行,精通Python等20種語言

    ? 目錄 Bard 的進化 很長時間以來看到的最好的谷歌 I/O 與 GPT-4 對打的 PaLM 2

    2024年02月09日
    瀏覽(23)
  • 終于有人將TWI(串行通訊接口)給講通了!

    終于有人將TWI(串行通訊接口)給講通了!

    目錄 TWI的特性 數(shù)據(jù)傳輸格式? 時鐘同步? 數(shù)據(jù)仲裁 功能描述 ?總線接口單元 頻率生成單元 地址匹配單元 控制單元 傳輸模式 主機發(fā)送模式 ?主機接收模式 ?從機發(fā)送模式 ?從機接收模式 兩線模式,簡單快捷; 支持主機模式和從機模式; 允許發(fā)送數(shù)據(jù)和接收數(shù)據(jù); 支持多

    2024年02月13日
    瀏覽(32)
  • 云計算發(fā)展的 4 個階段,終于有人講明白了

    云計算發(fā)展的 4 個階段,終于有人講明白了

    導(dǎo)讀: 云計算從誕生至今,經(jīng)歷了四個發(fā)展階段,目前仍然在高速演進中。 作者:阿里云智能-全球技術(shù)服務(wù)部 來源:大數(shù)據(jù)DT(ID:hzdashuju) 01 公有云 公有云是云計算最早期的形態(tài),也是截至目前眾多云廠商期望實現(xiàn)的終極形態(tài),它是從彈性計算共享資源租用服務(wù)開始的。

    2024年02月06日
    瀏覽(26)
  • 什么是目標(biāo)檢測?有哪些應(yīng)用?終于有人講明白了

    什么是目標(biāo)檢測?有哪些應(yīng)用?終于有人講明白了

    導(dǎo)讀: 計算機視覺(Computer Vision,CV)是一門教計算機如何“看”世界的學(xué)科。計算機視覺包含多個分支,其中圖像分類、目標(biāo)檢測、圖像分割、目標(biāo)跟蹤等是計算機視覺領(lǐng)域最重要的研究課題。本文將著重介紹目標(biāo)檢測的相關(guān)知識,并提供一些實例,以幫助讀者對目標(biāo)檢測

    2023年04月24日
    瀏覽(26)
  • 終于有人把騰訊云輕量服務(wù)器“月流量”說明白了

    終于有人把騰訊云輕量服務(wù)器“月流量”說明白了

    騰訊云輕量服務(wù)器月流量什么意思? 月流量是指輕量服務(wù)器限制每月流量的意思,不能肆無忌憚地使用公網(wǎng),流量超額需要另外支付流量費,上海/廣州/北京等地域的輕量服務(wù)器月流量不夠用超額部分按照0.8元/GB的價格支付流量費 。阿騰云atengyun.com來詳細說下騰訊云輕量應(yīng)用

    2024年02月07日
    瀏覽(22)
  • 云計算與數(shù)字化轉(zhuǎn)型的關(guān)系,終于有人講明白了

    云計算與數(shù)字化轉(zhuǎn)型的關(guān)系,終于有人講明白了

    導(dǎo)讀: 云計算與數(shù)字化轉(zhuǎn)型是相輔相成的關(guān)系。 作者:阿里云智能-全球技術(shù)服務(wù)部 來源:大數(shù)據(jù)DT(ID:hzdashuju) 01 云計算帶來的重大變化 通過數(shù)據(jù)提升效率、降低成本、進行業(yè)務(wù)創(chuàng)新,這個想法不是第一天出現(xiàn),在大型機、小型機時代就已經(jīng)出現(xiàn)了這種觀點。那個時候,

    2024年01月25日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包