国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

從大型語(yǔ)言模型LLM走向人工通用智能AGI的改進(jìn)方向(public)

這篇具有很好參考價(jià)值的文章主要介紹了從大型語(yǔ)言模型LLM走向人工通用智能AGI的改進(jìn)方向(public)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

從大型語(yǔ)言模型走向人工通用智能AGI

返回論文和資料目錄

1.導(dǎo)讀

這篇博客主要基于《Sparks of Artificial General Intelligence: Early experiments with GPT-4》文中第9和第10節(jié)、以及我自己對(duì)當(dāng)前LLM和AGI的理解。給出大型語(yǔ)言模型走向AGI時(shí) 改進(jìn)的方向。

2.14個(gè)問(wèn)題及改進(jìn)方向(動(dòng)態(tài)持續(xù)更新)

1.縮減模型

模型約減的目標(biāo)是使用盡可能小的模型達(dá)到盡可能優(yōu)的性能。當(dāng)前大語(yǔ)言模型的模型規(guī)模是10B-500B。未來(lái)AGI必然是要普及的,所以縮減模型是一個(gè)重點(diǎn)研究方向。

導(dǎo)致的問(wèn)題

  1. 模型的訓(xùn)練成本和使用成本高,類(lèi)似ChatGPT等這些優(yōu)異性能的大模型每訓(xùn)練一次需要上千萬(wàn)美金,而在使用時(shí),模型輸入輸出一次就需要經(jīng)過(guò)整個(gè)大模型,導(dǎo)致使用成本巨大。
  2. 模型難以推廣到個(gè)人。與世界上第一臺(tái)電腦類(lèi)似,如果后續(xù)沒(méi)有個(gè)人電腦的普及,相信計(jì)算機(jī)至今都只存在大型科研或軍事用途上。模型大導(dǎo)致現(xiàn)在大模型的研究主要在工業(yè)界和少數(shù)頂級(jí)科研機(jī)構(gòu)上,這不僅導(dǎo)致研究工作開(kāi)展困難,還使得模型無(wú)法推廣到平民。這也間接導(dǎo)致了后面模型難以進(jìn)行個(gè)性化的發(fā)展。

改進(jìn)的具體方向:

  1. 從具體模型方面入手,采用更優(yōu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),損失函數(shù),優(yōu)化器,詞向量編碼。目前已經(jīng)有少量的工作在這方面取得了一定的成績(jī),例如LLaMA。
  2. 與工具結(jié)合。在一些特定的場(chǎng)景,大模型仍然難以擴(kuò)展,例如數(shù)學(xué)計(jì)算等。 一個(gè)大型語(yǔ)言模型再?gòu)?qiáng)也難以具備一個(gè)計(jì)算器的的數(shù)學(xué)運(yùn)算能力。因此,與其不斷努力為了保持性能而不降低模型規(guī)模,還不如研究如何將一些模型低耦合的能力分給其他工具實(shí)現(xiàn),并如何將工具與大模型整合的技術(shù)。與工具結(jié)合這一方向詳細(xì)展開(kāi)可見(jiàn)第11點(diǎn)。

2.個(gè)性化

個(gè)性化是指模型為每個(gè)用戶提供個(gè)性化服務(wù)。未來(lái)AGI必然是要普及的,所以模型如何實(shí)現(xiàn)個(gè)性化是一個(gè)重點(diǎn)研究方向。

導(dǎo)致的問(wèn)題

  1. 在許多場(chǎng)景,模型需要為個(gè)人或組織提供個(gè)性化服務(wù)。例如,在教育場(chǎng)景中,我們期望模型能夠根據(jù)學(xué)生在學(xué)習(xí)方面的進(jìn)步去理解并適應(yīng),給出學(xué)生不同階段的學(xué)習(xí)幫助。同時(shí)針對(duì)不同的學(xué)生,模型需要給出不同的教學(xué)方法。再例如,在日常聊天場(chǎng)景中,模型面向小孩和大人的模型輸出可能就不一樣。針對(duì)小孩,模型不應(yīng)該輸出不適合未成年人的內(nèi)容。同時(shí),聊天中需要注意正確的引導(dǎo)孩子。

改進(jìn)的具體方向:

  1. 元指令。這是《Sparks of Artificial General Intelligence: Early experiments with GPT-4》給出的一個(gè)方法。它的思路是每次通過(guò)指令輸入的方法,讓模型知道當(dāng)前的用戶是誰(shuí),之前和他說(shuō)過(guò)什么,目前什么樣的輸出適合他。雖然這種方法局限性大且不夠有效,但確實(shí)是最簡(jiǎn)單的一種思路,目前很火的AutoGPT就是這么干的,確實(shí)能夠?qū)崿F(xiàn)一部分個(gè)性化能力。

3.長(zhǎng)期記憶

長(zhǎng)期記憶指大模型需要記住長(zhǎng)文本內(nèi)容,形成新的認(rèn)知,或類(lèi)似人類(lèi)具備情景記憶。這是大模型一個(gè)非常大的缺陷,也是實(shí)現(xiàn)AGI必然要解決的問(wèn)題。

導(dǎo)致的問(wèn)題

  1. 模型無(wú)法應(yīng)對(duì)需要長(zhǎng)期記憶的場(chǎng)景。例如當(dāng)使用大模型閱讀一本書(shū),模型閱讀第2章內(nèi)容時(shí)可能第一章內(nèi)容就忘了,人物和事件根本記不住。在源代碼中,對(duì)類(lèi)和函數(shù)的引用可能離定義它們的地方很遠(yuǎn)。在定理證明中,證明需要利用先前定義的引理。雖然目前GPT-4一次輸入支持的最大token數(shù)已經(jīng)提升到25000,但想實(shí)現(xiàn)閱讀一本書(shū),仍然非常困難。再例如,目前已經(jīng)有工作研究將機(jī)器人與ChatGPT結(jié)合,而此時(shí)機(jī)器人有個(gè)很大問(wèn)題是無(wú)法類(lèi)似人類(lèi)具備事件記憶,無(wú)法記住什么時(shí)候發(fā)生了什么事,遇見(jiàn)了什么人。

改進(jìn)的具體方向:

  1. 結(jié)合數(shù)據(jù)庫(kù)或知識(shí)圖譜相關(guān)技術(shù)。目前AutoGPT就采用了這種方法,確實(shí)具備了一部分長(zhǎng)期記憶能力。
  2. 構(gòu)建一個(gè)長(zhǎng)期記憶模型M并結(jié)合數(shù)據(jù)庫(kù)技術(shù)。類(lèi)似的想法目前清華有做類(lèi)似的工作ChatDB。

4.置信校準(zhǔn)

置信校準(zhǔn)指的是模型需要判斷事件的真假。當(dāng)前LLM經(jīng)常會(huì)輸出假事實(shí),例如,你讓LLM寫(xiě)一首李白的詩(shī),它的輸出雖然是詩(shī),但卻是它自己瞎編的而不是李白的。你讓他給你一篇關(guān)于XX領(lǐng)域的參考文獻(xiàn),它的輸出像模像樣,但真的去谷歌學(xué)術(shù)上找,發(fā)現(xiàn)是找不到對(duì)應(yīng)的文獻(xiàn)的。

導(dǎo)致的問(wèn)題

  1. LLM無(wú)法分別是非,它的認(rèn)知主要基于訓(xùn)練集,不會(huì)自己去思考和判斷什么是真什么是假。在實(shí)際使用的過(guò)程中,無(wú)法輸出保真答案。

改進(jìn)的具體方向:

無(wú)

5.持續(xù)學(xué)習(xí)

持續(xù)學(xué)習(xí)指的是模型需要根據(jù)周?chē)沫h(huán)境更新自身。模型訓(xùn)練好一次后,需要能夠持續(xù)不斷地學(xué)習(xí)。

導(dǎo)致的問(wèn)題

  1. 當(dāng)前模型無(wú)法更新。具體地,存在兩種情況。第一種,當(dāng)一個(gè)模型訓(xùn)練好后,假設(shè)我們的計(jì)算資源得到了更新,我們當(dāng)前需要一個(gè)更大的模型。此時(shí),當(dāng)前LLM面臨的情況是在一個(gè)參數(shù)量更大的模型上完全重新訓(xùn)練;第二種,當(dāng)模型在使用時(shí),我們目前比較好的方式是使用RLHF的方法進(jìn)行微調(diào),使得模型能夠一定程度上得到更新,但這種方式不是實(shí)時(shí)的,而且更新效率低需要對(duì)整個(gè)模型進(jìn)行調(diào)節(jié)。

改進(jìn)的具體方向:

無(wú)

6.計(jì)劃和目標(biāo)

計(jì)劃和目標(biāo)指模型需要具備制定計(jì)劃和目標(biāo)的能力。

導(dǎo)致的問(wèn)題

  1. 當(dāng)模型需要處理的問(wèn)題復(fù)雜時(shí),模型無(wú)法制定計(jì)劃和目標(biāo)對(duì)問(wèn)題進(jìn)行簡(jiǎn)化,進(jìn)而有效地解決問(wèn)題。例如,人完成去華山旅游這件事時(shí),需要把這個(gè)目標(biāo)進(jìn)行分解,再依次完成。比如,首先需要檢查自己有多少錢(qián),然后搜索去的交通工具,接著需要訂酒店,購(gòu)買(mǎi)上山物資,再接著規(guī)劃行動(dòng)路線,最后坐車(chē)回家。其中里面的每個(gè)環(huán)節(jié)可能又可分成多個(gè)步驟。比如,訂酒店要考慮價(jià)格和位置,考慮訂幾人房等。這么一個(gè)復(fù)雜目標(biāo)需要合適的計(jì)劃,并制定一系列的目標(biāo)實(shí)現(xiàn)。
  2. 另外一方面,模型無(wú)法指定提升自己的目標(biāo)導(dǎo)致無(wú)法主動(dòng)學(xué)習(xí),進(jìn)而使得模型性能無(wú)法離線提升。

改進(jìn)的具體方向:

  1. 指令提示+短期記憶:目前AutoGPT就采取了類(lèi)似的方式實(shí)現(xiàn),它將一個(gè)任務(wù)不斷通過(guò)prompt的方式進(jìn)行提示和拆解,最終指定多個(gè)子目標(biāo),一步一步實(shí)現(xiàn)。這種方式能夠一定程度上實(shí)現(xiàn)模型的規(guī)劃和目標(biāo)能力。

7.數(shù)據(jù)集收集和生成

數(shù)據(jù)集收集和生成指模型需要配合合適的數(shù)據(jù)集收集和生成方法。

導(dǎo)致的問(wèn)題

  1. 模型性能不高。近期,LLaMA等大模型論文中已經(jīng)顯示,即使是規(guī)模小的大模型,擴(kuò)大數(shù)據(jù)集也能幫助進(jìn)一步提升性能。反過(guò)來(lái)講,通過(guò)合適的方式收集或生成數(shù)據(jù),并進(jìn)一步用于訓(xùn)練模型可以有效地提升大模型的性能。

改進(jìn)的具體方向:

  1. 針對(duì)數(shù)據(jù)集收集,可以重點(diǎn)研究模型自主上網(wǎng)收集數(shù)據(jù)能力。最終,讓模型可以在網(wǎng)絡(luò)上自主收集數(shù)據(jù)并用于訓(xùn)練提升性能。
  2. 針對(duì)數(shù)據(jù)集生成,可以借助已有的LLM模型生成數(shù)據(jù)集,幫助提升性能,例如WizardLM模型或Wizardcode,下圖給出了一個(gè)Wizardcode利用LLM生成針對(duì)Code領(lǐng)域的數(shù)據(jù)的例子。另外,可以研究讓模型自動(dòng)生成數(shù)據(jù),再用生成數(shù)據(jù)訓(xùn)練模型,不斷迭代增強(qiáng)性能。最近facebook在計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)表了一篇針對(duì)圖像分割的論文。其中提到一個(gè)名為數(shù)據(jù)引擎的數(shù)據(jù)生成方法,使得數(shù)據(jù)生成和模型訓(xùn)練變成一個(gè)閉環(huán),達(dá)到了“分割萬(wàn)物”的驚艷結(jié)果。

從大型語(yǔ)言模型LLM走向人工通用智能AGI的改進(jìn)方向(public)

8.情感能力

情感能力指模型需要提升情感能力來(lái)幫助提升表現(xiàn)。

導(dǎo)致的問(wèn)題

  1. 不僅影響平時(shí)的模型表現(xiàn),還導(dǎo)致無(wú)法應(yīng)用于一些需要情感的場(chǎng)景。例如,在與人聊天的時(shí)候,如果對(duì)方是一個(gè)失戀的人。一個(gè)帶感情的回答,必然優(yōu)于平鋪直敘地講道理或安慰。未來(lái)的寵物機(jī)器人或是機(jī)器人管家的也是重點(diǎn)研究方向,而這些場(chǎng)景顯然需要LLM發(fā)展情感能力。

改進(jìn)的具體方向:

無(wú)

9.增強(qiáng)多模態(tài)

增強(qiáng)多模態(tài)指LLM模型同時(shí)考慮處理文本、圖像、音頻等。

導(dǎo)致的問(wèn)題

  1. 現(xiàn)有模型主要處理文本,少數(shù)可以同時(shí)處理圖像(GPT-4)。因此,缺乏了音頻數(shù)據(jù)的處理,例如,一個(gè)大模型無(wú)法判斷一首歌好不好聽(tīng)。

改進(jìn)的具體方向:

  1. 針對(duì)不同的多模態(tài)訓(xùn)練不同的模型再進(jìn)行整合。

10.與現(xiàn)有軟件工具結(jié)合

微信、淘寶、美團(tuán)、QQ音樂(lè)、12306等。

11.與現(xiàn)有硬件工具結(jié)合

機(jī)器人手臂,仿生人皮膚,紅外線,NFC。

12.自我認(rèn)知和世界認(rèn)知

沒(méi)有自我認(rèn)知何談置信校準(zhǔn)。沒(méi)有世界認(rèn)知如何消除偏見(jiàn)。

導(dǎo)致的問(wèn)題

  1. 目前LLM與AGI最大的差距其實(shí)是仍然是自我認(rèn)知和世界認(rèn)知。

改進(jìn)的具體方向:

無(wú)

13.AGI的測(cè)試問(wèn)題

目前多見(jiàn)于利用考試的方式,例如律師職業(yè)資格考試、GRE等。

14.AGI的安全問(wèn)題和法律問(wèn)題

暫時(shí)略過(guò),讀者可以看看《Planing for AGI and beyond》文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-498806.html

到了這里,關(guān)于從大型語(yǔ)言模型LLM走向人工通用智能AGI的改進(jìn)方向(public)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 人工智能的新篇章:深入了解大型語(yǔ)言模型(LLM)的應(yīng)用與前景

    人工智能的新篇章:深入了解大型語(yǔ)言模型(LLM)的應(yīng)用與前景

    項(xiàng)目設(shè)計(jì)集合(人工智能方向):助力新人快速實(shí)戰(zhàn)掌握技能、自主完成項(xiàng)目設(shè)計(jì)升級(jí),提升自身的硬實(shí)力(不僅限NLP、知識(shí)圖譜、計(jì)算機(jī)視覺(jué)等領(lǐng)域) :匯總有意義的項(xiàng)目設(shè)計(jì)集合,助力新人快速實(shí)戰(zhàn)掌握技能,助力用戶更好利用 CSDN 平臺(tái),自主完成項(xiàng)目設(shè)計(jì)升級(jí),提升自

    2024年02月04日
    瀏覽(32)
  • 大模型的下一站是通用人工智能(AGI)嗎?

    目錄 大模型的下一站

    2024年02月06日
    瀏覽(28)
  • 通用人工智能(AGI):人工智能的下一個(gè)階段

    通用人工智能(AGI):人工智能的下一個(gè)階段

    除了人工智能(AI)的改進(jìn)和新應(yīng)用之外,大多數(shù)人都認(rèn)為,當(dāng)通用人工智能(AGI)出現(xiàn)時(shí),人工智能的下一次飛躍將發(fā)生。我們將AGI寬泛地定義為機(jī)器或計(jì)算機(jī)程序理解或?qū)W習(xí)人類(lèi)可以完成的任何智力任務(wù)的假設(shè)能力。然而,對(duì)于何時(shí)以及如何實(shí)現(xiàn)這一目標(biāo),人們幾乎沒(méi)有達(dá)成共

    2024年02月10日
    瀏覽(33)
  • AGI 通用人工智能的未來(lái)展望

    隨著科技的不斷進(jìn)步,人工智能技術(shù)已經(jīng)成為了現(xiàn)代社會(huì)的重要組成部分。從最初的簡(jiǎn)單計(jì)算機(jī)程序到現(xiàn)在的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,人工智能技術(shù)的發(fā)展取得了很大的進(jìn)展。目前,由于云計(jì)算、大數(shù)據(jù)和高性能計(jì)算等技術(shù)的快速發(fā)展,人工智能在圖像識(shí)別、自然語(yǔ)言處理和

    2024年02月09日
    瀏覽(32)
  • 【AGI 通用人工智能】什么是通用人工智能 | What is Artificial General Intelligence

    【AGI 通用人工智能】什么是通用人工智能 | What is Artificial General Intelligence

    The meaning of artificial general intelligence for the AI industry and the world.? 通用人工智能對(duì)人工智能行業(yè)和世界的意義。 Is artificial general intelligence possible? Various development approaches and predictions.? 人工通用智能可能嗎?各種開(kāi)發(fā)方法和預(yù)測(cè)。 Potential risks of creating strong AI that rivals human int

    2024年02月08日
    瀏覽(20)
  • 【人工智能】AGI 通用人工智能基礎(chǔ)概念、實(shí)現(xiàn)原理、挑戰(zhàn)和發(fā)展前景

    【人工智能】AGI 通用人工智能基礎(chǔ)概念、實(shí)現(xiàn)原理、挑戰(zhàn)和發(fā)展前景

    Artificial intelligence prompt completion by dalle mini, https://github.com/borisdayma/dalle-mini 隨著計(jì)算機(jī)技術(shù)、機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等技術(shù)的發(fā)展,人工智能(Artificial Intelligence, AI)已經(jīng)成為當(dāng)今計(jì)算機(jī)科學(xué)和工程領(lǐng)域的熱門(mén)話題之一。 強(qiáng)人工智能(Strong AI)或通用人工智能(英語(yǔ):Artificia

    2024年02月09日
    瀏覽(111)
  • 通用人工智能(Artificial General Intelligence,AGI)概述

    AGI指的是“通用人工智能”,是指一種具有廣泛認(rèn)知能力的機(jī)器智能,能夠像人類(lèi)一樣在各種不同的任務(wù)和環(huán)境中表現(xiàn)出高度的靈活性和適應(yīng)性。與當(dāng)前的人工智能系統(tǒng)(通常被稱(chēng)為“窄人工智能”或“專(zhuān)業(yè)人工智能”)相比,這些系統(tǒng)通常只能在其被訓(xùn)練或編程的特定領(lǐng)域

    2024年02月19日
    瀏覽(30)
  • 【AI 人工智能】大型語(yǔ)言模型的實(shí)現(xiàn)技術(shù)原理與應(yīng)用
  • AGI(通用人工智能Artificial General Intelligence)知識(shí)點(diǎn)

    對(duì)深度學(xué)習(xí)模型相關(guān)的知識(shí)點(diǎn)進(jìn)行總結(jié)。 AGI(通用人工智能 Artificial General Intelligence)是指能夠執(zhí)行人類(lèi)可以執(zhí)行的任何智力任務(wù)的機(jī)器或計(jì)算機(jī)系統(tǒng)。這包括理解自然語(yǔ)言、學(xué)習(xí)、規(guī)劃、解決問(wèn)題、推理、感知環(huán)境等。 實(shí)現(xiàn) AGI 是一個(gè)非常復(fù)雜的問(wèn)題,目前還沒(méi)有一個(gè)確定

    2024年04月13日
    瀏覽(20)
  • 人工智能講師大模型培訓(xùn)老師葉梓:基于大型語(yǔ)言模型的自主智能體:架構(gòu)設(shè)計(jì)與應(yīng)用前景

    人工智能講師大模型培訓(xùn)老師葉梓:基于大型語(yǔ)言模型的自主智能體:架構(gòu)設(shè)計(jì)與應(yīng)用前景

    在人工智能的快速發(fā)展中,大型語(yǔ)言模型(LLM)已成為推動(dòng)技術(shù)進(jìn)步的關(guān)鍵力量。LLM的出現(xiàn)不僅改變了我們與機(jī)器的交互方式,也為構(gòu)建具有高級(jí)認(rèn)知能力的自主智能體(AI Agent)提供了新的可能性。本文旨在探討基于LLM的AI Agent的架構(gòu)設(shè)計(jì),并對(duì)其在未來(lái)應(yīng)用中的潛力進(jìn)行展

    2024年04月17日
    瀏覽(22)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包