国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

一分鐘秒懂人工智能對齊

2年前作者：許思王分類：Toy博客閱讀(16)違法舉報

這篇具有很好參考價值的文章主要介紹了一分鐘秒懂人工智能對齊。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

一分鐘秒懂人工智能對齊,其他領(lǐng)域,人工智能

1.什么是人工智能對齊

人工智能對齊（AI Alignment）指讓人工智能的行為符合人的意圖和價值觀。

人工智能系統(tǒng)可能會出現(xiàn)“不對齊”（misalign）的問題。以ChatGPT這樣的問答系統(tǒng)為例，ChatGPT的回答可能會含有危害祖國統(tǒng)一、侮辱先烈、丑化中華民族、教唆暴力、出口成“臟”等違法或不符合社會主義核心價值觀的言論，也可能會出現(xiàn)阿諛奉承、威逼利誘、信口雌黃等干預(yù)用戶達到預(yù)定目標(biāo)的情況。消除人工智能系統(tǒng)不對齊的過程就稱為人工智能對齊。

一分鐘秒懂人工智能對齊,其他領(lǐng)域,人工智能
圖 ChatGPT的不對齊行為

2.為什么要研究人工智能對齊

根據(jù)人工智能對齊的定義，所有的人工智能問題（包括AI倫理、AI治理、可解釋性AI，甚至是最基本的回歸和分類問題）都可以算是人工智能對齊問題。那么為什么學(xué)術(shù)界還要發(fā)明“人工智能對齊”這個新概念？研究“人工智能對齊”這個新概念有什么價值呢？

事實上，人工智能對齊這一概念和ChatGPT這樣的通用大模型的誕生密不可分。對于通用大模型而言，一個模型可以同時完成多種任務(wù)，而且不同的任務(wù)有著不同的期望：有的任務(wù)希望能夠更有想象力，有的任務(wù)希望能夠更尊重事實；有的任務(wù)希望能夠理性客觀，有的任務(wù)希望能有細(xì)膩豐富的情感。任務(wù)的多樣性導(dǎo)致了需要對大模型進行全方面的對齊，而不僅僅是就某些方面進行對齊。傳統(tǒng)的研究往往針對某個方面進行對齊，對于ChatGPT這樣的通用模型會導(dǎo)致“按下葫蘆浮起瓢”，無法面面俱到。

隨著機器學(xué)習(xí)模型規(guī)模的不斷變大以及神經(jīng)網(wǎng)絡(luò)的大量應(yīng)用，人類已經(jīng)無法完全理解和解釋人工智能的某些行為。例如，用于圍棋AlphaGo下的某些棋迄今也不能被人類所完全理解。在未來，有可能會出現(xiàn)全方面碾壓人類的人工智能（比如《流浪地球》里的MOSS）。傳統(tǒng)的對齊方法顯然不能滿足對這樣的人工智能的對齊需求。

3.人工智能對齊的常見方法

人工智能對齊離不開人的接入。人對人工智能系統(tǒng)進行評估和反饋，可以確認(rèn)人工智能中不對齊的情況，并指導(dǎo)其進行改進。
人工智能對齊的方法包括模仿學(xué)習(xí)和人類反饋強化學(xué)習(xí)。ChatGPT就采用了這些對齊方法。

一分鐘秒懂人工智能對齊,其他領(lǐng)域,人工智能
ChatGPT訓(xùn)練步驟圖片來源
上圖是ChatGPT的訓(xùn)練步驟圖
步驟一利用收集到的數(shù)據(jù)進行監(jiān)督學(xué)習(xí)，這一部分就是在用模仿學(xué)習(xí)進行人工智能對齊。不過，ChatGPT的訓(xùn)練團隊認(rèn)為，僅僅用模仿學(xué)習(xí)并不能完全達到要求。

模仿學(xué)習(xí)不能完全滿足對齊需求的原因可能如下：模仿學(xué)習(xí)使用的數(shù)據(jù)集能覆蓋到的數(shù)據(jù)范圍是有限的，不可能包括所有的情況。用這樣數(shù)據(jù)集訓(xùn)練出來的人工智能難免有些邊腳情形的表現(xiàn)不對齊。另外，雖然訓(xùn)練后能夠讓訓(xùn)練目標(biāo)基本上達到最優(yōu)，但是在訓(xùn)練目標(biāo)最優(yōu)情況下還是會出現(xiàn)在某些樣本點上表現(xiàn)不好的情況。而這些樣本點也許還挺重要，這些不好的樣本點可能會涉及到重大的法律或是輿論風(fēng)險。

為此，ChatGPT的訓(xùn)練過程進一步地使用了人類反饋強化學(xué)習(xí)。步驟圖中的第二步和第三步就用到了人類反饋強化學(xué)習(xí)。

第二步通過人類的反饋構(gòu)建獎勵模型。

在這一步中，提供反饋的人可以就其認(rèn)為需要重點關(guān)注的問題進行著重考察，來確保在哪些重要的問題上獎勵模型是正確的。并且在后續(xù)的測試中如果發(fā)現(xiàn)了之前沒有預(yù)料到的新問題，還可以通過提供更多反饋樣本來為獎勵模型打上補丁。這樣，通過人工干預(yù)、不斷迭代反饋，獎勵模型就趨于完善。這樣，就讓獎勵模型的人類的期望對齊。

在利用反饋進行獎勵模型對齊的訓(xùn)練過程中，對于每個樣本，先由語言模型輸出幾個備選的回答，然后再由人類對這些回答進行排序。這樣的做法與直接讓用戶提供參考答案相比，更能夠激發(fā)語言模型本身的創(chuàng)造力，也能使得反饋更快更省錢。

第三步利用獎勵模型進行強化學(xué)習(xí)。

步驟中提到的PPO算法就是一種強化學(xué)習(xí)算法。通過使用強化學(xué)習(xí)算法，使得系統(tǒng)的行為和獎勵模型對齊。
基于反饋的強化學(xué)習(xí)在ChatGPT等大模型上的成功應(yīng)用使得該算法稱為最受關(guān)注的大模型對齊算法。目前絕大多數(shù)的大模型都采用了這個技術(shù)進行對齊。

延伸閱讀
一分鐘秒懂人工智能對齊,其他領(lǐng)域,人工智能

《強化學(xué)習(xí)：原理與Python實戰(zhàn)》

肖智清著

解密ChatGPT關(guān)鍵技術(shù)PPO和RLHF文章來源地址http://www.zghlxwxcb.cn/news/detail-752230.html

理論完備:涵蓋強化學(xué)習(xí)主干理論和常見算法，帶你參透ChatGPT技術(shù)要點；

實戰(zhàn)性強:每章都有編程案例，深度強化學(xué)習(xí)算法提供TenorFlow和PyTorch對照實現(xiàn)；

配套豐富:逐章提供知識點總結(jié)，章后習(xí)題形式豐富多樣。還有Gym源碼解讀、開發(fā)環(huán)境搭建指南、習(xí)題答案等在線資源助力自學(xué)。

到了這里，關(guān)于一分鐘秒懂人工智能對齊的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

10分鐘了解人工智能（最通俗的語言）
最通俗的語言：15分鐘了解人工智能；唯一優(yōu)點，受眾完全聽懂無人駕駛、智能家居、遠(yuǎn)程醫(yī)療 …… 如今，人工智能 (AI) 技術(shù)已被廣泛應(yīng)用于金融、交通、醫(yī)療、安防、教育等領(lǐng)域，成為經(jīng)濟增長新動能一什么是人工智能人工智能，英文縮寫為 AI ，指由人類制造出來的機
2023年04月22日
瀏覽(24)
初識人工智能，一文讀懂貝葉斯優(yōu)化和其他算法的知識文集(8)
??作者簡介，普修羅雙戰(zhàn)士，一直追求不斷學(xué)習(xí)和成長，在技術(shù)的道路上持續(xù)探索和實踐。 ??多年互聯(lián)網(wǎng)行業(yè)從業(yè)經(jīng)驗，歷任核心研發(fā)工程師，項目技術(shù)負(fù)責(zé)人。 ??歡迎 ??點贊?評論?收藏 ?? 人工智能領(lǐng)域知識 ?? 鏈接專欄人工智能專業(yè)知識學(xué)習(xí)一人工智能專欄人
2024年01月20日
瀏覽(61)
【人工智能】只需要1分鐘，GPT就幫我生成了思維導(dǎo)圖
自從人工智能橫空而出，它在人們的生活中產(chǎn)生了巨大的影響。尤其在企業(yè)辦公領(lǐng)域，借助人工智能的力量，能夠迅速產(chǎn)出豐富多樣的內(nèi)容，無論對于企業(yè)還是個人都具有重要的幫助。想象一下，通過與人工智能的合作，您可以輕松地生成各種所需的文檔、報告和演示稿，節(jié)
2024年02月11日
瀏覽(26)
一分鐘生成PPT，利用人工智能快速提高辦公效率（無需第三方插件）
人工智能技術(shù)的發(fā)展正以驚人的速度改變著我們的世界，今天給大家介紹下利用ChatGPT快速生成PPT 的方法，它能夠幫助你一鍵生成PPT內(nèi)容和漂亮的PPT文檔，無需繁瑣的設(shè)計和排版，只需要與ChatGPT交流，你就能輕松擁有一份令人贊嘆的演示文稿。什么是ChatGPT？它是基于人工智
2024年02月06日
瀏覽(28)
ChatGPT更新的使用指南，與其他類似的人工智能的軟件和服務(wù)-更新版（2023-6-25）
如果你還不知道如何注冊和使用，可看末尾，手把手教你。 ChatGPT 是一種基于自然語言處理技術(shù)的聊天機器人，它是由 OpenAI 公司開發(fā)的，使用了最新的語言模型技術(shù)。 ChatGPT 能夠理解和產(chǎn)生自然語言，可以模擬人類的對話，回答各種問題，提供相關(guān)的建議和信息，并且具有
2024年02月11日
瀏覽(29)
全網(wǎng)最詳細(xì)中英文ChatGPT接口文檔（五）30分鐘快速入門ChatGPT——手把手示例教程：如何建立一個人工智能回答關(guān)于您的網(wǎng)站問題，小白也可學(xué)
This tutorial walks through a simple example of crawling a website (in this example, the OpenAI website), turning the crawled pages into embeddings using the Embeddings API, and then creating a basic search functionality that allows a user to ask questions about the embedded information. This is intended to be a starting point for more sophisticated applicat
2023年04月17日
瀏覽(43)
什么是狹義人工智能、通用人工智能和超級人工智能？
人工智能 (AI) 是一種機器智能，它模仿人類思維的解決問題和決策能力來執(zhí)行各種任務(wù)。。人工智能使用機器學(xué)習(xí)和深度學(xué)習(xí)等算法和技術(shù)來學(xué)習(xí)、發(fā)展并在分配的任務(wù)中逐漸做得更好。根據(jù)人工智能可以復(fù)制的人類特征、現(xiàn)實世界的應(yīng)用和心智理論的先決條件，人工智能
2024年02月11日
瀏覽(101)
探索人工智能：深度學(xué)習(xí)、人工智能安全和人工智能編程（文末送書）
人工智能知識對于當(dāng)今的互聯(lián)網(wǎng)技術(shù)人來說已經(jīng)是剛需。但人工智能的概念、流派、技術(shù)紛繁復(fù)雜，選擇哪本書入門最適合呢？這部被譽為人工智能“百科全書”的《人工智能（第3版）》，可以作為每個技術(shù)人進入 AI 世界的第一本書。購書鏈接，限時特惠5折這本書是美國
2024年02月03日
瀏覽(53)
【人工智能】人工智能和雙曲幾何
????????作為人工智能技術(shù)的理論支撐，幾何學(xué)是必不可少的；目前直接的幾何技術(shù)有：計算幾何--對集合體如點云處理有用；射影幾何--對3d重構(gòu)有用；雙曲幾何--在自然語言的詞嵌入做基礎(chǔ)數(shù)學(xué)模型，另外深度學(xué)習(xí)國外有雙曲網(wǎng)絡(luò)在應(yīng)用。本文針對雙曲幾何進行探討。
2024年02月09日
瀏覽(36)
【人工智能業(yè)務(wù)概述】—人工智能的技術(shù)框架
人工智能的技術(shù)框架按照產(chǎn)業(yè)生態(tài)通?？梢詣澐譃榛A(chǔ)層、技術(shù)層、應(yīng)用層三大板塊。其中，基礎(chǔ)層提供了支撐人工智能應(yīng)用的基礎(chǔ)設(shè)施和技術(shù)，包括存儲和處理大規(guī)模數(shù)據(jù)的能力，以及高性能的計算和通信基礎(chǔ)設(shè)施；技術(shù)層提供了各種人工智能技術(shù)和算法，用于處理和分析
2024年02月02日
瀏覽(37)