国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

人工智能 | 一文介紹五種基本 Agent

這篇具有很好參考價(jià)值的文章主要介紹了人工智能 | 一文介紹五種基本 Agent。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

在討論智能化 Agent 之前,我們首先來了解一下,什么是 Agent?

Agent 是一個(gè)通過傳感器感知所處環(huán)境、通過執(zhí)行器對(duì)環(huán)境產(chǎn)生作用的東西。

如果將人類看成一個(gè) Agent,那么傳感器就是眼睛、耳朵等器官,執(zhí)行器就是手、腿等身體的其他部位。

接下來,我們就來介紹一下五種基本的 Agent,包括:

  • 簡(jiǎn)單反射型 Agent
  • 基于模型的反射型 Agent
  • 基于目標(biāo)的 Agent
  • 基于效用的 Agent
  • 學(xué)習(xí) Agent

簡(jiǎn)單反射型 Agent

簡(jiǎn)單反射型 Agent 基于當(dāng)前的感知選擇行動(dòng),忽略其余的感知?dú)v史。

簡(jiǎn)單反射型 Agent 的結(jié)構(gòu)如下:

agent模型的例子,課程復(fù)習(xí),人工智能

  • 傳感器:感知當(dāng)前所處的環(huán)境
  • 條件 - 行動(dòng)準(zhǔn)則:根據(jù)感知信息匹配相應(yīng)的行動(dòng)規(guī)則。
  • 執(zhí)行器:執(zhí)行相應(yīng)的動(dòng)作,對(duì)環(huán)境產(chǎn)生作用。

簡(jiǎn)單反射型 Agent 可以通過建立一個(gè)通用的條件 - 行動(dòng)規(guī)則解釋器,然后對(duì)特定任務(wù)環(huán)境創(chuàng)建規(guī)則集合來實(shí)現(xiàn)。例如,在駕駛系統(tǒng)中創(chuàng)建一個(gè)規(guī)則,即如果前方的車輛在減速剎車,那么系統(tǒng)也開始控制車輛減速剎車。

實(shí)現(xiàn)的偽代碼如下:

agent模型的例子,課程復(fù)習(xí),人工智能

基于模型的反射型 Agent

基于模型的反射型 Agent 在簡(jiǎn)單反射型 Agent 的基礎(chǔ)上,維持了一個(gè)取決于歷史的內(nèi)部狀態(tài),從而反映當(dāng)前狀態(tài)的某些不可觀察的方面。為了隨時(shí)更新內(nèi)部狀態(tài),需要加入兩種類型的知識(shí):

  1. 關(guān)于世界如何獨(dú)立于 Agent 而發(fā)展的信息。 例如:超車的汽車在下一時(shí)刻會(huì)從后方趕上來,更靠近本車。
  2. 關(guān)于 Agent 自身的動(dòng)作如何影響世界的信息。例如:當(dāng) Agent 順時(shí)針轉(zhuǎn)動(dòng)方向盤時(shí),汽車向右轉(zhuǎn)。
    這種關(guān)于世界如何運(yùn)轉(zhuǎn)的知識(shí),稱為世界模型。使用這樣模型的 Agent 稱為基于模型的 Agent
    深度學(xué)習(xí)中的 LSTM(長短時(shí)記憶)、和注意力機(jī)制等屬于基于模型的反射型 Agent

基于模型的反射型 Agent 結(jié)構(gòu)如下:

agent模型的例子,課程復(fù)習(xí),人工智能

實(shí)現(xiàn)的偽代碼如下:

agent模型的例子,課程復(fù)習(xí),人工智能

  • rules 代表世界如何演變。
  • 初始的 action 代表我做過什么,更新后的 action 表示現(xiàn)在應(yīng)該采取什么行動(dòng)。

基于目標(biāo)的 Agent

基于目標(biāo)的 Agent 不僅需要當(dāng)前狀態(tài)的描述,而且需要某種目標(biāo)信息來描述想要達(dá)到的狀況。例如:乘客的目的地。Agent 程序會(huì)把目標(biāo)信息和可能動(dòng)作的結(jié)果結(jié)合起來,評(píng)估不同動(dòng)作的優(yōu)劣,從而選擇最有利于實(shí)現(xiàn)目標(biāo)的動(dòng)作?!?strong>路徑規(guī)劃、8 數(shù)碼問題等屬于基于目標(biāo)的 Agent】

基于目標(biāo)的 Agent 結(jié)構(gòu)如下:

agent模型的例子,課程復(fù)習(xí),人工智能

基于模型和目標(biāo)的 Agent,既要追蹤記錄世界的狀態(tài)(前方車輛是否減速、后方車輛是否準(zhǔn)備超車),又要記錄要達(dá)到的目標(biāo)集(車輛行駛的目的地),并選擇能最終到達(dá)目標(biāo)的動(dòng)作(方向盤不同還是左打右打)

基于效用的 Agent

在很多環(huán)境下,單靠目標(biāo)很難產(chǎn)生好的行為。例如:有很多路線可以令出租車到達(dá)目的地。但是有的路線更快、更安全、更可靠、或者更便宜。如果一個(gè)世界狀態(tài)比另一個(gè)更受偏好,則對(duì) Agent 來說有更高的效用。

基于效用的 Agent 在目基于目標(biāo)的 Agent 的基礎(chǔ)上,增加了一個(gè)效用模塊,用于存儲(chǔ) Agent 對(duì)不同狀態(tài)或結(jié)果的偏好或滿意度。這樣,Agent 就可以根據(jù)世界狀態(tài)、要達(dá)到的目標(biāo)集以及效用函數(shù),選擇導(dǎo)致最佳期望效用的動(dòng)作。【機(jī)場(chǎng)選址、雄安新區(qū)選址、高鐵路線設(shè)計(jì)、人生目標(biāo)的選擇等決策,屬于基于效用 Agent】

基于效用的 Agent 結(jié)構(gòu)如下:

agent模型的例子,課程復(fù)習(xí),人工智能

學(xué)習(xí) Agent

學(xué)習(xí) Agent 可以劃分為四個(gè)概念上的組件,根據(jù)外部的反饋和內(nèi)部的評(píng)價(jià)來改進(jìn) Agent 的行為。

學(xué)習(xí) Agent 結(jié)構(gòu)如下:

agent模型的例子,課程復(fù)習(xí),人工智能文章來源地址http://www.zghlxwxcb.cn/news/detail-849025.html

  • 評(píng)價(jià)元件:根據(jù)固定的性能標(biāo)準(zhǔn)來評(píng)估 Agent 在環(huán)境中的行為表現(xiàn),給 Agent 提供正向或反向的反饋信號(hào),以指導(dǎo) Agent 的學(xué)習(xí)過程。例如,根據(jù)棋局的優(yōu)劣來給Agent一個(gè)分?jǐn)?shù);根據(jù) Agent 是否贏得比賽來給 Agent 一個(gè)獎(jiǎng)勵(lì)或懲罰。
  • 學(xué)習(xí)元件:利用來自評(píng)價(jià)元件的反饋,評(píng)價(jià)Agent做得如何,并決定應(yīng)該如何修改執(zhí)行元件以在未來做得更好。
  • 執(zhí)行元件:執(zhí)行外部動(dòng)作,同時(shí)為學(xué)習(xí)元件提供知識(shí)。
  • 問題產(chǎn)生器:負(fù)責(zé)提議可以產(chǎn)生新的、有啟發(fā)式價(jià)值的經(jīng)驗(yàn)的動(dòng)作。

到了這里,關(guān)于人工智能 | 一文介紹五種基本 Agent的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【Python | 人工智能】一文講清AI賦能自動(dòng)駕駛的底層原理

    【Python | 人工智能】一文講清AI賦能自動(dòng)駕駛的底層原理

    引言 人工智能引領(lǐng)現(xiàn)代,智能AI賦能未來。 它在當(dāng)今社會(huì)和科技領(lǐng)域中具有重要性。 本文將著重探討人工智能對(duì)自動(dòng)駕駛技術(shù)的深度賦能和應(yīng)用場(chǎng)景等。 有時(shí)我們乘坐網(wǎng)約車的時(shí)候,能打到無人駕駛汽車,全程均為AI語音播報(bào): 自動(dòng)駕駛是指通過使用 各種傳感器 、 計(jì)算機(jī)

    2024年02月04日
    瀏覽(22)
  • 初識(shí)人工智能,一文讀懂機(jī)器學(xué)習(xí)之邏輯回歸知識(shí)文集(1)

    初識(shí)人工智能,一文讀懂機(jī)器學(xué)習(xí)之邏輯回歸知識(shí)文集(1)

    ??作者簡(jiǎn)介,普修羅雙戰(zhàn)士,一直追求不斷學(xué)習(xí)和成長,在技術(shù)的道路上持續(xù)探索和實(shí)踐。 ??多年互聯(lián)網(wǎng)行業(yè)從業(yè)經(jīng)驗(yàn),歷任核心研發(fā)工程師,項(xiàng)目技術(shù)負(fù)責(zé)人。 ??歡迎 ??點(diǎn)贊?評(píng)論?收藏 ?? 人工智能領(lǐng)域知識(shí) ?? 鏈接 專欄 人工智能專業(yè)知識(shí)學(xué)習(xí)一 人工智能專欄 人

    2024年01月23日
    瀏覽(27)
  • 【人工智能高頻面試題--基本篇】

    【人工智能高頻面試題--基本篇】

    ?? 作者 :“碼上有前” ?? 文章簡(jiǎn)介 :人工智能高頻面試題 ?? 歡迎小伙伴們 點(diǎn)贊??、收藏?、留言?? 深度學(xué)習(xí)與過往的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法相比有以下幾個(gè)區(qū)別: 數(shù)據(jù)量和模型規(guī)模:深度學(xué)習(xí)通常需要大量的標(biāo)注數(shù)據(jù)和更大規(guī)模的模型來獲得較好的性能。相比之下,過

    2024年04月27日
    瀏覽(10)
  • 初識(shí)人工智能,一文讀懂貝葉斯優(yōu)化和其他算法的知識(shí)文集(8)

    初識(shí)人工智能,一文讀懂貝葉斯優(yōu)化和其他算法的知識(shí)文集(8)

    ??作者簡(jiǎn)介,普修羅雙戰(zhàn)士,一直追求不斷學(xué)習(xí)和成長,在技術(shù)的道路上持續(xù)探索和實(shí)踐。 ??多年互聯(lián)網(wǎng)行業(yè)從業(yè)經(jīng)驗(yàn),歷任核心研發(fā)工程師,項(xiàng)目技術(shù)負(fù)責(zé)人。 ??歡迎 ??點(diǎn)贊?評(píng)論?收藏 ?? 人工智能領(lǐng)域知識(shí) ?? 鏈接 專欄 人工智能專業(yè)知識(shí)學(xué)習(xí)一 人工智能專欄 人

    2024年01月20日
    瀏覽(61)
  • gpt人工智能詳細(xì)介紹

    gpt人工智能詳細(xì)介紹

    OpenAI ChatGPT不是一款普通的軟件,它是由OpenAI開發(fā)的一款基于人工智能技術(shù)的自然語言生成器。因此,它并不需要像普通軟件一樣下載和安裝在您的計(jì)算機(jī)上。 作為一個(gè)云端服務(wù),OpenAI ChatGPT可以通過您的瀏覽器直接訪問和使用。對(duì)于普通用戶來說,最簡(jiǎn)單的方法是訪問Open

    2024年02月07日
    瀏覽(19)
  • 人工智能芯片開發(fā)板介紹

    人工智能芯片開發(fā)板介紹

    人工智能芯片開發(fā)板是專為開發(fā)和實(shí)現(xiàn)人工智能應(yīng)用而設(shè)計(jì)的硬件平臺(tái)。它們集成了高性能的人工智能芯片、多種傳感器、豐富的接口和開發(fā)工具,為開發(fā)人員提供了便捷的環(huán)境來構(gòu)建、訓(xùn)練和部署人工智能模型。 這些開發(fā)板具備強(qiáng)大的處理能力,采用GPU、FPGA或?qū)S玫腁I加速

    2024年02月07日
    瀏覽(24)
  • 【人工智能】大模型綜述 —— 一文帶你理清全球AI巨頭的大模型進(jìn)化史

    【人工智能】大模型綜述 —— 一文帶你理清全球AI巨頭的大模型進(jìn)化史

    ? 目錄 導(dǎo)讀 家譜樹——大模型的前世今生 數(shù)據(jù)——大模型的力量源泉

    2024年02月09日
    瀏覽(24)
  • 了解人工智能生成內(nèi)容(AIGC)的基本原理和應(yīng)用

    ? AIGC的定義和背景 人工智能生成內(nèi)容(Artificial Intelligence Generated Content,簡(jiǎn)稱AIGC)是指利用人工智能技術(shù)和算法來自動(dòng)生成各種形式的內(nèi)容,例如文章、新聞、廣告、代碼等。AIGC的發(fā)展可以追溯到機(jī)器學(xué)習(xí)和自然語言處理等領(lǐng)域的進(jìn)展,以及深度學(xué)習(xí)模型的快速發(fā)展。 ?

    2024年02月03日
    瀏覽(39)
  • 人工智能|各名稱與概念之介紹

    版權(quán)聲明:轉(zhuǎn)載必須注明本文轉(zhuǎn)自嚴(yán)振杰的博客:http://blog.yanzhenjie.com 適莽蒼者,三餐而反,腹猶果然;適百里者,宿舂糧;適千里者,三月聚糧。 ——莊周《逍遙游》 上文引用了戰(zhàn)國中期先秦道家學(xué)派的代表人物莊子的逍遙游選段,翻譯為白話文大致含義是:到近郊去的

    2024年03月17日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包