国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

人工智能 | 一文介紹五種基本 Agent

1年前作者：一根老麻花分類：Toy博客閱讀(26)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了人工智能 | 一文介紹五種基本 Agent。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

在討論智能化 Agent 之前，我們首先來了解一下，什么是 Agent？

Agent 是一個(gè)通過傳感器感知所處環(huán)境、通過執(zhí)行器對(duì)環(huán)境產(chǎn)生作用的東西。

如果將人類看成一個(gè) Agent，那么傳感器就是眼睛、耳朵等器官，執(zhí)行器就是手、腿等身體的其他部位。

接下來，我們就來介紹一下五種基本的 Agent，包括：

簡(jiǎn)單反射型 Agent
基于模型的反射型 Agent
基于目標(biāo)的 Agent
基于效用的 Agent
學(xué)習(xí) Agent

簡(jiǎn)單反射型 Agent

簡(jiǎn)單反射型 Agent 基于當(dāng)前的感知選擇行動(dòng)，忽略其余的感知?dú)v史。

簡(jiǎn)單反射型 Agent 的結(jié)構(gòu)如下：

agent模型的例子,課程復(fù)習(xí),人工智能

傳感器：感知當(dāng)前所處的環(huán)境
條件 - 行動(dòng)準(zhǔn)則：根據(jù)感知信息匹配相應(yīng)的行動(dòng)規(guī)則。
執(zhí)行器：執(zhí)行相應(yīng)的動(dòng)作，對(duì)環(huán)境產(chǎn)生作用。

簡(jiǎn)單反射型 Agent 可以通過建立一個(gè)通用的條件 - 行動(dòng)規(guī)則解釋器，然后對(duì)特定任務(wù)環(huán)境創(chuàng)建規(guī)則集合來實(shí)現(xiàn)。例如，在駕駛系統(tǒng)中創(chuàng)建一個(gè)規(guī)則，即如果前方的車輛在減速剎車，那么系統(tǒng)也開始控制車輛減速剎車。

實(shí)現(xiàn)的偽代碼如下：

agent模型的例子,課程復(fù)習(xí),人工智能

基于模型的反射型 Agent

基于模型的反射型 Agent 在簡(jiǎn)單反射型 Agent 的基礎(chǔ)上，維持了一個(gè)取決于歷史的內(nèi)部狀態(tài)，從而反映當(dāng)前狀態(tài)的某些不可觀察的方面。為了隨時(shí)更新內(nèi)部狀態(tài)，需要加入兩種類型的知識(shí)：

關(guān)于世界如何獨(dú)立于 Agent 而發(fā)展的信息。 例如：超車的汽車在下一時(shí)刻會(huì)從后方趕上來，更靠近本車。
關(guān)于 Agent 自身的動(dòng)作如何影響世界的信息。例如：當(dāng) Agent 順時(shí)針轉(zhuǎn)動(dòng)方向盤時(shí)，汽車向右轉(zhuǎn)。
這種關(guān)于世界如何運(yùn)轉(zhuǎn)的知識(shí)，稱為世界模型。使用這樣模型的 Agent 稱為基于模型的 Agent。
【深度學(xué)習(xí)中的 LSTM（長短時(shí)記憶）、和注意力機(jī)制等屬于基于模型的反射型 Agent】

基于模型的反射型 Agent 結(jié)構(gòu)如下：

agent模型的例子,課程復(fù)習(xí),人工智能

實(shí)現(xiàn)的偽代碼如下：

agent模型的例子,課程復(fù)習(xí),人工智能

rules 代表世界如何演變。
初始的 action 代表我做過什么，更新后的 action 表示現(xiàn)在應(yīng)該采取什么行動(dòng)。

基于目標(biāo)的 Agent

基于目標(biāo)的 Agent 不僅需要當(dāng)前狀態(tài)的描述，而且需要某種目標(biāo)信息來描述想要達(dá)到的狀況。例如：乘客的目的地。Agent 程序會(huì)把目標(biāo)信息和可能動(dòng)作的結(jié)果結(jié)合起來，評(píng)估不同動(dòng)作的優(yōu)劣，從而選擇最有利于實(shí)現(xiàn)目標(biāo)的動(dòng)作?！?strong>路徑規(guī)劃、8 數(shù)碼問題等屬于基于目標(biāo)的 Agent】

基于目標(biāo)的 Agent 結(jié)構(gòu)如下：

agent模型的例子,課程復(fù)習(xí),人工智能

基于模型和目標(biāo)的 Agent，既要追蹤記錄世界的狀態(tài)（前方車輛是否減速、后方車輛是否準(zhǔn)備超車），又要記錄要達(dá)到的目標(biāo)集（車輛行駛的目的地），并選擇能最終到達(dá)目標(biāo)的動(dòng)作（方向盤不同還是左打右打）

基于效用的 Agent

在很多環(huán)境下，單靠目標(biāo)很難產(chǎn)生好的行為。例如：有很多路線可以令出租車到達(dá)目的地。但是有的路線更快、更安全、更可靠、或者更便宜。如果一個(gè)世界狀態(tài)比另一個(gè)更受偏好，則對(duì) Agent 來說有更高的效用。

基于效用的 Agent 在目基于目標(biāo)的 Agent 的基礎(chǔ)上，增加了一個(gè)效用模塊，用于存儲(chǔ) Agent 對(duì)不同狀態(tài)或結(jié)果的偏好或滿意度。這樣，Agent 就可以根據(jù)世界狀態(tài)、要達(dá)到的目標(biāo)集以及效用函數(shù)，選擇導(dǎo)致最佳期望效用的動(dòng)作。【機(jī)場(chǎng)選址、雄安新區(qū)選址、高鐵路線設(shè)計(jì)、人生目標(biāo)的選擇等決策，屬于基于效用 Agent】

基于效用的 Agent 結(jié)構(gòu)如下：

agent模型的例子,課程復(fù)習(xí),人工智能

學(xué)習(xí) Agent

學(xué)習(xí) Agent 可以劃分為四個(gè)概念上的組件，根據(jù)外部的反饋和內(nèi)部的評(píng)價(jià)來改進(jìn) Agent 的行為。

學(xué)習(xí) Agent 結(jié)構(gòu)如下：

agent模型的例子,課程復(fù)習(xí),人工智能文章來源地址http://www.zghlxwxcb.cn/news/detail-849025.html

評(píng)價(jià)元件：根據(jù)固定的性能標(biāo)準(zhǔn)來評(píng)估 Agent 在環(huán)境中的行為表現(xiàn)，給 Agent 提供正向或反向的反饋信號(hào)，以指導(dǎo) Agent 的學(xué)習(xí)過程。例如，根據(jù)棋局的優(yōu)劣來給Agent一個(gè)分?jǐn)?shù)；根據(jù) Agent 是否贏得比賽來給 Agent 一個(gè)獎(jiǎng)勵(lì)或懲罰。
學(xué)習(xí)元件：利用來自評(píng)價(jià)元件的反饋，評(píng)價(jià)Agent做得如何，并決定應(yīng)該如何修改執(zhí)行元件以在未來做得更好。
執(zhí)行元件：執(zhí)行外部動(dòng)作，同時(shí)為學(xué)習(xí)元件提供知識(shí)。
問題產(chǎn)生器：負(fù)責(zé)提議可以產(chǎn)生新的、有啟發(fā)式價(jià)值的經(jīng)驗(yàn)的動(dòng)作。

到了這里，關(guān)于人工智能 | 一文介紹五種基本 Agent的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【Python | 人工智能】一文講清AI賦能自動(dòng)駕駛的底層原理
引言人工智能引領(lǐng)現(xiàn)代，智能AI賦能未來。它在當(dāng)今社會(huì)和科技領(lǐng)域中具有重要性。本文將著重探討人工智能對(duì)自動(dòng)駕駛技術(shù)的深度賦能和應(yīng)用場(chǎng)景等。有時(shí)我們乘坐網(wǎng)約車的時(shí)候，能打到無人駕駛汽車，全程均為AI語音播報(bào)：自動(dòng)駕駛是指通過使用各種傳感器、計(jì)算機(jī)
2024年02月04日
瀏覽(22)
初識(shí)人工智能，一文讀懂機(jī)器學(xué)習(xí)之邏輯回歸知識(shí)文集(1)
??作者簡(jiǎn)介，普修羅雙戰(zhàn)士，一直追求不斷學(xué)習(xí)和成長，在技術(shù)的道路上持續(xù)探索和實(shí)踐。 ??多年互聯(lián)網(wǎng)行業(yè)從業(yè)經(jīng)驗(yàn)，歷任核心研發(fā)工程師，項(xiàng)目技術(shù)負(fù)責(zé)人。 ??歡迎 ??點(diǎn)贊?評(píng)論?收藏 ?? 人工智能領(lǐng)域知識(shí) ?? 鏈接專欄人工智能專業(yè)知識(shí)學(xué)習(xí)一人工智能專欄人
2024年01月23日
瀏覽(27)
【人工智能高頻面試題--基本篇】
?? 作者：“碼上有前” ?? 文章簡(jiǎn)介：人工智能高頻面試題 ?? 歡迎小伙伴們點(diǎn)贊??、收藏?、留言?? 深度學(xué)習(xí)與過往的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法相比有以下幾個(gè)區(qū)別：數(shù)據(jù)量和模型規(guī)模：深度學(xué)習(xí)通常需要大量的標(biāo)注數(shù)據(jù)和更大規(guī)模的模型來獲得較好的性能。相比之下，過
2024年04月27日
瀏覽(10)
初識(shí)人工智能，一文讀懂貝葉斯優(yōu)化和其他算法的知識(shí)文集(8)
??作者簡(jiǎn)介，普修羅雙戰(zhàn)士，一直追求不斷學(xué)習(xí)和成長，在技術(shù)的道路上持續(xù)探索和實(shí)踐。 ??多年互聯(lián)網(wǎng)行業(yè)從業(yè)經(jīng)驗(yàn)，歷任核心研發(fā)工程師，項(xiàng)目技術(shù)負(fù)責(zé)人。 ??歡迎 ??點(diǎn)贊?評(píng)論?收藏 ?? 人工智能領(lǐng)域知識(shí) ?? 鏈接專欄人工智能專業(yè)知識(shí)學(xué)習(xí)一人工智能專欄人
2024年01月20日
瀏覽(61)
gpt人工智能詳細(xì)介紹
OpenAI ChatGPT不是一款普通的軟件，它是由OpenAI開發(fā)的一款基于人工智能技術(shù)的自然語言生成器。因此，它并不需要像普通軟件一樣下載和安裝在您的計(jì)算機(jī)上。作為一個(gè)云端服務(wù)，OpenAI ChatGPT可以通過您的瀏覽器直接訪問和使用。對(duì)于普通用戶來說，最簡(jiǎn)單的方法是訪問Open
2024年02月07日
瀏覽(19)
人工智能芯片開發(fā)板介紹
人工智能芯片開發(fā)板是專為開發(fā)和實(shí)現(xiàn)人工智能應(yīng)用而設(shè)計(jì)的硬件平臺(tái)。它們集成了高性能的人工智能芯片、多種傳感器、豐富的接口和開發(fā)工具，為開發(fā)人員提供了便捷的環(huán)境來構(gòu)建、訓(xùn)練和部署人工智能模型。這些開發(fā)板具備強(qiáng)大的處理能力，采用GPU、FPGA或?qū)Ｓ玫腁I加速
2024年02月07日
瀏覽(24)
【人工智能】大模型綜述 —— 一文帶你理清全球AI巨頭的大模型進(jìn)化史
? 目錄導(dǎo)讀家譜樹——大模型的前世今生數(shù)據(jù)——大模型的力量源泉
2024年02月09日
瀏覽(24)
了解人工智能生成內(nèi)容（AIGC）的基本原理和應(yīng)用
? AIGC的定義和背景人工智能生成內(nèi)容（Artificial Intelligence Generated Content，簡(jiǎn)稱AIGC）是指利用人工智能技術(shù)和算法來自動(dòng)生成各種形式的內(nèi)容，例如文章、新聞、廣告、代碼等。AIGC的發(fā)展可以追溯到機(jī)器學(xué)習(xí)和自然語言處理等領(lǐng)域的進(jìn)展，以及深度學(xué)習(xí)模型的快速發(fā)展。 ?
2024年02月03日
瀏覽(39)
【人工智能】大模型極簡(jiǎn)教程：基本概念與原理
2024年02月17日
瀏覽(97)
人工智能|各名稱與概念之介紹
版權(quán)聲明：轉(zhuǎn)載必須注明本文轉(zhuǎn)自嚴(yán)振杰的博客：http://blog.yanzhenjie.com 適莽蒼者，三餐而反，腹猶果然；適百里者，宿舂糧；適千里者，三月聚糧。 ——莊周《逍遙游》上文引用了戰(zhàn)國中期先秦道家學(xué)派的代表人物莊子的逍遙游選段，翻譯為白話文大致含義是：到近郊去的
2024年03月17日
瀏覽(22)