国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

重要性采樣

2年前作者：紅燒code分類：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了重要性采樣。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

重要性采樣

前言

離散型隨機(jī)變量 $X$ ，我們可以通過(guò)以下方法求取其期望：

直接計(jì)算法，需要知道概率分布：
$\mathbb{E}(X)=\sum_{x\in X}\left[p(x)\cdot x\right]$
采樣計(jì)算，這時(shí)即使 $X$ 概率分布未知，依據(jù)大數(shù)定律，當(dāng)采樣次數(shù)夠大時(shí)，仍然可以求取期望
$\mathbb{E}(X)=\frac{1}{n}\lim_{n\to +\infty}\sum_{i=0}^{n-1} x_i$

連續(xù)型隨機(jī)變量 $X$

直接計(jì)算，需要 $f$ 表達(dá)式

$\mathbb{E}(X)=\int_x x\cdot f(x)dx$

抽樣(蒙特卡洛積分估計(jì))，這里不多做介紹

重要性采樣

思想：如果已知隨機(jī)變量 $X\sim p_0$ ，在 $p_0$ 下隨機(jī)采樣了一批數(shù)據(jù) $\{x_i\}\sim p_0$ ，現(xiàn)在要求隨機(jī)變量 $X\sim p_1$ 下的期望，則：
$\mathbb{E}_{X\sim p_1}[X]=\sum_x p_1(x)\cdot x=\sum_x p_0(x) \frac{p_1(x)}{p_0(x)}\cdot x=\mathbb{E}_{X\sim p_0}[f(X)]$
那么就有如下幾個(gè)問(wèn)題：

對(duì)于離散型隨機(jī)變量，為什么 $p_1(x)$ 已知，不直接計(jì)算期望呢？
- 因?yàn)橛袝r(shí)候我們已經(jīng)根據(jù) $p_0$ 采樣了一些數(shù)據(jù)，再用 $p_1$ 重新采樣計(jì)算一遍，會(huì)增加很多計(jì)算量。
- 因?yàn)橛行r(shí)候不方便對(duì) $p_1$ 采樣
- 在強(qiáng)化學(xué)習(xí)中，我們根據(jù)一個(gè)策略采樣，通過(guò)重要性采樣可以求出另一個(gè)策略的期望，是一種On Policy向Off Policy轉(zhuǎn)換的思想。
對(duì)于連續(xù)型隨機(jī)變量，為什么 $p_1(x)$ 已知，不直接計(jì)算期望呢？

理論上不可能完全求出概率密度函數(shù)，所以無(wú)法從理論上計(jì)算期望，只能估計(jì)。

例如，如果我們通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)表示 $f$ ，那么對(duì)任意的輸入 $x$ ，我們都可以求出 $f (x)$ ，但是這并不代表我們求出 $f$ 的函數(shù)表達(dá)式，更無(wú)法進(jìn)一步求積分。我們只是能從數(shù)值上計(jì)算出 $f (x)$ ，神經(jīng)網(wǎng)絡(luò)本身就是一個(gè)黑盒。

綜上所述，重要性采樣使得我們能夠從behavior policy采樣，然后去估計(jì)target policy的期望，從而使得On Policy的算法轉(zhuǎn)換為Off Policy文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-704139.html

到了這里，關(guān)于重要性采樣的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

機(jī)器學(xué)習(xí)中訓(xùn)練數(shù)據(jù)的重要性
人工智能技術(shù)發(fā)展至今，訓(xùn)練數(shù)據(jù)的重要性已經(jīng)是我們老生常談的問(wèn)題。在重聲訓(xùn)練數(shù)據(jù)為什么重要之前，我們先重新回顧下AI技術(shù)大爆炸的三大初始概念：機(jī)器學(xué)習(xí)是什么？人工智能是什么？訓(xùn)練數(shù)據(jù)又是什么？簡(jiǎn)單來(lái)說(shuō)，機(jī)器學(xué)習(xí)包含人工智能，人工智能屬于機(jī)器學(xué)習(xí)的
2024年02月13日
瀏覽(22)
【機(jī)器學(xué)習(xí)1】什么是機(jī)器學(xué)習(xí)&機(jī)器學(xué)習(xí)的重要性
什么是機(jī)器學(xué)習(xí)? 簡(jiǎn)而言之，機(jī)器學(xué)習(xí)就是訓(xùn)練機(jī)器去學(xué)習(xí)。機(jī)器學(xué)習(xí)作為人工智能(Artificial Intelligence,AI)的一個(gè)分支，以其最基本的形式來(lái)使用算法通過(guò)從數(shù)據(jù)中獲取知識(shí)來(lái)進(jìn)行預(yù)測(cè)。不同于人類通過(guò)分析大量數(shù)據(jù)手動(dòng)推導(dǎo)規(guī)則和模型，機(jī)器學(xué)習(xí)提供了一種更有效的方法來(lái)
2024年02月13日
瀏覽(27)
【Python機(jī)器學(xué)習(xí)】決策樹——樹的特征重要性
利用一些有用的屬性來(lái)總結(jié)樹的工作原理，其中最常用的事特征重要性，它為每個(gè)特征樹的決策的重要性進(jìn)行排序。對(duì)于每個(gè)特征來(lái)說(shuō)，它都是介于0到1之間的數(shù)字，其中0代表“根本沒(méi)有用到”，1代表“完美預(yù)測(cè)目標(biāo)值”。特征重要性的求和為1。將特征重要性進(jìn)行可視化：
2024年02月03日
瀏覽(25)
機(jī)器人控制系統(tǒng)學(xué)習(xí)和研究中數(shù)學(xué)的重要性
其實(shí)具備科學(xué)思維的方式非常非常難，很多情況下腦海中并非客觀事實(shí)，而是充滿了幻覺(jué)。 ? ? 如果在各種AI工具中問(wèn)及這樣的問(wèn)題，會(huì)得到類似如下回復(fù)：機(jī)器人控制系統(tǒng)學(xué)習(xí)和研究中數(shù)學(xué)的重要性主要體現(xiàn)在以下幾個(gè)方面：機(jī)器人運(yùn)動(dòng)學(xué)：機(jī)器人控制系統(tǒng)需要處理機(jī)器
2024年02月05日
瀏覽(33)
[論文閱讀] (29)李沐老師視頻學(xué)習(xí)——2.研究的藝術(shù)·找問(wèn)題和明白問(wèn)題的重要性
《娜璋帶你讀論文》系列主要是督促自己閱讀優(yōu)秀論文及聽(tīng)取學(xué)術(shù)講座，并分享給大家，希望您喜歡。由于作者的英文水平和學(xué)術(shù)能力不高，需要不斷提升，所以還請(qǐng)大家批評(píng)指正，非常歡迎大家給我留言評(píng)論，學(xué)術(shù)路上期待與您前行，加油。前一篇帶來(lái)李沐老師對(duì)論文寫作
2024年02月01日
瀏覽(22)
【Python | 機(jī)器學(xué)習(xí)】Python中進(jìn)行特征重要性分析的9個(gè)常用方法（含源代碼）
特征重要性分析用于了解每個(gè)特征(變量或輸入)對(duì)于做出預(yù)測(cè)的有用性或價(jià)值。目標(biāo)是確定對(duì)模型輸出影響最大的最重要的特征，它是機(jī)器學(xué)習(xí)中經(jīng)常使用的一種方法。特征重要性分析在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)中扮演著重要的角色，具有以下重要性：理解數(shù)據(jù)：特征重要性分析
2024年02月03日
瀏覽(19)
性能優(yōu)化的重要性
博主默語(yǔ)帶您 Go to New World. ? 個(gè)人主頁(yè)—— 默語(yǔ) 的博客???? 《java 面試題大全》 ??惟余輩才疏學(xué)淺，臨摹之作或有不妥之處，還請(qǐng)讀者海涵指正。??? 《MYSQL從入門到精通》數(shù)據(jù)庫(kù)是開發(fā)者必會(huì)基礎(chǔ)之一~ ?? 吾期望此文有資助于爾，即使粗淺難及深廣，亦備添少許微薄
2024年02月12日
瀏覽(97)
分布式操作系統(tǒng)的必要性及重要性
總有人在各個(gè)平臺(tái)留言或者私信問(wèn)LAXCUS分布式操作系統(tǒng)的各種問(wèn)題，尤其是關(guān)于分布式操作系統(tǒng)的應(yīng)用市場(chǎng)、價(jià)值、意義之類的問(wèn)題。我們團(tuán)隊(duì)做LAXCUS分布式操作系統(tǒng)，也不是頭腦憑空發(fā)熱，是基于我們之前的大量產(chǎn)品設(shè)計(jì)、經(jīng)驗(yàn)逐漸一步步做起來(lái)。當(dāng)今已經(jīng)進(jìn)入智能時(shí)代，
2024年02月08日
瀏覽(23)
網(wǎng)絡(luò)安全的重要性
網(wǎng)絡(luò)安全是指網(wǎng)絡(luò)系統(tǒng)的硬件、軟件及其系統(tǒng)中的數(shù)據(jù)受到保護(hù)，不受偶然的或者惡意的原因而遭到破壞、更改、泄露，系統(tǒng)連續(xù)可靠正常地運(yùn)行，網(wǎng)絡(luò)服務(wù)不中斷。網(wǎng)絡(luò)安全從其本質(zhì)上來(lái)講就是網(wǎng)絡(luò)上的信息安全。從廣義來(lái)說(shuō)，凡是涉及到網(wǎng)絡(luò)上信息的保密性、完整性、
2024年02月06日
瀏覽(21)
未來(lái)，運(yùn)營(yíng)的重要性大于產(chǎn)品？
微博上看到某產(chǎn)品大 V 的一個(gè)觀點(diǎn)，說(shuō)在未來(lái)，產(chǎn)品運(yùn)營(yíng)的重要性會(huì)大過(guò)產(chǎn)品經(jīng)理，還挺認(rèn)同的，談?wù)勎业南敕ā?這個(gè)觀點(diǎn)的核心依據(jù)是，目前沒(méi)有新的產(chǎn)品形態(tài)，各種產(chǎn)品解決方案都是標(biāo)準(zhǔn)化的，產(chǎn)品由開疆辟土變成了運(yùn)營(yíng)的支撐部門。所謂產(chǎn)品形態(tài)，根據(jù)我的理解，就
2024年02月13日
瀏覽(20)

<span id="mdr9d"><th id="mdr9d"></th></span>

<source id="mdr9d"></source>

<span id="mdr9d"></span>