国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

重要性采樣

這篇具有很好參考價(jià)值的文章主要介紹了重要性采樣。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

重要性采樣

前言

離散型隨機(jī)變量 X X X,我們可以通過(guò)以下方法求取其期望:

  1. 直接計(jì)算法,需要知道概率分布:
    E ( X ) = ∑ x ∈ X [ p ( x ) ? x ] \mathbb{E}(X)=\sum_{x\in X}\left[p(x)\cdot x\right] E(X)=xX?[p(x)?x]

  2. 采樣計(jì)算,這時(shí)即使 X X X概率分布未知,依據(jù)大數(shù)定律,當(dāng)采樣次數(shù)夠大時(shí),仍然可以求取期望
    E ( X ) = 1 n lim ? n → + ∞ ∑ i = 0 n ? 1 x i \mathbb{E}(X)=\frac{1}{n}\lim_{n\to +\infty}\sum_{i=0}^{n-1} x_i E(X)=n1?n+lim?i=0n?1?xi?

連續(xù)型隨機(jī)變量 X X X

  1. 直接計(jì)算,需要 f f f表達(dá)式

E ( X ) = ∫ x x ? f ( x ) d x \mathbb{E}(X)=\int_x x\cdot f(x)dx E(X)=x?x?f(x)dx

  1. 抽樣(蒙特卡洛積分估計(jì)),這里不多做介紹
重要性采樣

思想:如果已知隨機(jī)變量 X ~ p 0 X\sim p_0 Xp0?,在 p 0 p_0 p0?下隨機(jī)采樣了一批數(shù)據(jù) { x i } ~ p 0 \{x_i\}\sim p_0 {xi?}p0?,現(xiàn)在要求隨機(jī)變量 X ~ p 1 X\sim p_1 Xp1?下的期望,則:
E X ~ p 1 [ X ] = ∑ x p 1 ( x ) ? x = ∑ x p 0 ( x ) p 1 ( x ) p 0 ( x ) ? x = E X ~ p 0 [ f ( X ) ] \mathbb{E}_{X\sim p_1}[X]=\sum_x p_1(x)\cdot x=\sum_x p_0(x) \frac{p_1(x)}{p_0(x)}\cdot x=\mathbb{E}_{X\sim p_0}[f(X)] EXp1??[X]=x?p1?(x)?x=x?p0?(x)p0?(x)p1?(x)??x=EXp0??[f(X)]
那么就有如下幾個(gè)問(wèn)題:

  1. 對(duì)于離散型隨機(jī)變量,為什么 p 1 ( x ) p_1(x) p1?(x)已知,不直接計(jì)算期望呢?

    • 因?yàn)橛袝r(shí)候我們已經(jīng)根據(jù) p 0 p_0 p0?采樣了一些數(shù)據(jù),再用 p 1 p_1 p1?重新采樣計(jì)算一遍,會(huì)增加很多計(jì)算量。
    • 因?yàn)橛行r(shí)候不方便對(duì) p 1 p_1 p1?采樣
    • 在強(qiáng)化學(xué)習(xí)中,我們根據(jù)一個(gè)策略采樣,通過(guò)重要性采樣可以求出另一個(gè)策略的期望,是一種On Policy向Off Policy轉(zhuǎn)換的思想。
  2. 對(duì)于連續(xù)型隨機(jī)變量,為什么 p 1 ( x ) p_1(x) p1?(x)已知,不直接計(jì)算期望呢?

    理論上不可能完全求出概率密度函數(shù),所以無(wú)法從理論上計(jì)算期望,只能估計(jì)。

    例如,如果我們通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)表示 f f f,那么對(duì)任意的輸入 x x x,我們都可以求出 f ( x ) f(x) f(x),但是這并不代表我們求出 f f f的函數(shù)表達(dá)式,更無(wú)法進(jìn)一步求積分。我們只是能從數(shù)值上計(jì)算出 f ( x ) f(x) f(x),神經(jīng)網(wǎng)絡(luò)本身就是一個(gè)黑盒。

綜上所述,重要性采樣使得我們能夠從behavior policy采樣,然后去估計(jì)target policy的期望,從而使得On Policy的算法轉(zhuǎn)換為Off Policy文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-704139.html

到了這里,關(guān)于重要性采樣的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 機(jī)器學(xué)習(xí)中訓(xùn)練數(shù)據(jù)的重要性

    機(jī)器學(xué)習(xí)中訓(xùn)練數(shù)據(jù)的重要性

    人工智能技術(shù)發(fā)展至今,訓(xùn)練數(shù)據(jù)的重要性已經(jīng)是我們老生常談的問(wèn)題。在重聲訓(xùn)練數(shù)據(jù)為什么重要之前,我們先重新回顧下AI技術(shù)大爆炸的三大初始概念:機(jī)器學(xué)習(xí)是什么?人工智能是什么?訓(xùn)練數(shù)據(jù)又是什么? 簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)包含人工智能,人工智能屬于機(jī)器學(xué)習(xí)的

    2024年02月13日
    瀏覽(22)
  • 【機(jī)器學(xué)習(xí)1】什么是機(jī)器學(xué)習(xí)&機(jī)器學(xué)習(xí)的重要性

    【機(jī)器學(xué)習(xí)1】什么是機(jī)器學(xué)習(xí)&機(jī)器學(xué)習(xí)的重要性

    什么是機(jī)器學(xué)習(xí)? 簡(jiǎn)而言之,機(jī)器學(xué)習(xí)就是訓(xùn)練機(jī)器去學(xué)習(xí)。 機(jī)器學(xué)習(xí)作為人工智能(Artificial Intelligence,AI)的一個(gè)分支,以其最基本的形式來(lái)使用算法通過(guò)從數(shù)據(jù)中獲取知識(shí)來(lái)進(jìn)行預(yù)測(cè)。 不同于人類通過(guò)分析大量數(shù)據(jù)手動(dòng)推導(dǎo)規(guī)則和模型,機(jī)器學(xué)習(xí)提供了一種更有效的方法來(lái)

    2024年02月13日
    瀏覽(27)
  • 【Python機(jī)器學(xué)習(xí)】決策樹——樹的特征重要性

    【Python機(jī)器學(xué)習(xí)】決策樹——樹的特征重要性

    利用一些有用的屬性來(lái)總結(jié)樹的工作原理,其中最常用的事特征重要性,它為每個(gè)特征樹的決策的重要性進(jìn)行排序。對(duì)于每個(gè)特征來(lái)說(shuō),它都是介于0到1之間的數(shù)字,其中0代表“根本沒(méi)有用到”,1代表“完美預(yù)測(cè)目標(biāo)值”。特征重要性的求和為1。 將特征重要性進(jìn)行可視化:

    2024年02月03日
    瀏覽(25)
  • 機(jī)器人控制系統(tǒng)學(xué)習(xí)和研究中數(shù)學(xué)的重要性

    機(jī)器人控制系統(tǒng)學(xué)習(xí)和研究中數(shù)學(xué)的重要性

    其實(shí)具備科學(xué)思維的方式非常非常難,很多情況下腦海中并非客觀事實(shí),而是充滿了幻覺(jué)。 ? ? 如果在各種AI工具中問(wèn)及這樣的問(wèn)題,會(huì)得到類似如下回復(fù): 機(jī)器人控制系統(tǒng)學(xué)習(xí)和研究中數(shù)學(xué)的重要性主要體現(xiàn)在以下幾個(gè)方面: 機(jī)器人運(yùn)動(dòng)學(xué):機(jī)器人控制系統(tǒng)需要處理機(jī)器

    2024年02月05日
    瀏覽(33)
  • [論文閱讀] (29)李沐老師視頻學(xué)習(xí)——2.研究的藝術(shù)·找問(wèn)題和明白問(wèn)題的重要性

    [論文閱讀] (29)李沐老師視頻學(xué)習(xí)——2.研究的藝術(shù)·找問(wèn)題和明白問(wèn)題的重要性

    《娜璋帶你讀論文》系列主要是督促自己閱讀優(yōu)秀論文及聽(tīng)取學(xué)術(shù)講座,并分享給大家,希望您喜歡。由于作者的英文水平和學(xué)術(shù)能力不高,需要不斷提升,所以還請(qǐng)大家批評(píng)指正,非常歡迎大家給我留言評(píng)論,學(xué)術(shù)路上期待與您前行,加油。 前一篇帶來(lái)李沐老師對(duì)論文寫作

    2024年02月01日
    瀏覽(22)
  • 【Python | 機(jī)器學(xué)習(xí)】Python中進(jìn)行特征重要性分析的9個(gè)常用方法(含源代碼)

    【Python | 機(jī)器學(xué)習(xí)】Python中進(jìn)行特征重要性分析的9個(gè)常用方法(含源代碼)

    特征重要性分析用于了解每個(gè)特征(變量或輸入)對(duì)于做出預(yù)測(cè)的有用性或價(jià)值。目標(biāo)是確定對(duì)模型輸出影響最大的最重要的特征,它是機(jī)器學(xué)習(xí)中經(jīng)常使用的一種方法。 特征重要性分析在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)中扮演著重要的角色,具有以下重要性: 理解數(shù)據(jù):特征重要性分析

    2024年02月03日
    瀏覽(19)
  • 性能優(yōu)化的重要性

    性能優(yōu)化的重要性

    博主 默語(yǔ)帶您 Go to New World. ? 個(gè)人主頁(yè)—— 默語(yǔ) 的博客???? 《java 面試題大全》 ??惟余輩才疏學(xué)淺,臨摹之作或有不妥之處,還請(qǐng)讀者海涵指正。??? 《MYSQL從入門到精通》數(shù)據(jù)庫(kù)是開發(fā)者必會(huì)基礎(chǔ)之一~ ?? 吾期望此文有資助于爾,即使粗淺難及深廣,亦備添少許微薄

    2024年02月12日
    瀏覽(97)
  • 分布式操作系統(tǒng)的必要性及重要性

    總有人在各個(gè)平臺(tái)留言或者私信問(wèn)LAXCUS分布式操作系統(tǒng)的各種問(wèn)題,尤其是關(guān)于分布式操作系統(tǒng)的應(yīng)用市場(chǎng)、價(jià)值、意義之類的問(wèn)題。我們團(tuán)隊(duì)做LAXCUS分布式操作系統(tǒng),也不是頭腦憑空發(fā)熱,是基于我們之前的大量產(chǎn)品設(shè)計(jì)、經(jīng)驗(yàn)逐漸一步步做起來(lái)。當(dāng)今已經(jīng)進(jìn)入智能時(shí)代,

    2024年02月08日
    瀏覽(23)
  • 網(wǎng)絡(luò)安全的重要性

    網(wǎng)絡(luò)安全是指網(wǎng)絡(luò)系統(tǒng)的硬件、軟件及其系統(tǒng)中的數(shù)據(jù)受到保護(hù),不受偶然的或者惡意的原因而遭到破壞、更改、泄露,系統(tǒng)連續(xù)可靠正常地運(yùn)行,網(wǎng)絡(luò)服務(wù)不中斷。 網(wǎng)絡(luò)安全從其本質(zhì)上來(lái)講就是網(wǎng)絡(luò)上的信息安全。 從廣義來(lái)說(shuō),凡是涉及到網(wǎng)絡(luò)上信息的保密性、完整性、

    2024年02月06日
    瀏覽(21)
  • 未來(lái),運(yùn)營(yíng)的重要性大于產(chǎn)品?

    微博上看到某產(chǎn)品大 V 的一個(gè)觀點(diǎn),說(shuō)在未來(lái),產(chǎn)品運(yùn)營(yíng)的重要性會(huì)大過(guò)產(chǎn)品經(jīng)理,還挺認(rèn)同的,談?wù)勎业南敕ā?這個(gè)觀點(diǎn)的核心依據(jù)是,目前沒(méi)有新的產(chǎn)品形態(tài),各種產(chǎn)品解決方案都是標(biāo)準(zhǔn)化的,產(chǎn)品由開疆辟土變成了運(yùn)營(yíng)的支撐部門。 所謂產(chǎn)品形態(tài),根據(jù)我的理解,就

    2024年02月13日
    瀏覽(20)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包