国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

概率密度函數(shù)曲線及繪制

這篇具有很好參考價(jià)值的文章主要介紹了概率密度函數(shù)曲線及繪制。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

前言

很多數(shù)據(jù)科學(xué)家在做回歸模型評(píng)估的時(shí)候,不僅會(huì)去計(jì)算模型擬合優(yōu)度R2,平均絕對(duì)誤差還會(huì)去看測(cè)試集的每個(gè)樣本偏差的分布情況,這個(gè)時(shí)候就需要用到概率密度函數(shù)曲線的知識(shí)了,通過(guò)繪制概率密度函數(shù)曲線圖或者直方圖可以很直觀的看到測(cè)試集的所有樣本的偏差分布情況。

概率密度函數(shù)曲線

我們知道概率是用來(lái)度量一件事物發(fā)生可能性大小,以拋色子為例,一枚色子是一個(gè)正六面體,一共6個(gè)面,分別標(biāo)有1~6,隨手一拋,求出現(xiàn)點(diǎn)數(shù)5朝上的可能性是多少?因?yàn)闃颖究臻g數(shù)是6,對(duì)點(diǎn)數(shù)5朝上的有利事件數(shù)是1(點(diǎn)數(shù)5朝上),因此,出現(xiàn)點(diǎn)數(shù)5朝上的概率都是1/6,這是古典概率論的描述,列出其概率分步表如下

點(diǎn)數(shù) 1 2 3 4 5 6
概率 1/6 1/6 1/6 1/6 1/6 1/6

畫出其概率分布圖如下
概率密度函數(shù)曲線及繪制

對(duì)于有限離散的樣本空間,我們可以列出概率分布表畫出概率分布圖,如果,某事件可能取值是某個(gè)連續(xù)的區(qū)間 [ a , b ] [a,b] [a,b],也有其對(duì)應(yīng)的概率值,這種對(duì)應(yīng)關(guān)系稱為連續(xù)型概率函數(shù),記作

p = f ( x ) , x ∈ [ a , b ] p = f(x), x\in[a,b] p=f(x),x[a,b]

其中,p表示自變量取x附近一小段的概率,對(duì)應(yīng)的概率分布函數(shù)圖像可以用一條連續(xù)的曲線來(lái)刻畫
概率密度函數(shù)曲線及繪制
其中,橫坐標(biāo)表示自變量x取值范圍,從a到b,可以是a,b中間某一點(diǎn)或某一小段或幾個(gè)小段的并等,縱坐標(biāo)表示因變量f(x)取值大小,可以得到

∫ a a f ( x ) d x = 1 \int_{a}^{a} f(x) dx = 1 aa?f(x)dx=1

這樣,概率函數(shù)可以定義為連續(xù)型隨機(jī)變量(X)在某個(gè)確定的取值點(diǎn)附近的可能性的函數(shù),可以類比一個(gè)質(zhì)地不均勻的橡皮泥橫梗在a,b之間,如果要求這塊橡皮泥的質(zhì)量,那么就要知道從a到b的各處的密度大小,所以概率函數(shù)也叫概率密度函數(shù)。

幾類經(jīng)典的概率密度函數(shù)

  • 正態(tài)分布

正態(tài)分布是最常見的一種的概率分布,也稱為也稱為高斯分布,它刻畫了隨機(jī)變量(X)服從一個(gè)位置參數(shù)為 μ \mu μ 、尺度參數(shù)為 σ \sigma σ的概率分布,其概率密度函數(shù)為

f ( x ) = 1 2 π σ e ? ( x ? μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt {2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2π ?σ1?e?2σ2(x?μ)2?

如果隨機(jī)變量(X)服從一個(gè)數(shù)學(xué)期望為 μ \mu μ,方差為 σ 2 \sigma^2 σ2的正態(tài)分布,記作 X ~ N ( μ , σ 2 ) X\sim N(\mu, \sigma^2) XN(μ,σ2),特別的,當(dāng) μ = 0 , σ 2 = 1 \mu =0, \sigma^2 = 1 μ=0,σ2=1時(shí),稱為標(biāo)準(zhǔn)正態(tài)分布。

  • 泊松分布

泊松分布是一種常見的離散型概率分布,刻畫了單位時(shí)間內(nèi)隨機(jī)事件發(fā)生的次數(shù),其概率密度函數(shù)為
P ( X = k ) = λ k k ! e ? λ , k = 0 , 1 , 2 , ? P(X = k) = \frac{\lambda^k}{k!}e^{-\lambda}, k = 0, 1, 2,\cdots P(X=k)=k!λk?e?λ,k=0,1,2,?

  • 伯努利分布

伯努利分布常用來(lái)刻畫0-1概率分布,如果隨機(jī)變量(X)僅有兩個(gè)可能的結(jié)果0和1,此時(shí)隨機(jī)變量(X)取0和1兩個(gè)值,相應(yīng)的概率密度函數(shù)為
p = { p , X = 1 1 ? p , X = 0 p = \begin{cases} p, \quad X= 1\\ \\ 1-p,\quad X=0 \end{cases} p=??????p,X=11?p,X=0?

兩種繪制密度曲線的方法

某數(shù)據(jù)科學(xué)家通過(guò)算法模型獲得一組預(yù)測(cè)值,其想要評(píng)估預(yù)測(cè)值與實(shí)際值之間偏差分布情況,可以繪制出偏差的概率分布函數(shù)曲線圖或者直方圖,觀測(cè)這些偏差分布情況,這里給出兩種繪制概率密度曲線的方法

  • matplotlib

matplotlib是python比較原生的繪圖模塊,適合平時(shí)使用習(xí)慣,功能強(qiáng)大用法友善,出場(chǎng)率高。

def density(column_1, column_2): #密度函數(shù)
    diff = abs(column_1 - column_2)  #差異率
    plt.figure(figsize = (6, 4)) #新建畫布
    diff.plot(kind ='kde', label = u'觀測(cè)值') #label = str(lower) +'~'+ str(upper)
    plt.grid(alpha = 0.5) #添加網(wǎng)格線
    plt.xlabel("偏差")
    plt.ylabel("密度值")
    plt.legend()
    plt.title("偏差密度分布圖")
    plt.show()

預(yù)覽效果

概率密度函數(shù)曲線及繪制
matplotlib繪制概率密度函數(shù)曲線主要調(diào)用了**kind =‘kde’**的參數(shù),這是一種密度圖(Kernel Density Estimate,核密度估計(jì)),它是通過(guò)模擬計(jì)算“可能會(huì)產(chǎn)生觀測(cè)數(shù)據(jù)的連續(xù)情況概率分布的估計(jì)”而產(chǎn)生的,因此在調(diào)用plot時(shí)加上kind='kde’即可生成一張密度圖,也就是我們看到的概率密度函數(shù)曲線圖。

  • seaborn

seaborn也是python中的一個(gè)常用的可視化模塊,是對(duì)matplotlib進(jìn)行二次封裝而成,所以有些方面要比matplotlib更簡(jiǎn)單更友好

def density(column_1, column_2): #密度函數(shù)
    diff = abs(column_1 - column_2)  #差異率
    plt.figure(figsize = (6, 4)) #新建畫布
    sb.kdeplot(diff, label = 'density') #密度曲線
    plt.grid(alpha = 0.5) #添加網(wǎng)格線
    plt.xlabel("偏差")
    plt.ylabel("密度值")
    plt.legend()
    plt.title("偏差概率密度曲線")
    plt.show()

預(yù)覽效果

概率密度函數(shù)曲線及繪制

seaborn就進(jìn)一步把這個(gè)觀測(cè)值連續(xù)模擬過(guò)程封裝成了kdeplot函數(shù),直接調(diào)用即可,但從兩者的概率函數(shù)曲線來(lái)看,matplotlib更具有對(duì)稱性,seaborn細(xì)節(jié)更豐富,我們可以從seaborn的密度函數(shù)曲線看到實(shí)際值的數(shù)量級(jí)和預(yù)測(cè)值的數(shù)量級(jí)大致在10000左右,偏差有大有小,但主要集中在-500到2000之間。

參考文獻(xiàn)

1,https://baike.baidu.com/item/概率密度函數(shù)/5021996?fr=aladdin
2,https://zhuanlan.zhihu.com/p/48140593
3,https://www.zhihu.com/question/263467674
4,http://t.zoukankan.com/Renyi-Fan-p-13282258.html
5,https://blog.csdn.net/helloworld0906/article/details/103214392文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-420367.html

到了這里,關(guān)于概率密度函數(shù)曲線及繪制的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包