正態(tài)分布
正態(tài)分布,最早由棣莫弗在二項(xiàng)分布的漸近公式中得到,而真正奠定其地位的,應(yīng)是高斯對(duì)測(cè)量誤差的研究,故而又稱Gauss分布。測(cè)量是人類定量認(rèn)識(shí)自然界的基礎(chǔ),測(cè)量誤差的普遍性,使得正態(tài)分布擁有廣泛的應(yīng)用場(chǎng)景,或許正因如此,正太分布在分布族譜圖中居于核心的位置。
正態(tài)分布 N ( μ , σ ) N(\mu, \sigma) N(μ,σ)受到期望 μ \mu μ和方差 σ 2 \sigma^2 σ2的調(diào)控,其概率密度函數(shù)為
1 2 π σ 2 exp ? [ ? ( x ? μ ) 2 2 σ 2 ] \frac{1}{\sqrt{2\pi\sigma^2}}\exp[-\frac{(x-\mu)^2}{2\sigma^2}] 2πσ2?1?exp[?2σ2(x?μ)2?]
當(dāng) μ = 0 \mu=0 μ=0而 σ = 1 \sigma=1 σ=1時(shí),為標(biāo)準(zhǔn)正態(tài)分布 N ( 0 , 1 ) N(0,1) N(0,1),對(duì)應(yīng)概率分布函數(shù)為 Φ ( x ) = 1 2 π exp ? [ ? x 2 2 ] \Phi(x)=\frac{1}{\sqrt{2\pi}}\exp[-\frac{x^2}{2}] Φ(x)=2π?1?exp[?2x2?],形狀如下,
在scipy.stats
中,分別封裝了正態(tài)分布類norm
和標(biāo)準(zhǔn)正態(tài)分布類halfnorm
。
二項(xiàng)分布
二項(xiàng)分布是非常簡(jiǎn)單而又基礎(chǔ)的一種離散分布,貌似是高中學(xué)到的第一個(gè)分布,就算不是第一個(gè),也是第一批。在 N N N次獨(dú)立重復(fù)的伯努利試驗(yàn)中,設(shè)A在每次實(shí)驗(yàn)中發(fā)生的概率均為 p p p。則 N N N次試驗(yàn)后A發(fā)生 k k k次的概率分布,就是二項(xiàng)分布,記作 X ~ B ( n , p ) X\sim B(n,p) X~B(n,p),則
P { X = k } = ( n k ) p k ( 1 ? p ) n ? k P\{X=k\}=\binom{n}{k}p^k(1-p)^{n-k} P{X=k}=(kn?)pk(1?p)n?k
其中 ( n k ) = n ! k ! ( n ? k ) ! \binom{n}{k}=\frac{n!}{k!(n-k)!} (kn?)=k!(n?k)!n!?,高中的寫法一般是 C n k C^k_n Cnk?。
記 q = 1 ? p q=1-p q=1?p,令 x k = k ? n p n p q x_k=\frac{k-np}{\sqrt{npq}} xk?=npq?k?np?,當(dāng) n n n趨近于無(wú)窮大時(shí),根據(jù)De Moivre–Laplace定理,有
lim ? n → ∞ n ! k ! ( n ? k ) ! p k q n ? k ≈ 1 2 π n p q e ( k ? n p ) 2 2 n p q \lim_{n\to\infty}\frac{n!}{k!(n-k)!}p^kq^{n-k}\approx\frac{1}{\sqrt{2\pi npq}}e^{\frac{(k-np)^2}{2npq}} n→∞lim?k!(n?k)!n!?pkqn?k≈2πnpq?1?e2npq(k?np)2?
即服從 σ 2 = n p q , μ = n p \sigma^2=npq, \mu=np σ2=npq,μ=np的高斯分布。
驗(yàn)證
下面通過(guò)scipy.stats
對(duì)二項(xiàng)分布和高斯分布之間的關(guān)聯(lián)進(jìn)行驗(yàn)證
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as ss
p,q = 0.2, 0.8
ns = [10, 100, 1000, 10000]
fig = plt.figure()
for i,n in enumerate(ns):
rs = ss.binom(n, p).rvs(50000)
rv = ss.norm(n*p, np.sqrt(n*p*q))
st, ed = rv.interval(0.999)
xs = np.linspace(st, ed, 100)
ys = rv.pdf(xs)
ax = fig.add_subplot(2,2,i+1)
ax.hist(rs, density=True, bins='auto', alpha=0.2)
ax.plot(xs, ys)
plt.title(f"n={n}")
plt.show()
效果如下,可見(jiàn)隨著 n n n越來(lái)越大,二項(xiàng)分布的隨機(jī)數(shù)越來(lái)越靠近正態(tài)分布的概率密度曲線文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-451903.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-451903.html
到了這里,關(guān)于【分布族譜】正態(tài)分布和二項(xiàng)分布的關(guān)系的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!