1.切比雪夫不等式
切比雪夫不等式可以對隨機變量偏離期望值的概率做出估計,這是大數(shù)定律的推理基礎(chǔ)。以下介紹一個對切比雪夫不等式的直觀證明。
1.1 示性函數(shù)
對于隨機事件A,我們引入一個示性函數(shù) I A = { 1 , A發(fā)生 0 , A不發(fā)生 I_A=\begin{cases} 1&,\text{A發(fā)生} \\ 0&,\text{A不發(fā)生} \end{cases} IA?={10?,A發(fā)生,A不發(fā)生?,即一次實驗中,若 A A A發(fā)生了,則 I I I的值為1,否則為0。
現(xiàn)在思考一個問題:這個函數(shù)的自變量是什么?
我們知道,隨機事件在做一次試驗后有一個確定的觀察結(jié)果,稱這個觀察結(jié)果為樣本點 ω \omega ω,所有可能的樣本點的集合稱為樣本空間$\Omega =\left { \omega \right } ,稱 ,稱 ,稱\Omega 的一個子集 的一個子集 的一個子集A$為隨機事件。
例如,擲一個六面骰子,記得到數(shù)字 k k k的樣本點為 ω k \omega_k ωk?,則 Ω = { ω 1 , ω 2 , ω 3 , ω 4 , ω 5 , ω 6 } \Omega = \{\omega_1,\omega_2,\omega_3,\omega_4,\omega_5,\omega_6\} Ω={ω1?,ω2?,ω3?,ω4?,ω5?,ω6?},隨機事件“得到的數(shù)字為偶數(shù)”為 A = { ω 2 , ω 4 , ω 6 } A = \{\omega_2,\omega_4,\omega_6\} A={ω2?,ω4?,ω6?}。
由此可知,示性函數(shù)是關(guān)于樣本點的函數(shù),即
I
A
(
ω
)
=
{
1
,
ω
∈
A
0
,
ω
?
A
(試驗后)
I_A(\omega)=\begin{cases} 1&,\omega \in A \\ 0&,\omega \notin A \end{cases} \text {(試驗后)}
IA?(ω)={10?,ω∈A,ω∈/A?(試驗后)
在試驗之前,我們能獲得哪個樣本點也是未知的,因此樣本點也是個隨機事件,記為
ξ
\xi
ξ,相應(yīng)的示性函數(shù)可以記為
I
A
=
{
1
,
ξ
∈
A
0
,
ξ
?
A
(試驗前)
I_A=\begin{cases} 1&,\xi \in A \\ 0&,\xi \notin A \end{cases} \text {(試驗前)}
IA?={10?,ξ∈A,ξ∈/A?(試驗前)
在試驗之前, I I I的值也是未知的,因此 I I I是個二值隨機變量。這樣,我們就建立了隨機事件 A A A和隨機變量 I I I之間的一一對應(yīng)關(guān)系。
對
I
I
I求數(shù)學期望可得
E
I
A
=
1
×
P
(
ξ
∈
A
)
+
0
×
P
(
ξ
?
A
)
=
P
(
ξ
∈
A
)
\mathbb{E}I_A=1 \times P(\xi \in A) + 0 \times P(\xi \notin A)=P(\xi \in A)
EIA?=1×P(ξ∈A)+0×P(ξ∈/A)=P(ξ∈A)
P
(
ξ
∈
A
)
P(\xi \in A)
P(ξ∈A)是什么?是樣本點落在
A
A
A里面的概率,也就是
A
A
A事件發(fā)生的概率
P
(
A
)
P(A)
P(A),由此我們就得到了示性函數(shù)很重要的性質(zhì):其期望值正是對應(yīng)的隨機事件的概率,即
E
I
A
=
P
(
A
)
\mathbb{E}I_A=P(A)
EIA?=P(A)
1.2 馬爾科夫不等式
對于非負的隨機變量
X
X
X和定值
a
a
a,考慮隨機事件
A
=
{
X
≥
a
}
A=\{X \ge a\}
A={X≥a},我們可以畫出示性函數(shù)
I
A
I_A
IA?關(guān)于觀察值
x
x
x的圖像,如圖所示:
容易發(fā)現(xiàn)
I
X
≥
a
(
x
)
≤
x
a
I_{X \ge a}(x) \le \frac{x}{a}
IX≥a?(x)≤ax?恒成立。把
x
x
x換為隨機變量
X
X
X,再對該式取數(shù)學期望得
E
I
X
≥
a
=
P
(
X
≥
a
)
≤
E
X
a
\mathbb{E}I_{X \ge a}=P(X \ge a) \le \frac{\mathbb{E}X}{a}
EIX≥a?=P(X≥a)≤aEX?
稱該不等式為馬爾科夫Markov不等式,
從理解上說,如果非負隨機變量 X X X的期望存在,則 X X X超過某個定值 a a a的概率不超過 E a \frac{\mathbb{E}}{a} aE?。舉個簡單的例子:如果我們知道所有人收入的平均數(shù) a a a,那么隨機抽一個人收入超過 10 a 10a 10a的概率不超過 10 % 10\% 10%。
根據(jù)圖中兩個函數(shù)的差距,我們大致能理解這個不等式對概率的估計時比較粗超的。
1.3 切比雪夫不等式
對于隨機變量
X
X
X,記
μ
=
E
X
\mu = \mathbb{E}X
μ=EX,考慮隨機事件
A
=
{
∣
X
?
μ
∣
≥
a
}
A=\{|X-\mu|\ge a\}
A={∣X?μ∣≥a},其示性函數(shù)的圖像如圖所示:
易知
I
∣
X
?
μ
∣
≥
a
≤
(
x
?
μ
)
2
a
2
I_{|X-\mu|\ge a}\le \frac{{(x-\mu)}^2}{a^2}
I∣X?μ∣≥a?≤a2(x?μ)2?恒成立。將該式
x
x
x換成
X
X
X并取數(shù)學期望得
E
I
∣
X
?
μ
∣
≥
a
=
P
(
∣
X
?
μ
∣
≥
a
)
≤
D
X
a
2
\mathbb{E}I_{|X-\mu|\ge a}=P(|X-\mu|\ge a)\le \frac{\mathbb{D}X}{a^2}
EI∣X?μ∣≥a?=P(∣X?μ∣≥a)≤a2DX?
稱上面這個不等式為切比雪夫Chebyshev不等式。
從理解上來說,如果隨機變量 X X X的期望和方差存在,則 X X X和期望值的距離大于 a a a的概率不超過 D X a 2 \frac{\mathbb{D}X}{a^2} a2DX?,給定的范圍越大( a a a越大),或 X X X的方差越小,則偏離的概率越小,這和直覺是相符的。
同樣的,切比雪夫不等式對概率的估計也比較粗糙。
2. 大數(shù)定律
對于一系列隨機變量 { X n } \{X_n\} {Xn?},設(shè)每個隨機變量都有期望。由于隨機變量之和 ∑ i = 1 n X i \sum_{i=1}^{n}X_i ∑i=1n?Xi?很有可能發(fā)散到無窮大,我們轉(zhuǎn)而考慮隨機變量的均值 X ˉ n = 1 n ∑ i = 1 n X i {\bar{X}_n}=\frac{1}{n}\sum_{i=1}^{n}X_i Xˉn?=n1?∑i=1n?Xi?和其期望 E ( X ˉ n ) \mathbb{E}({\bar{X}_n}) E(Xˉn?)之間的距離。若 { X n } \{X_n\} {Xn?}滿足一定條件,當 n n n足夠大時,這個距離會以非常大的概率接近0,這就是大數(shù)定律的主要思想。
定義:
任取
ε
>
0
\varepsilon >0
ε>0,若恒有
lim
?
n
→
∞
P
(
∣
X
ˉ
n
?
E
X
ˉ
n
∣
<
ε
)
=
1
\lim_{n \to \infty} P(\left | \bar{X}_n-\mathbb{E}\bar{X}_n \right | < \varepsilon )=1
limn→∞?P(
?Xˉn??EXˉn?
?<ε)=1,稱
{
X
n
}
\{X_n\}
{Xn?}服從(弱)大數(shù)定律,稱
X
ˉ
n
\bar{X}_n
Xˉn?依概率收斂于
E
(
X
ˉ
n
)
\mathbb{E}({\bar{X}_n})
E(Xˉn?),記作
X
ˉ
n
?
P
E
(
X
ˉ
n
)
\bar{X}_n\overset{P}{\longrightarrow} \mathbb{E}({\bar{X}_n})
Xˉn??P?E(Xˉn?)
2.1 馬爾可夫大數(shù)定律
任取
ε
>
0
\varepsilon >0
ε>0,由切比雪夫不等式可知
P
(
∣
X
ˉ
n
?
E
X
ˉ
n
∣
<
ε
)
≥
1
?
D
(
X
ˉ
n
)
ε
2
P(\left | \bar{X}_n-\mathbb{E}\bar{X}_n \right | < \varepsilon )\ge 1-\frac{\mathbb{D}({\bar{X}_n})}{{\varepsilon}^2}
P(
?Xˉn??EXˉn?
?<ε)≥1?ε2D(Xˉn?)?
=
1
?
1
ε
2
n
2
D
(
∑
i
=
1
n
X
i
)
=1-\frac{1}{{\varepsilon}^2n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)
=1?ε2n21?D(i=1∑n?Xi?)
由此得到馬爾可夫大數(shù)定律:
如果
lim
?
n
→
∞
1
n
2
D
(
∑
i
=
1
n
X
i
)
=
0
\lim_{n \to \infty}\frac{1}{n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)=0
limn→∞?n21?D(∑i=1n?Xi?)=0,則
{
X
n
}
\{X_n\}
{Xn?}服從大數(shù)定律。
2.2 切比雪夫大數(shù)定律
在馬爾可夫大數(shù)定律的基礎(chǔ)上,如果
{
X
n
}
\{X_n\}
{Xn?}兩兩不相關(guān),則方差可以拆開:
1
n
2
D
(
∑
i
=
1
n
X
i
)
=
1
n
2
∑
i
=
1
n
D
X
i
\frac{1}{n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)=\frac{1}{n^2}\sum_{i=1}^{n}\mathbb{D}X_i
n21?D(i=1∑n?Xi?)=n21?i=1∑n?DXi?
如果
D
X
i
\mathbb{D}X_i
DXi?有共同的上界c,則
1
n
2
D
(
∑
i
=
1
n
X
i
)
≤
n
c
n
2
=
c
n
\frac{1}{n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)\le \frac{nc}{n^2}=\frac{c}{n}
n21?D(i=1∑n?Xi?)≤n2nc?=nc?
P
(
∣
X
ˉ
n
?
E
X
ˉ
n
∣
<
ε
)
≥
1
?
c
ε
2
n
P(\left | \bar{X}_n-\mathbb{E}\bar{X}_n \right | < \varepsilon )\ge 1-\frac{c}{{\varepsilon}^2n}
P(
?Xˉn??EXˉn?
?<ε)≥1?ε2nc?
由此得到切比雪夫大數(shù)定律:
如果
{
X
n
}
\{X_n\}
{Xn?}兩兩不相關(guān),且方差有共同的上界,則
{
X
n
}
\{X_n\}
{Xn?}兩兩不相關(guān)服從大數(shù)定律。
3. 中心極限定理
大數(shù)定律研究的是一系列隨機變量 { X n } \{X_n\} {Xn?}的均值 X ˉ n = 1 n ∑ i = 1 n X i {\bar{X}_n}=\frac{1}{n}\sum_{i=1}^{n}X_i Xˉn?=n1?∑i=1n?Xi?是否會依概率收斂于其期望 E ( X ˉ n ) \mathbb{E}({\bar{X}_n}) E(Xˉn?)這個數(shù)值,而中心極限定理進一步研究 X ˉ n {\bar{X}_n} Xˉn?服從什么分布。若 { X n } \{X_n\} {Xn?}滿足一定的條件,當 n n n足夠大時, X ˉ n {\bar{X}_n} Xˉn?服從正態(tài)分布,這就是中心極限定理的主要思想,這也體現(xiàn)了正態(tài)分布的重要性和普遍性。文章來源:http://www.zghlxwxcb.cn/news/detail-767243.html
3.1 獨立同分布中心極限定理(林德貝格-勒維)
如果
{
X
n
}
\{X_n\}
{Xn?}獨立同分布,且
E
X
=
μ
\mathbb{E}X=\mu
EX=μ,
D
X
=
σ
2
>
0
\mathbb{D}X={\sigma}^2>0
DX=σ2>0,則
n
n
n足夠大時
X
ˉ
n
{\bar{X}_n}
Xˉn?近似服從正態(tài)分布
N
(
μ
,
σ
2
n
)
N(\mu, \frac{{\sigma}^2}{n})
N(μ,nσ2?),即
lim
?
x
→
∞
P
(
X
ˉ
n
?
μ
σ
/
n
<
a
)
=
Φ
(
a
)
=
∫
?
∞
a
1
2
π
e
?
t
2
/
2
d
t
\lim_{x \to \infty} P(\frac{{\bar X}_n-\mu}{\sigma / \sqrt{n}}<a)=\Phi (a)=\int_{-\infty}^{a}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt
x→∞lim?P(σ/n?Xˉn??μ?<a)=Φ(a)=∫?∞a?2π?1?e?t2/2dt文章來源地址http://www.zghlxwxcb.cn/news/detail-767243.html
到了這里,關(guān)于大數(shù)定律&中心極限定理的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!