正態(tài)分布的概率密度函數(shù)(Probability Density Function,簡稱PDF)的函數(shù)取值是指在給定的正態(tài)分布參數(shù)(均值 μ 和標(biāo)準(zhǔn)差 σ)下,對于特定的隨機(jī)變量取值 x,計算得到的概率密度值 f(x)。這個值表示了在正態(tài)分布下,隨機(jī)變量取值為 x 的概率密度。
具體地,正態(tài)分布的概率密度函數(shù)取值計算公式如下:
這個概率密度函數(shù)描述了隨機(jī)變量 x 取不同值時的概率密度分布,換句話說,f(x) 表示了隨機(jī)變量 X 在 x 處的相對概率。。正態(tài)分布的曲線呈鐘形,以均值 μ 為中心,標(biāo)準(zhǔn)差 σ 決定了曲線的寬度。數(shù)據(jù)點離均值越遠(yuǎn),概率密度越低。
概率密度與概率:概率密度函數(shù)給出了不同取值處的概率密度,但對于連續(xù)型隨機(jī)變量來說,單個點的概率密度為零。概率是在一個區(qū)間內(nèi)的概率密度的累積,而不是單個點的概率。
正態(tài)分布的概率密度函數(shù)的概率密度值不是直接的概率,而是描述了隨機(jī)變量在不同取值處相對概率密度的分布。要計算具體的概率,你需要使用積分來計算區(qū)間內(nèi)的概率。
正態(tài)分布的概率密度函數(shù) f(x) 是一個數(shù)學(xué)函數(shù),用于描述在正態(tài)分布中隨機(jī)變量 X 取某個特定值 x 的概率密度。簡單來說,它表示了在給定正態(tài)分布的均值(μ)和標(biāo)準(zhǔn)差(σ)下,隨機(jī)變量 X 等于某個具體值 x 的相對可能性。
具體來說,f(x) 可以解釋為以下兩個要點:
相對可能性:f(x) 不是直接的概率值,而是概率密度。它告訴你在正態(tài)分布下,隨機(jī)變量 X 取某個特定值 x 的相對可能性。如果在某個 x 處的 f(x) 較高,表示該值在正態(tài)分布中出現(xiàn)的可能性較大。
曲線下的面積:正態(tài)分布的概率密度函數(shù)圖形呈鐘形曲線。通過對曲線下的面積進(jìn)行積分,你可以得到隨機(jī)變量 X 落在某個值或值的范圍內(nèi)的概率。這意味著如果你想知道 X 落在某個區(qū)間內(nèi)的概率,你可以通過積分 f(x) 來計算。
總結(jié)一下,概率密度函數(shù) f(x) 是一個函數(shù),它用于描述正態(tài)分布中各個可能取值的相對可能性。它是概率密度的一種表示方式,而不是直接的概率值。通過對 f(x) 進(jìn)行積分,你可以計算出在正態(tài)分布中隨機(jī)變量 X 落在某個值或值的范圍內(nèi)的概率。
?概率密度函數(shù)(Probability Density Function,PDF)描述了連續(xù)型隨機(jī)變量在不同取值處的相對概率密度。這意味著 PDF 反映了隨機(jī)變量在不同取值處出現(xiàn)的相對頻率或密度,而不是直接的概率。
下面是關(guān)于 PDF 下不同取值的一些重要概念:
概率密度值:PDF 的值 f(x)?表示了在隨機(jī)變量取到特定值 x附近的相對概率密度。具體來說,f(x)表示了在 x處的單位概率密度,即在無限小的區(qū)間內(nèi)的相對概率密度。
取值范圍:PDF 描述了隨機(jī)變量的所有可能取值范圍內(nèi)的概率密度分布。這個范圍通常是連續(xù)的,因此在每個具體的取值處的概率密度值是無限小的。
曲線形狀:PDF 的圖形通常是一條曲線,它的形狀由隨機(jī)變量的分布特性決定。例如,正態(tài)分布的 PDF 是鐘形曲線,峰值位于均值處,表示在均值附近的取值具有較高的相對概率密度。
概率計算:要計算隨機(jī)變量落在某個區(qū)間 [a, b]$內(nèi)的概率,你可以使用積分來計算。
概率比較:通過比較 PDF 在不同取值處的相對概率密度,你可以理解不同取值的相對頻率。較高的概率密度值表示在該處的取值更頻繁,而較低的概率密度值表示在該處的取值較少見。
總之,概率密度函數(shù)下的不同取值處的相對概率密度描述了連續(xù)型隨機(jī)變量的相對頻率或密度分布情況。這允許我們理解隨機(jī)變量在不同取值處出現(xiàn)的相對頻率,但要計算具體的概率,需要使用積分來考慮區(qū)間內(nèi)的概率。
正態(tài)分布的概率密度函數(shù)是一個用于描述數(shù)據(jù)在不同值處的概率密度分布的數(shù)學(xué)方程,它在統(tǒng)計學(xué)和數(shù)據(jù)科學(xué)中非常重要,因為它允許我們量化數(shù)據(jù)點出現(xiàn)在不同位置的可能性。這是正態(tài)分布在各種應(yīng)用中廣泛使用的原因之一。
-----------
正態(tài)分布在統(tǒng)計學(xué)和數(shù)據(jù)分析中的關(guān)鍵作用無法被低估。以下是一些關(guān)于正態(tài)分布在這些領(lǐng)域的重要作用:
-
參數(shù)估計:正態(tài)分布的性質(zhì)使得它在參數(shù)估計中非常有用。通過對數(shù)據(jù)進(jìn)行最大似然估計,可以估計出正態(tài)分布的均值和標(biāo)準(zhǔn)差,從而對數(shù)據(jù)的總體特征有更好的了解。
-
假設(shè)檢驗:許多假設(shè)檢驗方法都基于正態(tài)分布的性質(zhì),例如t-檢驗、F-檢驗等。這些檢驗方法用于比較不同組之間的均值或方差,以確定它們是否顯著不同。
-
統(tǒng)計推斷:正態(tài)分布在統(tǒng)計推斷中扮演著關(guān)鍵角色。通過對正態(tài)分布的參數(shù)進(jìn)行估計和假設(shè)檢驗,可以得出關(guān)于總體的推斷,如置信區(qū)間和假設(shè)的可信度。
-
中心極限定理:中心極限定理表明,大量獨立隨機(jī)變量的均值趨向于服從正態(tài)分布。這一定理使得正態(tài)分布成為在大樣本條件下進(jìn)行統(tǒng)計推斷的基礎(chǔ),因為它解釋了為什么許多現(xiàn)實世界的數(shù)據(jù)在均值附近呈正態(tài)分布。
-
模型擬合:正態(tài)分布通常用于擬合數(shù)據(jù),因為它對許多自然和社會現(xiàn)象的數(shù)據(jù)分布具有較好的擬合性。這對于建立統(tǒng)計模型和預(yù)測未來數(shù)據(jù)點非常重要。
-
可視化:正態(tài)分布的概率密度函數(shù)圖形是一種常用的可視化工具,用于理解數(shù)據(jù)的分布特征。通過繪制正態(tài)分布曲線,可以快速了解數(shù)據(jù)的中心位置和分散度。
-
風(fēng)險管理和金融:在金融領(lǐng)域,正態(tài)分布通常用于建模資產(chǎn)價格的波動性,這對于風(fēng)險管理和投資決策至關(guān)重要。
-
工程和自然科學(xué):正態(tài)分布在工程、物理學(xué)、生物學(xué)等自然科學(xué)領(lǐng)域中廣泛用于建模和分析現(xiàn)象,例如測量誤差、天氣模型等。
總之,正態(tài)分布的數(shù)學(xué)性質(zhì)和應(yīng)用廣泛性使其成為統(tǒng)計學(xué)和數(shù)據(jù)分析中不可或缺的工具。它有助于我們理解和解釋各種自然和社會現(xiàn)象的統(tǒng)計性質(zhì),從而支持科學(xué)研究、決策制定和問題解決。
-------------------
正態(tài)分布的峰度和偏度是描述分布形狀的兩個統(tǒng)計特征:
-
偏度(Skewness):偏度衡量了數(shù)據(jù)分布的偏斜程度。正態(tài)分布的偏度接近于0,表示分布是對稱的,均值位于分布的中心,兩側(cè)的數(shù)據(jù)對稱分布。當(dāng)偏度為正時,數(shù)據(jù)分布右偏(尾部向右延伸),當(dāng)偏度為負(fù)時,數(shù)據(jù)分布左偏(尾部向左延伸)。偏度的絕對值越大,偏斜程度越明顯。
-
峰度(Kurtosis):峰度衡量了數(shù)據(jù)分布的尖銳度或平坦度。正態(tài)分布的峰度接近于3,這是正態(tài)分布的基準(zhǔn)峰度。當(dāng)峰度大于3時,分布被認(rèn)為是具有尖峰形狀(尾部較重),稱為正偏峰度或"過度尖銳"。當(dāng)峰度小于3時,分布被認(rèn)為是具有平坦形狀(尾部較輕),稱為負(fù)偏峰度或"過度平坦"。
綜上所述,正態(tài)分布的偏度接近0,表示對稱分布,而峰度接近3,表示適度的尖峰形狀。這兩個統(tǒng)計量用于描述正態(tài)分布的形狀特征,但對于其他類型的分布,它們的值可能會不同。在實際應(yīng)用中,偏度和峰度可以幫助我們識別數(shù)據(jù)的分布特點,并與正態(tài)分布進(jìn)行比較,以判斷數(shù)據(jù)是否近似符合正態(tài)分布。
-------------------
正態(tài)分布檢驗用于確定給定數(shù)據(jù)集是否符合正態(tài)分布的假設(shè)。在統(tǒng)計學(xué)和數(shù)據(jù)分析中,通常有幾種方法來進(jìn)行正態(tài)分布檢驗,其中一些常見的方法包括:
-
Shapiro-Wilk檢驗:Shapiro-Wilk檢驗是一種廣泛使用的方法,用于檢驗數(shù)據(jù)是否符合正態(tài)分布。它的原假設(shè)是數(shù)據(jù)符合正態(tài)分布。如果p值小于顯著性水平(通常為0.05),則可以拒絕原假設(shè),表示數(shù)據(jù)不符合正態(tài)分布。
-
D'Agostino和Pearson檢驗:這是另一種常見的正態(tài)分布檢驗方法。它基于數(shù)據(jù)的偏度和峰度來判斷數(shù)據(jù)是否符合正態(tài)分布。與Shapiro-Wilk檢驗類似,如果p值小于顯著性水平,可以拒絕正態(tài)分布假設(shè)。
-
Kolmogorov-Smirnov檢驗:這種檢驗方法用于比較給定數(shù)據(jù)與理論正態(tài)分布的擬合情況。它基于累積分布函數(shù)的差異來判斷數(shù)據(jù)是否符合正態(tài)分布。
不同的正態(tài)性檢驗方法在使用上有不同的前提要求和特點。以下是一些常見的正態(tài)性檢驗方法以及它們的主要前提和特點:
Shapiro-Wilk測試:
- 前提要求: 數(shù)據(jù)是連續(xù)型的,并且樣本量通常不宜太?。ㄍǔ=ㄗh樣本量大于5或10)。
- 特點: 這是一種相對較強(qiáng)大的正態(tài)性檢驗方法,適用于各種數(shù)據(jù)集大小。它對非正態(tài)性的敏感性相對較高,可以用于小樣本和大樣本。
Kolmogorov-Smirnov測試:
- 前提要求: 數(shù)據(jù)是連續(xù)型的。對于單樣本檢驗,通常要求樣本量不宜太小,對于雙樣本檢驗,兩個樣本的大小應(yīng)該接近。
- 特點: 這個測試適用于比較數(shù)據(jù)與理論正態(tài)分布的累積分布函數(shù)。它比較靈活,可用于單樣本和兩樣本比較。但對于小樣本數(shù)據(jù),可能不夠敏感。
Anderson-Darling測試:
- 前提要求: 數(shù)據(jù)是連續(xù)型的。通常用于大樣本數(shù)據(jù)。
- 特點: 這個測試是Shapiro-Wilk的擴(kuò)展,對大樣本數(shù)據(jù)效果較好,通常用于更大的樣本量。它提供了一些不同權(quán)重的統(tǒng)計量,可用于不同的分布檢驗。
Q-Q圖(Quantile-Quantile圖):
- 前提要求: 適用于連續(xù)型數(shù)據(jù)。不需要特定的樣本量,但圖形解釋可能需要經(jīng)驗。
- 特點: 這是一種可視化方法,通過直觀比較數(shù)據(jù)的分位數(shù)和理論正態(tài)分布的分位數(shù)來判斷數(shù)據(jù)是否符合正態(tài)分布。它提供了一個快速的初步印象,但不提供具體的p-value。
Lilliefors測試:
- 前提要求: 適用于小樣本數(shù)據(jù),通常用于樣本量較小的情況。
- 特點: 這是Kolmogorov-Smirnov測試的變體,專門用于小樣本數(shù)據(jù)。與標(biāo)準(zhǔn)Kolmogorov-Smirnov測試相比,它對小樣本數(shù)據(jù)更敏感。
每種測試方法都有其適用范圍和局限性,選擇合適的方法取決于您的數(shù)據(jù)特點和研究問題。通常,建議結(jié)合多種方法的結(jié)果來做出最終的判斷。此外,正態(tài)性檢驗通常是統(tǒng)計分析的一個步驟,而不是最終結(jié)論。
這些是一些常見的正態(tài)分布檢驗方法,你可以根據(jù)你的數(shù)據(jù)和需要選擇適合的方法來驗證數(shù)據(jù)是否符合正態(tài)分布。請注意,正態(tài)分布檢驗不一定要求數(shù)據(jù)完全服從正態(tài)分布,而是用于確定數(shù)據(jù)是否與正態(tài)分布具有顯著的偏差。
import scipy.stats as stats
import numpy as np
# 生成模擬數(shù)據(jù),這里使用NumPy生成隨機(jī)正態(tài)分布數(shù)據(jù)
np.random.seed(0) # 設(shè)置隨機(jī)種子以保持一致性
data = np.random.normal(0, 1, 1000) # 均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布數(shù)據(jù),生成1000個數(shù)據(jù)點
# 使用Shapiro-Wilk檢驗
statistic, p_value = stats.shapiro(data)
if p_value > 0.05:
print("Shapiro-Wilk檢驗:數(shù)據(jù)符合正態(tài)分布")
else:
print("Shapiro-Wilk檢驗:數(shù)據(jù)不符合正態(tài)分布")
# 使用D'Agostino和Pearson檢驗
statistic, p_value = stats.normaltest(data)
if p_value > 0.05:
print("D'Agostino和Pearson檢驗:數(shù)據(jù)符合正態(tài)分布")
else:
print("D'Agostino和Pearson檢驗:數(shù)據(jù)不符合正態(tài)分布")
# 使用Kolmogorov-Smirnov檢驗
statistic, p_value = stats.kstest(data, 'norm')
if p_value > 0.05:
print("Kolmogorov-Smirnov檢驗:數(shù)據(jù)符合正態(tài)分布")
else:
print("Kolmogorov-Smirnov檢驗:數(shù)據(jù)不符合正態(tài)分布")
多種方式正態(tài)檢驗?
import numpy as np
import pandas as pd
import scipy.stats as stats
import matplotlib.pyplot as plt
data = np.random.normal(loc=12, scale=2.5, size=340)
df = pd.DataFrame({'Data': data})
# 描述性統(tǒng)計分析
mean = df['Data'].mean()
std_dev = df['Data'].std()
skewness = df['Data'].skew()
kurtosis = df['Data'].kurtosis()
print("均值:", mean)
print("標(biāo)準(zhǔn)差:", std_dev)
print("偏度:", skewness)
print("峰度:", kurtosis)
# 創(chuàng)建一個2x1的子圖布局
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(6, 6))
# 可視化 - stats.probplot正態(tài)概率圖(Q-Q圖)
stats.probplot(data, plot=ax1, dist='norm', fit=True, rvalue=True) #ax1作為繪圖的位置
ax1.set_title("Q-Q Plot")
# 可視化 - 直方圖
ax2.hist(data, bins=10, rwidth=0.8, density=True) # bins個柱狀圖,寬度是rwidth(0~1),=1沒有縫隙
ax2.set_title("Histogram with Kernel Density Estimate")
# 調(diào)整子圖之間的間距
plt.tight_layout()
# 顯示圖形
plt.show()
# 正態(tài)性檢驗 - Shapiro-Wilk檢驗
stat, p = stats.shapiro(data)
print("Shapiro-Wilk檢驗統(tǒng)計量:", stat)
print("Shapiro-Wilk檢驗p值:", p)
# Anderson-Darling檢驗
result = stats.anderson(df['Data'], dist='norm')
print("Anderson-Darling檢驗統(tǒng)計量:", result.statistic)
print("Anderson-Darling檢驗臨界值:", result.critical_values)
# 執(zhí)行單樣本K-S檢驗,假設(shè)數(shù)據(jù)服從正態(tài)分布
statistic, p_value = stats.kstest(data, 'norm')
print("K-S檢驗統(tǒng)計量:", statistic)
print("K-S檢驗p值:", p_value)
# 執(zhí)行正態(tài)分布檢驗
k2, p_value = stats.normaltest(data)
print(f"normaltest正態(tài)分布檢驗的統(tǒng)計量 (K^2): {k2}")
print(f"normaltest檢驗p值: {p_value}")
?
scipy.stats
模塊是 SciPy 庫中的一個子模塊,用于執(zhí)行各種統(tǒng)計分析和概率分布相關(guān)的操作。該模塊提供了許多函數(shù),用于執(zhí)行統(tǒng)計測試、擬合概率分布、生成隨機(jī)變量等。以下是一些常見的 scipy.stats
模塊的功能:
-
統(tǒng)計檢驗:
scipy.stats
提供了許多統(tǒng)計檢驗方法,例如 t-檢驗、ANOVA、卡方檢驗、正態(tài)性檢驗等。這些方法用于分析數(shù)據(jù)集之間的差異,檢驗假設(shè)以及確定數(shù)據(jù)是否符合某些分布。 -
概率分布:該模塊包含了許多連續(xù)和離散概率分布的實現(xiàn),如正態(tài)分布、指數(shù)分布、泊松分布、伽馬分布等。這些分布可以用于模擬和分析不同類型的隨機(jī)變量。
-
擬合分布:你可以使用
fit
函數(shù)來擬合數(shù)據(jù)到特定的概率分布。這對于確定數(shù)據(jù)是否符合某個已知分布以及估計分布的參數(shù)非常有用。 -
生成隨機(jī)變量:
scipy.stats
允許你生成隨機(jī)變量,這些隨機(jī)變量遵循指定的概率分布。這對于模擬實驗和生成隨機(jī)數(shù)據(jù)點非常有用。 -
描述性統(tǒng)計:你可以使用該模塊來計算數(shù)據(jù)的描述性統(tǒng)計,如均值、標(biāo)準(zhǔn)差、中位數(shù)、百分位數(shù)等。
-
概率密度函數(shù)和累積分布函數(shù):你可以使用該模塊來計算概率密度函數(shù)(PDF)和累積分布函數(shù)(CDF)以及它們的反函數(shù)。
-
統(tǒng)計量計算:該模塊提供了各種統(tǒng)計量的計算,如相關(guān)系數(shù)、協(xié)方差、偏度、峰度等。
-
假設(shè)檢驗:除了常見的 t-檢驗和卡方檢驗外,還提供了一些高級的假設(shè)檢驗方法,如Kolmogorov-Smirnov檢驗、Anderson-Darling檢驗等。
這只是 scipy.stats
模塊的一部分功能。它是在統(tǒng)計學(xué)、數(shù)據(jù)分析和科學(xué)計算中非常有用的工具,可以用于處理和分析各種類型的數(shù)據(jù),并進(jìn)行統(tǒng)計推斷和假設(shè)檢驗。如果需要特定功能的詳細(xì)信息,可以查閱 SciPy 官方文檔或進(jìn)一步探索該模塊的功能。
?---------------------
Q-Q圖(Quantile-Quantile Plot)是一種非常有用的可視化工具,用于比較實際數(shù)據(jù)分布與理論分布(如正態(tài)分布)之間的相似性。通過繪制一個散點圖,Q-Q圖可以幫助你直觀地觀察數(shù)據(jù)的分布與理論分布之間的關(guān)系。
Q-Q圖的制作步驟如下:
-
收集實際數(shù)據(jù):首先,你需要收集或準(zhǔn)備你要分析的實際數(shù)據(jù)集。
-
排序數(shù)據(jù):將實際數(shù)據(jù)按升序排列,以便后續(xù)的分位數(shù)計算。
-
計算分位數(shù):對于每個數(shù)據(jù)點,計算其在整個數(shù)據(jù)集中的百分位排名,通常使用累積分布函數(shù)(CDF)來計算。這些分位數(shù)值表示了數(shù)據(jù)點在整個分布中的相對位置。
-
生成理論分位數(shù):根據(jù)選擇的理論分布(例如正態(tài)分布),計算與相同百分位排名對應(yīng)的理論分位數(shù)。這些理論分位數(shù)是從理論分布中得到的,如果數(shù)據(jù)符合該理論分布,它們應(yīng)該服從相同的分布。
-
繪制Q-Q圖:將實際數(shù)據(jù)的分位數(shù)和理論分布的分位數(shù)繪制成散點圖。通常,x軸表示理論分位數(shù),y軸表示實際數(shù)據(jù)的分位數(shù)。如果數(shù)據(jù)近似符合理論分布,散點應(yīng)該大致沿著一條45度對角線排列。
-
解釋結(jié)果:觀察Q-Q圖上的點的分布。如果它們緊密地沿著45度對角線排列,那么數(shù)據(jù)很可能符合所選擇的理論分布。如果點偏離對角線,可能表示數(shù)據(jù)不符合理論分布。
Q-Q圖是一種強(qiáng)大的工具,可以幫助你直觀地評估數(shù)據(jù)的分布特征,并檢查數(shù)據(jù)是否近似符合理論分布,如正態(tài)分布。如果點在Q-Q圖上緊密地沿著一條直線排列,這是一個很好的跡象,表明數(shù)據(jù)與所選擇的理論分布相符。?scipy.stats.probplot
函數(shù)用于創(chuàng)建概率圖(probability plot),用于可視化樣本數(shù)據(jù)與理論分布(通常是正態(tài)分布)之間的擬合程度。這有助于你判斷樣本數(shù)據(jù)是否符合某個特定的理論分布。
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
# 生成一些模擬身高數(shù)據(jù)(正態(tài)分布)
# 假設(shè)你有一個包含100個身高觀測值的數(shù)據(jù)集,你想要檢查這些身高數(shù)據(jù)是否符合正態(tài)分布
np.random.seed(0)
heights = np.random.normal(loc=170, scale=10, size=100)
# 繪制Q-Q圖
stats.probplot(heights, dist="norm", plot=plt)
plt.title("Q-Q Plot for Heights")
plt.xlabel("Theoretical Quantiles")
plt.ylabel("Sample Quantiles")
plt.show()
要繪制Q-Q圖并比較實際數(shù)據(jù)的分位數(shù)與理論正態(tài)分布的分位數(shù),首先需要計算這些分位數(shù)。分位數(shù)表示數(shù)據(jù)集中某個特定百分比的值。通常使用累積分布函數(shù)(CDF)來計算分位數(shù)。對于正態(tài)分布,可以使用以下方法計算分位數(shù):
-
計算理論正態(tài)分布的分位數(shù):
- 對于給定的概率(百分比)p(例如,p=0.25表示25%分位數(shù),即下四分位數(shù)),可以使用正態(tài)分布的累積分布函數(shù)(CDF)計算相應(yīng)的分位數(shù)。這通常使用統(tǒng)計軟件或庫來完成,因為它涉及到高級數(shù)學(xué)計算。
-
計算實際數(shù)據(jù)的分位數(shù):
- 對于你的實際數(shù)據(jù)集,需要將數(shù)據(jù)從小到大排序。
- 然后,使用以下公式計算每個數(shù)據(jù)點的分位數(shù): 分位數(shù) = ((i - 0.5)/ n) * 100% 其中,i 是數(shù)據(jù)點在排序后的位置,n 是數(shù)據(jù)集中的總數(shù)據(jù)點數(shù)。
-
繪制Q-Q圖:文章來源:http://www.zghlxwxcb.cn/news/detail-722845.html
- 現(xiàn)在你有了理論正態(tài)分布和實際數(shù)據(jù)的分位數(shù),可以將它們繪制在Q-Q圖上。
- x軸表示理論正態(tài)分布的分位數(shù),y軸表示實際數(shù)據(jù)的分位數(shù)。
- 如果數(shù)據(jù)點緊密地沿著一條對角線分布,那么數(shù)據(jù)可能符合正態(tài)分布。
我們使用NumPy生成一個示例數(shù)據(jù)集,假設(shè)它服從正態(tài)分布。然后,我們計算實際數(shù)據(jù)和理論正態(tài)分布的分位數(shù),并使用matplotlib和seaborn庫繪制Q-Q圖。Q-Q圖用于可視化實際數(shù)據(jù)和理論分布之間的擬合程度。如果數(shù)據(jù)點緊密地沿著紅色虛線分布,表示數(shù)據(jù)接近正態(tài)分布。文章來源地址http://www.zghlxwxcb.cn/news/detail-722845.html
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt
import seaborn as sns
# 生成一個示例數(shù)據(jù)集,假設(shè)服從正態(tài)分布
data = np.random.normal(loc=0, scale=1, size=1000)
# 計算實際數(shù)據(jù)的分位數(shù)
percentiles = np.percentile(data, [0, 25, 50, 75, 100])
# 計算理論正態(tài)分布的分位數(shù)
theoretical_percentiles = stats.norm.ppf([0, 0.25, 0.5, 0.75, 1], loc=0, scale=1)
# 繪制Q-Q圖
plt.figure(figsize=(8, 6))
sns.set(style="whitegrid")
sns.scatterplot(x=theoretical_percentiles, y=percentiles)
plt.xlabel("Theoretical Quantiles")
plt.ylabel("Sample Quantiles")
plt.title("Q-Q Plot")
plt.plot([-2, 2], [-2, 2], color='red', linestyle='--') # 添加對角線
plt.show()
到了這里,關(guān)于正態(tài)分布的概率密度函數(shù)|多種正態(tài)分布檢驗|Q-Q圖的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!