平均值在計(jì)量專業(yè)和統(tǒng)計(jì)學(xué)中有著廣泛的應(yīng)用如:描述數(shù)據(jù)集中趨勢(shì)、比較不同組數(shù)據(jù)、評(píng)估數(shù)據(jù)的代表性、決策和判斷、回歸分析概率統(tǒng)計(jì)與財(cái)務(wù)分析等。此外,在計(jì)量專業(yè)中,平均值還被廣泛應(yīng)用于各種測(cè)量和校準(zhǔn)過程中,以確保測(cè)量結(jié)果的準(zhǔn)確性和可靠性。例如,在實(shí)驗(yàn)室測(cè)量中,多次測(cè)量的平均值可以提高測(cè)量的精度;在質(zhì)量控制中,通過計(jì)算產(chǎn)品的平均質(zhì)量水平來評(píng)估生產(chǎn)過程的穩(wěn)定性等。
算數(shù)平均數(shù)(Mean):
算術(shù)平均值為所有數(shù)值相加后除以數(shù)值的個(gè)數(shù),它反映了數(shù)據(jù)的一般水平。其中,簡(jiǎn)單平均數(shù)(算術(shù)平均數(shù))是把所有數(shù)值相加,然后用總數(shù)除以數(shù)值的個(gè)數(shù)。這種方法假設(shè)每個(gè)數(shù)值具有相同的權(quán)重或重要性。簡(jiǎn)單平均數(shù)是反映一組數(shù)據(jù)的一般水平的重要指標(biāo),它利用了所有數(shù)據(jù)的信息,并且在數(shù)學(xué)上是使誤差平方和達(dá)到最小的統(tǒng)計(jì)量。
x
ˉ
=
x
1
+
x
2
+
x
3
+
.
.
.
+
x
n
n
=
Σ
i
=
1
n
x
i
n
\bar{x}=\frac{x_{1}+x_{2}+x_{3}+...+x_{n}}{n}=\frac{\Sigma^{n}_{i=1}x_{i}}{n}
xˉ=nx1?+x2?+x3?+...+xn??=nΣi=1n?xi?? 衍生公式(如計(jì)算方差時(shí)用到):
V
a
r
i
a
n
c
e
=
1
n
∑
i
=
1
n
(
x
i
?
A
M
)
2
Variance = \frac{1}{n} \sum_{i=1}^{n} (x_i - AM)^2
Variance=n1?∑i=1n?(xi??AM)2
A
M
=
1
n
∑
i
=
1
n
x
i
AM = \frac{1}{n} \sum_{i=1}^{n} x_i
AM=n1?∑i=1n?xi?,其中 :
*
n
n
n :數(shù)據(jù)的數(shù)量
*
x
i
x_i
xi? :每個(gè)數(shù)據(jù)點(diǎn)。
建立樣品數(shù)據(jù):
name <- c("大天二", "陳浩南", "劉亦菲", "山雞", "蕉皮", "洪滿天",
"劉華強(qiáng)", "馬大腳", "奧利給", "大金剛", "馬里奧", "GGBond",
"菲菲", "劉老二")
gender <- c("男", "女", "男", "女", "女", "男", "男", "女",
"男", "男", "女", "女", "男", "女")
stat <- c(11, 12, 15, 85, 76, 45, 78, 99, 64, 10, 73, 74, 82, 72)
math <- c(44, 67, 82, 91, 45, 23, 1, 98, 23, 45, 24, 30, 75, 69)
econ <- c(99, 85, 79, 68, 49, 79, 88, 92, 93, 94, 89, 84, 46, 77)
student_data <- data.frame(姓名=name, 性別=gender, 統(tǒng)計(jì)學(xué)=stat,數(shù)學(xué)=math, 經(jīng)濟(jì)學(xué)=econ)
print(student_data)
計(jì)算統(tǒng)計(jì)學(xué)的平均分?jǐn)?shù):
simple_mean <- mean(student_data$統(tǒng)計(jì)學(xué))
print(simple_mean)
# 輸出: 56.85714
平均值在以下情況下可以作為最佳估約值:
- 數(shù)據(jù)分布均勻:當(dāng)數(shù)據(jù)集中的數(shù)值分布相對(duì)均勻,沒有明顯的極端值時(shí),平均值能夠較好地代表整體數(shù)據(jù)的中心趨勢(shì)。
- 大樣本量:當(dāng)樣本量足夠大時(shí),平均值受個(gè)別極端值的影響會(huì)相對(duì)較小,因此更能準(zhǔn)確地反映數(shù)據(jù)的整體情況。
- 對(duì)稱分布:對(duì)于對(duì)稱分布的數(shù)據(jù)集(如正態(tài)分布),平均值是描述數(shù)據(jù)中心位置的最佳選擇。
但需要注意的是,在數(shù)據(jù)存在極端值或分布嚴(yán)重偏斜的情況下,平均值可能不是最佳的估約值(比如存在系統(tǒng)誤差)。在這種情況下,中位數(shù)或眾數(shù)可能更能代表數(shù)據(jù)的中心趨勢(shì)。因此,在選擇使用平均值作為估約值時(shí),需要綜合考慮數(shù)據(jù)的分布特點(diǎn)和具體應(yīng)用場(chǎng)景。
加權(quán)算數(shù)平均值
在計(jì)算平均數(shù)時(shí),給每個(gè)數(shù)據(jù)賦予一個(gè)權(quán)重,以反映數(shù)據(jù)的重要性。每個(gè)數(shù)據(jù)與其對(duì)應(yīng)的權(quán)重相乘,然后將所得的乘積求和,再除以所有權(quán)重的總和。加權(quán)平均數(shù)能夠更準(zhǔn)確地反映數(shù)據(jù)的實(shí)際重要性,特別是在數(shù)據(jù)點(diǎn)的重要性或頻率不均勻分布的情況下。
x
ˉ
=
m
1
f
1
+
m
2
f
2
+
m
3
f
3
+
.
.
.
+
m
k
f
k
f
1
+
f
2
+
f
3
+
.
.
.
+
f
k
=
Σ
i
=
1
k
m
i
f
i
n
\bar{x}=\frac{m_{1}f_{1}+m_{2}f_{2}+m_{3}f_{3}+...+m_{k}f_{k}}{f_{1}+f_{2}+f_{3}+...+f_{k}}=\frac{\Sigma_{i=1}^{k}m_{i}f_{i}}{n}
xˉ=f1?+f2?+f3?+...+fk?m1?f1?+m2?f2?+m3?f3?+...+mk?fk??=nΣi=1k?mi?fi?? *
x
ˉ
\bar{x}
xˉ:表示加權(quán)平均值。
* m i m_i mi?:表示第 i i i個(gè)測(cè)量值或數(shù)據(jù)點(diǎn)。
* f i f_i fi?:表示與第 i i i個(gè)測(cè)量值相關(guān)聯(lián)的權(quán)重(或稱為頻數(shù))。
* k k k:表示測(cè)量值的數(shù)量。
* n n n:表示所有權(quán)重的總和,即 n = f 1 + f 2 + f 3 + . . . + f k n = f_1 + f_2 + f_3 + ... + f_k n=f1?+f2?+f3?+...+fk?。
* Σ i = 1 k \Sigma_{i=1}^{k} Σi=1k?:表示從 i = 1 i=1 i=1到 i = k i=k i=k的求和符號(hào)。
* m 1 f 1 + m 2 f 2 + m 3 f 3 + . . . + m k f k m_{1}f_{1} + m_{2}f_{2} + m_{3}f_{3} + ... + m_{k}f_{k} m1?f1?+m2?f2?+m3?f3?+...+mk?fk?:這部分是測(cè)量值與對(duì)應(yīng)權(quán)重的乘積之和。它表示了每個(gè)測(cè)量值根據(jù)其權(quán)重對(duì)總和的貢獻(xiàn)。
* f 1 + f 2 + f 3 + . . . + f k f_{1} + f_{2} + f_{3} + ... + f_{k} f1?+f2?+f3?+...+fk?:這是所有權(quán)重的總和,也稱為 n n n。它用于標(biāo)準(zhǔn)化上述乘積之和,以確保加權(quán)平均值在合理的范圍內(nèi)。
因此,加權(quán)平均值 x ˉ \bar{x} xˉ是測(cè)量值與權(quán)重乘積之和除以權(quán)重之和。這反映了每個(gè)測(cè)量值根據(jù)其權(quán)重對(duì)平均值的貢獻(xiàn)。
在計(jì)量專業(yè)中加權(quán)算數(shù)平均值的計(jì)算公式為:
x w = Σ i = 1 m W i x i Σ i = 1 m W i = Σ i = 1 m W i Σ i = 1 m W i x i = Σ i = 1 m w i x i x_{w}=\frac{\Sigma^{m}_{i=1}W_{i}x_{i}}{\Sigma_{i=1}^{m}W_{i}}=\Sigma_{i=1}^{m}\frac{W_{i}}{\Sigma_{i=1}^{m}W_{i}}x_{i}=\Sigma^{m}_{i=1}w_{i}x_{i} xw?=Σi=1m?Wi?Σi=1m?Wi?xi??=Σi=1m?Σi=1m?Wi?Wi??xi?=Σi=1m?wi?xi? * x w x_{w} xw?:加權(quán)算數(shù)平均值
* W i W_{i} Wi?:第 i i i次測(cè)量結(jié)果的權(quán)
* x i x_{i} xi?:第i次的測(cè)量結(jié)果
* m m m:測(cè)量次數(shù)
* w i w_{i} wi?:歸一化的權(quán),即 Σ i m w i = 1 \Sigma^{m}_{i}w_{i}=1 Σim?wi?=1
在計(jì)算 x w x_{w} xw?時(shí),各測(cè)量結(jié)果 x i x_{i} xi?所占的比重,用權(quán) W i W_{i} Wi?表示。 W i W_{i} Wi?越大, x i x_{i} xi?越可信賴,則加權(quán)平均計(jì)算中 x i x_{i} xi?的權(quán)應(yīng)該相應(yīng)的越大。由于最終對(duì)加權(quán)算術(shù)平值起作用的歸一化的權(quán) w i w_{i} wi?,所以,對(duì)于一組權(quán)( W 1 , W 2 , . . . , W n , W_{1},W_{2},...,W_{n}, W1?,W2?,...,Wn?,),每個(gè) W i W_{i} Wi?都放大或縮小同樣倍數(shù),并不影響加權(quán)平均中的實(shí)際權(quán)重。 假設(shè)幾個(gè)實(shí)驗(yàn)室分別對(duì)同一被測(cè)量在相同環(huán)境等測(cè)量條件下的測(cè)得值為 x i x_{i} xi?,其標(biāo)準(zhǔn)不確定度為 u i u_{i} ui?,且評(píng)定數(shù)值合理;各實(shí)驗(yàn)室均為獨(dú)立測(cè)量;而且這組獨(dú)立測(cè)量數(shù)據(jù)之間是兼容的;此時(shí),權(quán)的計(jì)算公式為: W i = 1 u i 2 W_{i}=\frac{1}{u^{2}_{i}} Wi?=ui2?1? 即加權(quán)平均的權(quán)與每個(gè)參與計(jì)算的測(cè)量值的試驗(yàn)標(biāo)準(zhǔn)偏差的二次方成反比。 假設(shè)有三個(gè)實(shí)驗(yàn)室對(duì)同一被測(cè)量進(jìn)行了獨(dú)立測(cè)量,測(cè)得的數(shù)值和標(biāo)準(zhǔn)不確定度如下:
實(shí)驗(yàn)室1:測(cè)得值 (
x
1
x_{1}
x1? = 10.5 ),標(biāo)準(zhǔn)不確定度 (
u
1
u_{1}
u1? = 0.5 )
實(shí)驗(yàn)室2:測(cè)得值 (
x
2
x_{2}
x2? = 10.2 ),標(biāo)準(zhǔn)不確定度 (
u
2
u_{2}
u2? = 0.3 )
實(shí)驗(yàn)室3:測(cè)得值 (
x
3
x_{3}
x3? = 10.7 ),標(biāo)準(zhǔn)不確定度 (
u
3
u_{3}
u3? = 0.4 )
我們要計(jì)算這組測(cè)量值的加權(quán)算術(shù)平均值
W
i
=
1
u
i
2
W_{i} = \frac{1}{u_{i}^{2}}
Wi?=ui2?1? 來計(jì)算每個(gè)測(cè)量結(jié)果的權(quán):
實(shí)驗(yàn)室1的權(quán)
W
1
=
1
0.
5
2
=
4
W_{1} = \frac{1}{0.5^{2}} = 4
W1?=0.521?=4
實(shí)驗(yàn)室2的權(quán)
W
2
=
1
0.
3
2
≈
11.1111
W_{2} = \frac{1}{0.3^{2}} \approx 11.1111
W2?=0.321?≈11.1111
實(shí)驗(yàn)室3的權(quán)
W
3
=
1
0.
4
2
=
6.25
W_{3} = \frac{1}{0.4^{2}} = 6.25
W3?=0.421?=6.25
接下來計(jì)算歸一化的權(quán)
w
i
w_{i}
wi?:
總權(quán)
Σ
W
i
=
4
+
11.1111
+
6.25
=
21.3611
\Sigma W_{i} = 4 + 11.1111 + 6.25 = 21.3611
ΣWi?=4+11.1111+6.25=21.3611
實(shí)驗(yàn)室1的歸一化權(quán)
w
1
=
4
21.3611
≈
0.1872
w_{1} = \frac{4}{21.3611} \approx 0.1872
w1?=21.36114?≈0.1872
實(shí)驗(yàn)室2的歸一化權(quán)
w
2
=
11.1111
21.3611
≈
0.5202
w_{2} = \frac{11.1111}{21.3611}\approx 0.5202
w2?=21.361111.1111?≈0.5202
實(shí)驗(yàn)室3的歸一化權(quán)
w
3
=
6.25
21.3611
≈
0.2926
w_{3} = \frac{6.25}{21.3611} \approx 0.2926
w3?=21.36116.25?≈0.2926
最后,我們根據(jù)加權(quán)算術(shù)平均值的公式計(jì)算 (
x
w
x_{w}
xw? ):
1.
x
w
=
Σ
i
=
1
m
w
?
i
x
i
=
w
1
x
1
+
w
2
x
2
+
w
3
x
3
x_{w} = \Sigma_{i=1}^{m} w*{i} x_{i} = w_{1} x_{1} + w_{2} x_{2} + w_{3} x_{3}
xw?=Σi=1m?w?ixi?=w1?x1?+w2?x2?+w3?x3?)
2.
x
w
?
≈
0.187210.5
+
0.5202
?
10.2
+
0.2926
?
10.7
x_{w}* \approx 0.1872 10.5 + 0.5202 *10.2 + 0.2926* 10.7
xw??≈0.187210.5+0.5202?10.2+0.2926?10.7)
3.
x
w
≈
10.3978
x_{w} \approx 10.3978
xw?≈10.3978
所以,這組測(cè)量值的加權(quán)算術(shù)平均值約為 10.3978。
# 定義測(cè)量值和標(biāo)準(zhǔn)不確定度
x <- c(10.5, 10.2, 10.7)
u <- c(0.5, 0.3, 0.4)
# 計(jì)算權(quán)值
W <- 1 / (u^2)
# 計(jì)算歸一化權(quán)值
w <- W / sum(W)
# 計(jì)算加權(quán)算術(shù)平均值
x_w <- sum(w * x)
print(x_w) # 輸出加權(quán)算術(shù)平均值
# 輸出: 10.40247
公式變形:
x
ˉ
=
Σ
i
=
1
k
m
i
f
i
n
\bar{x} = \frac{\Sigma_{i=1}^{k}m_{i}f_{i}}{n}
xˉ=nΣi=1k?mi?fi??,其中:
*
Σ
i
=
1
k
m
i
f
i
\Sigma_{i=1}^{k}m_{i}f_{i}
Σi=1k?mi?fi?表示所有
m
i
m_i
mi?和
f
i
f_i
fi?乘積的和
*
n
n
n是所有權(quán)重的總和。
這種表示方法更為簡(jiǎn)潔,且更通用。
計(jì)算完實(shí)驗(yàn)室數(shù)據(jù)后繼續(xù)上述代碼,計(jì)算學(xué)生成績(jī)表的加權(quán)平均數(shù),以經(jīng)濟(jì)學(xué)成績(jī)作為權(quán)重
weighted_mean_stat <- weighted.mean(student_data$統(tǒng)計(jì)學(xué), student_data$經(jīng)濟(jì)學(xué))
print(weighted_mean_stat)
# 輸出:54.58645
計(jì)算每個(gè)科目的簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)
# 初始化一個(gè)數(shù)據(jù)框來存儲(chǔ)結(jié)果
results <- data.frame(Subject=character(), SimpleMean=numeric(), WeightedMean=numeric())
subjects <- c("統(tǒng)計(jì)學(xué)", "數(shù)學(xué)", "經(jīng)濟(jì)學(xué)")
for (subject in subjects) {
simple_mean <- mean(student_data[[subject]])
weighted_mean <- weighted.mean(student_data[[subject]], student_data$經(jīng)濟(jì)學(xué))
results <- rbind(results, data.frame(Subject=subject, SimpleMean=simple_mean, WeightedMean=weighted_mean))
}
print(results)
使用ggplot2繪制氣泡圖
library(ggplot2)
student_data$性別 <- as.factor(student_data$性別)
ggplot(student_data, aes(x = 統(tǒng)計(jì)學(xué), y = 數(shù)學(xué), color = 性別, size = 經(jīng)濟(jì)學(xué))) +
geom_point(alpha = 0.7) + # alpha用于設(shè)置點(diǎn)的透明度
scale_size(range = c(1, 10)) + # 設(shè)置氣泡的最小和最大尺寸
theme_minimal() + # 使用簡(jiǎn)潔的主題
ggtitle("學(xué)生成績(jī)氣泡圖") + # 設(shè)置圖表標(biāo)題
xlab("統(tǒng)計(jì)學(xué)成績(jī)") + # 設(shè)置x軸標(biāo)簽
ylab("數(shù)學(xué)成績(jī)") + # 設(shè)置y軸標(biāo)簽
guides(size = guide_legend(title = "經(jīng)濟(jì)學(xué)成績(jī)"))
幾何平均值(Geometric Mean):
計(jì)算公式:
G
M
=
(
∏
i
=
1
n
x
i
)
1
n
GM = (\prod_{i=1}^{n} x_i)^{\frac{1}{n}}
GM=(∏i=1n?xi?)n1?,其中:文章來源:http://www.zghlxwxcb.cn/news/detail-846572.html
- ∏ \prod ∏ :連乘
- * n n n :數(shù)據(jù)的數(shù)量
- *
x
i
x_i
xi? :每個(gè)數(shù)據(jù)點(diǎn)。
幾何平均值常用于計(jì)算平均增長(zhǎng)率或復(fù)利等情況,在計(jì)量專業(yè)中使用幾何平均值可以有效的消除系統(tǒng)誤差。
在計(jì)量專業(yè)中最常見的就是等臂天平測(cè)量。
geometric_mean <- function(x) {
if(all(x > 0)) {
return(prod(x)^(1/length(x)))
} else {
stop("所有數(shù)值必須為正數(shù)")
}
}
values <- c(12.5, 12.2, 12.1, 12.3, 12.2)
geom_mean <- geometric_mean(values)
print(geom_mean)
# 輸出: 12.25925
調(diào)和平均值(Harmonic Mean):
計(jì)算公式:
H
M
=
n
∑
i
=
1
n
1
x
i
HM = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}}
HM=∑i=1n?xi?1?n?,其中:文章來源地址http://www.zghlxwxcb.cn/news/detail-846572.html
- n n n :數(shù)據(jù)的數(shù)量
-
x
i
x_i
xi? :每個(gè)數(shù)據(jù)點(diǎn)。
調(diào)和平均值常用于計(jì)算平均速率或成本等情況。
以下數(shù)據(jù)為一組氣體流量計(jì)的實(shí)時(shí)流量記錄:
harmonic_mean <- function(x) {
if(all(x > 0)) {
return(length(x) / sum(1/x))
} else {
stop("所有數(shù)值必須為正數(shù)")
}
}
values <- c(400.38, 400.41, 400.11, 400.35, 400.44, 400.19)
harm_mean <- harmonic_mean(values)
print(harm_mean)
# 輸出: 400.3133
到了這里,關(guān)于R語言實(shí)現(xiàn):統(tǒng)計(jì)學(xué)及計(jì)量專業(yè)中的多種平均值計(jì)算方式的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!