【2023 華數(shù)杯全國大學(xué)生數(shù)學(xué)建模競賽】 C題 母親身心健康對(duì)嬰兒成長的影響
1 題目
母親是嬰兒生命中最重要的人之一,她不僅為嬰兒提供營養(yǎng)物質(zhì)和身體保護(hù), 還為嬰兒提供情感支持和安全感。母親心理健康狀態(tài)的不良狀況,如抑郁、焦慮、壓力等,可能會(huì)對(duì)嬰兒的認(rèn)知、情感、社會(huì)行為等方面產(chǎn)生負(fù)面影響。壓力過大的母親可能會(huì)對(duì)嬰兒的生理和心理發(fā)展產(chǎn)生負(fù)面影響,例如影響其睡眠等方面。
附件給出了包括 390名 3 至 12 個(gè)月嬰兒以及其母親的相關(guān)數(shù)據(jù)。這些數(shù)據(jù)涵蓋各種主題,母親的身體指標(biāo)包括年齡、婚姻狀況、教育程度、妊娠時(shí)間、分娩方式,以及產(chǎn)婦心理指標(biāo)CBTS(分娩相關(guān)創(chuàng)傷后應(yīng)激障礙問卷)、EPDS(愛丁堡產(chǎn)后抑郁量表)、HADS(醫(yī)院焦慮抑郁量表)和嬰兒睡眠質(zhì)量指標(biāo)包括整晚睡眠時(shí)間、睡醒次數(shù)和入睡方式。
請(qǐng)查閱相關(guān)文獻(xiàn),了解專業(yè)背景,根據(jù)題目數(shù)據(jù)建立數(shù)學(xué)模型,回答下列問題。
-
許多研究表明,母親的身體指標(biāo)和心理指標(biāo)對(duì)嬰兒的行為特征和睡眠質(zhì)量有影響,請(qǐng)問是否存在這樣的規(guī)律,根據(jù)附件中的數(shù)據(jù)對(duì)此進(jìn)行研究。
-
嬰兒行為問卷是一個(gè)用于評(píng)估嬰兒行為特征的量表,其中包含了一些關(guān)于嬰兒情緒和反應(yīng)的問題。我們將嬰兒的行為特征分為三種類型:安靜型、中等型、矛盾型。請(qǐng)你建立嬰兒的行為特征與母親的身體指標(biāo)與心理指標(biāo)的關(guān)系模型。數(shù)據(jù)表中最后有20組(編號(hào)391-410號(hào))嬰兒的行為特征信息被刪除,請(qǐng)你判斷他們是屬于什么類型。
-
對(duì)母親焦慮的干預(yù)有助于提高母親的心理健康水平,還可以改善母嬰交互質(zhì)量,促進(jìn)嬰兒的認(rèn)知、情感和社交發(fā)展。CBTS、EPDS、HADS的治療費(fèi)用相對(duì)于患病程度的變化率均與治療費(fèi)用呈正比,經(jīng)調(diào)研,給出了兩個(gè)分?jǐn)?shù)對(duì)應(yīng)的治療費(fèi)用,詳見表1?,F(xiàn)有一個(gè)行為特征為矛盾型的嬰兒,編號(hào)為238。請(qǐng)你建立模型, 分析最少需要花費(fèi)多少治療費(fèi)用,能夠使嬰兒的行為特征從矛盾型變?yōu)橹械刃停?/p>
若要使其行為特征變?yōu)榘察o型,治療方案需要如何調(diào)整?
表1. 患病得分與治療費(fèi)用
CBTS | EPDS | HADS | |||
---|---|---|---|---|---|
得分 | 治療費(fèi)用(元) | 得分 | 治療費(fèi)用(元) | 得分 | 治療費(fèi)用(元) |
0 | 200 | 0 | 500 | 0 | 300 |
3 | 2812 | 2 | 1890 | 5 | 12500 |
-
嬰兒的睡眠質(zhì)量指標(biāo)包含整晚睡眠時(shí)間、睡醒次數(shù)、入睡方式。請(qǐng)你對(duì)嬰兒的睡眠質(zhì)量進(jìn)行優(yōu)、良、中、差四分類綜合評(píng)判,并建立嬰兒綜合睡眠質(zhì)量與母親的身體指標(biāo)、心理指標(biāo)的關(guān)聯(lián)模型,預(yù)測最后20組(編號(hào)391-410號(hào))嬰兒的綜合睡眠質(zhì)量。
-
在問題三的基礎(chǔ)上,若需要讓238號(hào)嬰兒的睡眠質(zhì)量評(píng)級(jí)為優(yōu),請(qǐng)問問題三的治療策略是否需要調(diào)整?如何調(diào)整?
2 問題分析
2.1 問題一
對(duì)于母親的身體指標(biāo)和心理指標(biāo)對(duì)嬰兒的行為特征和睡眠質(zhì)量的影響,這是一個(gè)回歸分析建模問題。將嬰兒行為特征和嬰兒的整晚睡眠時(shí)間作為因變量,而母親的身體指標(biāo)和心理指標(biāo)(母親年齡、婚姻狀況、教育程度、妊娠時(shí)間、分娩方式、CBTS、EPDS和HADS)作為自變量進(jìn)行分析。一般采用多元線性回歸模型來建模。多元線性回歸模型的目標(biāo)是找到一組線性關(guān)系,將自變量與因變量聯(lián)系起來。回歸模型的形式可以表示為:
Y
=
β
0
+
β
1
?
X
1
+
β
2
?
X
2
+
.
.
.
+
β
n
?
X
n
+
ε
Y = β0 + β1*X1 + β2*X2 + ... + βn*Xn + ε
Y=β0+β1?X1+β2?X2+...+βn?Xn+ε
其中Y表示因變量(即嬰兒行為特征和嬰兒睡眠質(zhì)量),X1到Xn表示自變量(即母親的身體指標(biāo)和心理指標(biāo)),β0到βn表示回歸系數(shù),ε表示誤差項(xiàng)。
對(duì)于回歸模型的擬合程序的評(píng)估指標(biāo)有調(diào)整的R方、AIC、BIC等。注意在回歸分析中,需要提出假設(shè)條件,并要分析回歸結(jié)果,考慮各個(gè)指標(biāo)的系數(shù)估計(jì)值和其顯著性檢驗(yàn)結(jié)果。如以下三個(gè)方面。
- 系數(shù)估計(jì)值:表示自變量對(duì)因變量的影響強(qiáng)度,例如β1表示自變量x1對(duì)因變量y的影響強(qiáng)度,β2表示自變量x2對(duì)因變量y的影響強(qiáng)度等等。
- t值和p值:用于檢驗(yàn)各個(gè)系數(shù)估計(jì)值的顯著性程度。t值可以表示變量的標(biāo)準(zhǔn)誤和系數(shù)之間的比值,而p值可以表示該t值在顯著性水平下的置信區(qū)間范圍。一般來說,p值小于0.05或0.01時(shí),表示該系數(shù)估計(jì)值在顯著性水平下具有統(tǒng)計(jì)學(xué)意義,即該自變量對(duì)因變量的影響顯著。
- 回歸方程的擬合程度:可用R方和調(diào)整R方來衡量。R方表示模型擬合數(shù)據(jù)的適配度,可解釋為自變量對(duì)因變量方差的百分比。調(diào)整R方則考慮了自變量數(shù)目影響,具有更加穩(wěn)健的擬合效果。另外,由于數(shù)據(jù)集中包含相關(guān)系數(shù)較多,我們還可以考慮使用主成分分析(PCA)來減少自變量的維度,提取主要的特征,并建立主成分回歸模型。
此外在多元回歸分析中,需要考慮各個(gè)特征之間是否存在多重共線性,在回歸分析之前可以采用主成分分析(PCA)來減少自變量的維度,提取主要的特征,再建立主成分回歸模型。
2.2 問題二
這是一個(gè)分類問題,并需要預(yù)測20個(gè)樣本的類別。分類模型的建立步驟如下:
-
數(shù)據(jù)預(yù)處理:對(duì)收集到的數(shù)據(jù)進(jìn)行缺失值處理、異常值處理、標(biāo)準(zhǔn)化等預(yù)處理步驟。
-
特征工程:進(jìn)行特征轉(zhuǎn)換、特征組合或選擇等操作,以提取更具有區(qū)分度的特征。
-
模型選擇:根據(jù)數(shù)據(jù)的特征和模型的要求,選擇適合的多類別分類算法,如邏輯回歸、支持向量機(jī)、決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等。
-
模型評(píng)估:使用交叉驗(yàn)證、混淆矩陣、準(zhǔn)確率、召回率、F1分?jǐn)?shù)等指標(biāo),對(duì)模型進(jìn)行評(píng)估和優(yōu)化。
-
模型應(yīng)用:使用訓(xùn)練好的模型對(duì)新樣本進(jìn)行預(yù)測和分類,就可以得到嬰兒的行為特征分類結(jié)果。
2.3 問題三
這就是一個(gè)最小優(yōu)化問題。首先使用線性回歸模型來建立CBTS、EPDS和HADS的得分與治療費(fèi)用之間的關(guān)系??梢詫BTS、EPDS和HADS的得分作為自變量,將治療費(fèi)用作為因變量,通過擬合線性回歸模型,來估計(jì)得分與治療費(fèi)用之間的線性關(guān)系。
。。。略
然后使用優(yōu)化算法求解最小化總治療費(fèi)用的問題,并得到對(duì)應(yīng)的CBTS、EPDS和HADS得分以及最小的治療費(fèi)用。
2.4 問題四
這是一個(gè)聚類問題,使用聚類分析將嬰兒睡眠質(zhì)量分為四類:優(yōu)、良、中和差??梢愿鶕?jù)嬰兒的整晚睡眠時(shí)間、睡醒次數(shù)和入睡方式這幾個(gè)指標(biāo),通過K-Means、Birch等指定K值的聚類算法對(duì)嬰兒睡眠質(zhì)量進(jìn)行分類。使用四類作為聚類數(shù),將數(shù)據(jù)集中的所有樣本分成四個(gè)組。每個(gè)組代表一類睡眠質(zhì)量。
。。。略
可以通過訓(xùn)練得到的回歸模型,預(yù)測最后20組(編號(hào)391-410號(hào))嬰兒的綜合睡眠質(zhì)量評(píng)分。
2.5 問題五
在問題三的基礎(chǔ)上,預(yù)測調(diào)整后編號(hào)238,在調(diào)整診療方案后,即是安靜型的特征下,目前的睡眠質(zhì)量是哪個(gè)類別。如果屬于優(yōu)就不用調(diào)整,屬于其他,就需要調(diào)整。
3 代碼實(shí)現(xiàn)
3.1 問題一
import pandas as pd
import statsmodels.api as sm
data = pd.read_excel('./data/附件.xlsx')
data = data[0:-20]
data
import re
# 提取自變量和因變量
X = data[['母親年齡', '婚姻狀況', '教育程度', '妊娠時(shí)間(周數(shù))', '分娩方式', 'CBTS', 'EPDS', 'HADS']]
Y1 = data['嬰兒行為特征'].map({'中等型':1,'安靜型':2,'矛盾型':3})
# 將睡眠時(shí)間轉(zhuǎn)為分鐘,并剔除其中的異常值
def convert_to_minutes(time_str):
...略
return total_minutes
# 對(duì) Y2 列中的數(shù)據(jù)進(jìn)行轉(zhuǎn)換和剔除異常值
Y2 = data['整晚睡眠時(shí)間(時(shí):分:秒)'].apply(convert_to_minutes)
# 添加截距項(xiàng)
X = sm.add_constant(X)
# 構(gòu)建OLS回歸模型
model1 = sm.OLS(Y1, X)
model2 = sm.OLS(Y2, X)
# 得到回歸結(jié)果
result1 = model1.fit()
result2 = model2.fit()
# 輸出回歸結(jié)果概要
print(result1.summary())
# 輸出各個(gè)指標(biāo)的系數(shù)估計(jì)值和顯著性檢驗(yàn)結(jié)果
print(result1.params)
print(result1.pvalues)
根據(jù)回歸分析的結(jié)果,得出以下結(jié)論:
- 整體的回歸方程(R-squared值)表明,自變量對(duì)因變量的解釋能力較弱,模型可解釋變異性的比例為1.4%。
- 調(diào)整后的R-squared值顯示,模型的解釋能力被調(diào)整后的參數(shù)效應(yīng)所削弱,為負(fù)值。
- F統(tǒng)計(jì)量的值為0.6728,Prob(F-statistic)的值為0.716,兩者都較大,說明模型的整體顯著性不高。
- 各自變量的系數(shù)(coef)沒有通過顯著性檢驗(yàn)(P>|t|),說明它們與因變量之間的關(guān)系不顯著。
- 通過系數(shù)的置信區(qū)間([0.025 0.975]),可以推測參數(shù)的真實(shí)值有一定的不確定性。
- 基于滿足多重線性回歸的模型假設(shè)的前提下,模型的擬合度檢驗(yàn)(AIC和BIC值)顯示該模型在給定數(shù)據(jù)集上的擬合度較好。
- 其他檢驗(yàn)(如Omnibus和Durbin-Watson)顯示存在一些模型假設(shè)和統(tǒng)計(jì)特性的問題,需要進(jìn)一步考慮。
綜上所述,通過對(duì)數(shù)據(jù)的回歸分析,在該數(shù)據(jù)集中,自變量(母親年齡、婚姻狀況、教育程度、妊娠時(shí)間、分娩方式、CBTS、EPDS、HADS)與因變量(嬰兒行為特征)之間的關(guān)系不明確且不顯著,模型的解釋能力較弱。因此,自變量對(duì)于預(yù)測嬰兒行為特征的貢獻(xiàn)度較低。
print(result2.summary())
print(result2.params)
print(result2.pvalues)
回歸結(jié)論總結(jié)如下:
整晚睡眠時(shí)間(時(shí):分:秒)的回歸模型具有一定解釋能力,R-squared為0.063,說明回歸模型能夠解釋陽性反應(yīng)量的6.3%的變異性。調(diào)整后的R方為0.043,相對(duì)更加準(zhǔn)確。
- 常數(shù)項(xiàng)const的系數(shù)為534.4218,顯著不為0,說明即使其他自變量為0時(shí),整晚睡眠時(shí)間仍然大約為534小時(shí)。
- 母親年齡的系數(shù)為0.5649,p值為0.575,不顯著,說明母親年齡與整晚睡眠時(shí)間之間可能不存在線性關(guān)系。
- 婚姻狀況的系數(shù)為-17.6649,p值為0.135,不顯著,說明婚姻狀況對(duì)整晚睡眠時(shí)間的影響可能不明顯。
- 教育程度的系數(shù)為-2.6517,p值為0.557,不顯著,說明教育程度對(duì)整晚睡眠時(shí)間的影響可能不明顯。
- 妊娠時(shí)間(周數(shù))的系數(shù)為2.6182,p值為0.268,不顯著,說明妊娠時(shí)間對(duì)整晚睡眠時(shí)間的影響可能不明顯。
- 分娩方式的系數(shù)為21.0835,p值為0.593,不顯著,說明分娩方式對(duì)整晚睡眠時(shí)間的影響可能不明顯。
- CBTS的系數(shù)為2.5157,p值為0.078,接近顯著水平,說明CBTS對(duì)整晚睡眠時(shí)間可能有一定的影響。
- EPDS的系數(shù)為-4.4951,p值為0.000,顯著,說明EPDS對(duì)整晚睡眠時(shí)間有顯著負(fù)向影響。
- HADS的系數(shù)為0.8048,p值為0.633,不顯著,說明HADS對(duì)整晚睡眠時(shí)間的影響可能不明顯。
回歸模型的統(tǒng)計(jì)檢驗(yàn)結(jié)果顯示F統(tǒng)計(jì)量為3.200,對(duì)應(yīng)的p值為0.00157,拒絕原假設(shè)(自變量都不重要的假設(shè)),認(rèn)為至少有一個(gè)自變量對(duì)整晚睡眠時(shí)間有顯著影響。Durbin-Watson統(tǒng)計(jì)量為2.180,接近2,說明回歸模型中可能不存在自相關(guān)性的問題。
總體而言,EPDS(產(chǎn)后抑郁指標(biāo))是整晚睡眠時(shí)間的重要影響因素,其他自變量對(duì)整晚睡眠時(shí)間的影響可能不明顯。但回歸模型的解釋能力較弱,R方值較低,可能存在未考慮的其他重要因素。
3.2 問題二
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
import re
# 讀取數(shù)據(jù)
import pandas as pd
import statsmodels.api as sm
data = pd.read_excel('./data/附件.xlsx')
data = data[0:-20]
# 數(shù)據(jù)預(yù)處理
...略
# 劃分特征和標(biāo)簽
features = data[['母親年齡', '婚姻狀況', '教育程度', '妊娠時(shí)間(周數(shù))', '分娩方式', 'CBTS', 'EPDS', 'HADS', '嬰兒性別', '嬰兒年齡(月)', '整晚睡眠時(shí)間(時(shí):分:秒)', '睡醒次數(shù)', '入睡方式']]
labels = data['嬰兒行為特征']
features
# 劃分訓(xùn)練集和測試集
train_features, test_features, train_labels, test_labels = train_test_split(features, labels, test_size=0.2, random_state=0)
# 建立決策樹模型
clf = DecisionTreeClassifier()
clf.fit(train_features, train_labels)
# 預(yù)測測試集結(jié)果
pred_labels = clf.predict(test_features)
# 計(jì)算準(zhǔn)確率
accuracy = sum(pred_labels == test_labels) / len(test_labels)
print("決策樹模型準(zhǔn)確率:", accuracy)
決策樹模型準(zhǔn)確率: 0.4230769230769231
# 建立隨機(jī)森林模型
rf = RandomForestClassifier()
rf.fit(train_features, train_labels)
# 預(yù)測測試集結(jié)果
pred_labels_rf = rf.predict(test_features)
# 計(jì)算準(zhǔn)確率
accuracy_rf = sum(pred_labels_rf == test_labels) / len(test_labels)
print("隨機(jī)森林模型準(zhǔn)確率:", accuracy_rf)
隨機(jī)森林模型準(zhǔn)確率: 0.5512820512820513
# 使用模型預(yù)測結(jié)果
unknown_samples = data[-20:] # 獲取需要預(yù)測的樣本
unknown_features = unknown_samples[['母親年齡', '婚姻狀況', '教育程度', '妊娠時(shí)間(周數(shù))', '分娩方式', 'CBTS', 'EPDS', 'HADS', '嬰兒性別', '嬰兒年齡(月)', '整晚睡眠時(shí)間(時(shí):分:秒)', '睡醒次數(shù)', '入睡方式']]
unknown_pred_labels = clf.predict(unknown_features)
label_dict ={0:'中等型',1:'安靜型',2:'矛盾型'}
print("預(yù)測結(jié)果:")
for i in range(len(unknown_samples)):
print("樣本編號(hào){},預(yù)測類型為{}".format(390+i, label_dict[unknown_pred_labels[i]]))
預(yù)測結(jié)果:
樣本編號(hào)390,預(yù)測類型為中等型
樣本編號(hào)391,預(yù)測類型為安靜型
樣本編號(hào)392,預(yù)測類型為安靜型
樣本編號(hào)393,預(yù)測類型為安靜型
樣本編號(hào)394,預(yù)測類型為中等型
樣本編號(hào)395,預(yù)測類型為安靜型
樣本編號(hào)396,預(yù)測類型為安靜型
樣本編號(hào)397,預(yù)測類型為安靜型
樣本編號(hào)398,預(yù)測類型為安靜型
樣本編號(hào)399,預(yù)測類型為中等型
樣本編號(hào)400,預(yù)測類型為安靜型
樣本編號(hào)401,預(yù)測類型為中等型
樣本編號(hào)402,預(yù)測類型為中等型
樣本編號(hào)403,預(yù)測類型為中等型
樣本編號(hào)404,預(yù)測類型為中等型
樣本編號(hào)405,預(yù)測類型為中等型
樣本編號(hào)406,預(yù)測類型為中等型
樣本編號(hào)407,預(yù)測類型為安靜型
樣本編號(hào)408,預(yù)測類型為安靜型
樣本編號(hào)409,預(yù)測類型為中等型
3.3 問題三
請(qǐng)下載完整資料
4 完整資料下載
知乎文章底部下載鏈接,包括完整的word文檔和python代碼。文章來源:http://www.zghlxwxcb.cn/news/detail-631349.html
zhuanlan.zhihu.com/p/648093611文章來源地址http://www.zghlxwxcb.cn/news/detail-631349.html
到了這里,關(guān)于【2023 華數(shù)杯全國大學(xué)生數(shù)學(xué)建模競賽】 C題 母親身心健康對(duì)嬰兒成長的影響 Python代碼實(shí)現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!