国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析

這篇具有很好參考價(jià)值的文章主要介紹了基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)

首先,讀取數(shù)據(jù)集,該數(shù)據(jù)集是UCI上的心臟病患者數(shù)據(jù)集,其中包含了 303 條患者信息,每一名患者有 13 個(gè)字段記錄其基本信息(年齡、性別等)和身體健康信息(心率、血糖等),此外有一個(gè)類(lèi)變量記錄其是否患有心臟病。詳細(xì)的字段信息可見(jiàn)?此處。

類(lèi)別字段target有兩個(gè)取值,代表預(yù)測(cè)類(lèi)別,1 = 患病,2 = 不患病。

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)

?

2.訓(xùn)練/測(cè)試集劃分

對(duì)數(shù)據(jù)集進(jìn)行劃分,設(shè)置劃分比例為訓(xùn)練集 : 測(cè)試集 = 4 : 1。

由于數(shù)據(jù)集的同一類(lèi)標(biāo)簽集中在一起,我們選擇分組抽樣選項(xiàng),依據(jù)target字段進(jìn)行分組,合理劃分?jǐn)?shù)據(jù)集。

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)

3.構(gòu)建K近鄰心臟病患者分類(lèi)模型

構(gòu)建K近鄰分類(lèi)模型,將target作為我們的標(biāo)簽列,其余各字段均作為模型的特征列。選擇計(jì)算的鄰居個(gè)數(shù)為8,權(quán)重計(jì)算方式為distance,以及設(shè)置距離計(jì)算方式為manhattan距離(街區(qū)距離)。

參數(shù)列表

參數(shù)名稱(chēng) 參數(shù)取值
鄰居數(shù) 8
權(quán)重計(jì)算方式 distance
距離計(jì)算方式 manhattan

?

4.Z-Score標(biāo)準(zhǔn)化

對(duì)agetrestbps、chol、thalach、oldpeak進(jìn)行標(biāo)準(zhǔn)化處理,將不同量級(jí)的數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一量度,提高數(shù)據(jù)可比性。

age sex cp trestbps chol fbs restecg thalach exang oldpeak slope ca thal target
1.350138 1 2 1.129702 -0.622046 0 0 0.008235 0 -0.196701 1 0 3 0
-0.174618 1 2 -0.128305 0.023539 1 0 1.004711 0 -0.890351 2 3 2 1
0.696671 1 3 0.100423 -0.204315 0 1 -0.20839 0 1.364011 1 2 2 0
-1.045907 1 1 -0.24267 1.200782 0 0 0.874736 0 -0.890351 2 0 2 1
-0.501351 1 0 0.672245 -0.8499 0 0 -1.031565 1 -0.109995 1 0 3 0
特征 均值 標(biāo)準(zhǔn)差
age 54.603306 9.1818
trestbps 132.243802 17.487967
chol 244.760331 52.665406
thalach 149.809917 23.081356
oldpeak 1.02686 1.15332

5.各字段基本統(tǒng)計(jì)信息

讀取數(shù)據(jù)表后,對(duì)各個(gè)數(shù)據(jù)字段統(tǒng)計(jì)基本信息,包括樣本數(shù)量、均值、標(biāo)準(zhǔn)差、最大最小值和上下四分位數(shù)等。

可以看出,讀取的數(shù)據(jù)表均為數(shù)值型字段。從這里可以發(fā)現(xiàn),各字段的樣本數(shù)均為 303 ,說(shuō)明無(wú)缺失值;此外。許多字段如sex、cp、fbs、restecg、exang、slope、cathal,其上下四分位數(shù)、中位數(shù)和最大最小值的取值有很大的重復(fù),結(jié)合數(shù)據(jù)集詳情頁(yè)的統(tǒng)計(jì)信息,說(shuō)明其為離散型數(shù)值字段;其余字段如agetrestbps等為連續(xù)型變量,在后期可以進(jìn)行標(biāo)準(zhǔn)化處理。

age sex cp trestbps chol fbs restecg thalach exang oldpeak slope ca thal target
樣本數(shù) 303 303 303 303 303 303 303 303 303 303 303 303 303 303
均值 54.3663366337 0.6831683168 0.9669966997 131.6237623762 246.2640264026 0.1485148515 0.5280528053 149.6468646865 0.3267326733 1.0396039604 1.399339934 0.7293729373 2.3135313531 0.5445544554
標(biāo)準(zhǔn)差 9.0821009898 0.4660108233 1.0320524895 17.5381428135 51.8307509879 0.3561978749 0.5258595964 22.9051611149 0.4697944645 1.1610750221 0.6162261453 1.022606365 0.6122765073 0.4988347842
最小值 29 0 0 94 126 0 0 71 0 0 0 0 0 0
下四分位數(shù) 47.5 0 0 120 211 0 0 133.5 0 0 1 0 2 0
中位數(shù) 55 1 1 130 240 0 1 153 0 0.8 1 0 2 1
上四分位數(shù) 61 1 2 140 274.5 0 1 166 1 1.6 2 1 3 1
最大值 77 1 3 200 564 1 2 202 1 6.2 2 4 3 1

6.年齡分布直方圖

選取age字段畫(huà)出直方圖??梢钥闯?,大多數(shù)患者年齡在38歲以上,說(shuō)明心臟病的主要患病人群是中老年人。

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)?

選取target字段畫(huà)出餅圖,可以看出,該數(shù)據(jù)集中患有心臟病的人群比例較高,但兩個(gè)類(lèi)別的樣本數(shù)量相差不大。

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)?

對(duì)K近鄰模型進(jìn)行評(píng)估。使用的方法主要為分類(lèi)報(bào)告、混淆矩陣和ROC曲線(xiàn)。

可以看到,我們構(gòu)建的K近鄰模型的分類(lèi)性能較為良好,總體分類(lèi)正確率(accuracy)達(dá)到0.87,macor avg F1-score能達(dá)到0.87,正類(lèi)樣本的召回率(Recall)能達(dá)到0.94,ROC_AUC值為0.88。

分類(lèi)報(bào)告(classification report)

標(biāo)簽 精確率(Precision) 召回率(Recall) F1值(F1-score)
0 0.92 0.79 0.85
1 0.84 0.94 0.89
accuracy 0.87 0.87 0.87
macro avg 0.88 0.86 0.87
weighted avg 0.87 0.87 0.87

混淆矩陣(confusion matrix)

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)

?

基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析,機(jī)器學(xué)習(xí)實(shí)戰(zhàn),數(shù)據(jù)挖掘,分類(lèi),人工智能,心臟病,機(jī)器學(xué)習(xí)?文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-803911.html

到了這里,關(guān)于基于數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)的心臟病患者分類(lèi)建模與分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿,該文觀(guān)點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

    1. 有監(jiān)督的機(jī)器學(xué)習(xí) : ????????分類(lèi) : ?????????????????KNN 最近鄰 ???????????????? 邏輯回歸 - 樸素貝葉斯估計(jì) ? ? ? ? ? ? ? ? ?SVM 線(xiàn)性 或 非線(xiàn)性 優(yōu)化模型 ?????????????????決策樹(shù)模型 - 隨機(jī)森林 - 其它集成模型 ?????????????????lig

    2024年04月29日
    瀏覽(577)
  • Python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

    Python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

    近年來(lái),Python編程語(yǔ)言受到越來(lái)越多科研人員的喜愛(ài),在多個(gè)編程語(yǔ)言排行榜中持續(xù)奪冠。同時(shí),伴隨著深度學(xué)習(xí)的快速發(fā)展,人工智能技術(shù)在各個(gè)領(lǐng)域中的應(yīng)用越來(lái)越廣泛。機(jī)器學(xué)習(xí)是人工智能的基礎(chǔ),因此,掌握常用機(jī)器學(xué)習(xí)算法的工作原理,并能夠熟練運(yùn)用Python建立實(shí)

    2024年02月11日
    瀏覽(86)
  • ElasticSearch的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

    ElasticSearch是一個(gè)開(kāi)源的搜索和分析引擎,它基于Lucene庫(kù)構(gòu)建,具有高性能、易用性和擴(kuò)展性。ElasticSearch可以用于實(shí)時(shí)搜索、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)等應(yīng)用場(chǎng)景。本文將涵蓋ElasticSearch的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)方面的核心概念、算法原理、最佳實(shí)踐以及實(shí)際應(yīng)用場(chǎng)景。 在ElasticSear

    2024年02月22日
    瀏覽(94)
  • 【Python】數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)(一)

    【Python】數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)(一)

    大家好 我是寸鐵?? 總結(jié)了一篇【Python】數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)(一)sparkles: 喜歡的小伙伴可以點(diǎn)點(diǎn)關(guān)注 ?? 問(wèn)題描述 請(qǐng)從一份數(shù)據(jù)中預(yù)測(cè)鮑魚(yú)的年齡,數(shù)據(jù)集在abalone.cvs中,數(shù)據(jù)集一共有4177 個(gè)樣本,每個(gè)樣本有9個(gè)特征。其中rings為鮑魚(yú)環(huán)數(shù),鮑魚(yú)每一年長(zhǎng)一環(huán),類(lèi)似樹(shù)輪,是

    2024年04月12日
    瀏覽(91)
  • 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí):Apripori算法

    數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí):Apripori算法

    目錄 第一關(guān):候選生成? 任務(wù)描述: 相關(guān)知識(shí): 一、Apripori算法候選生成: 二、Apripori算法候選生成代碼實(shí)現(xiàn): 編程要求: 測(cè)試說(shuō)明: 第二關(guān):候選剪枝 任務(wù)描述: 相關(guān)知識(shí): Apripori算法候選剪枝: Apripori算法候選剪枝代碼實(shí)現(xiàn): 編程要求: 測(cè)試說(shuō)明: 第三關(guān):基于遍

    2024年02月07日
    瀏覽(98)
  • 機(jī)器學(xué)習(xí)——數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘——期末復(fù)習(xí)(簡(jiǎn)答題)

    機(jī)器學(xué)習(xí)——數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘——期末復(fù)習(xí)(簡(jiǎn)答題)

    1 、試述真正例率(TPR)、假正例率(FPR)與查準(zhǔn)率(P)、查全率(R)之間的聯(lián)系。 查全率: 真實(shí)正例被預(yù)測(cè)為正例的比例 真正例率: 真實(shí)正例被預(yù)測(cè)為正例的比例 查全率與真正例率是相等的。 查準(zhǔn)率:預(yù)測(cè)為正例的實(shí)例中真實(shí)正例的比例 假正例率: 真實(shí)反例被預(yù)測(cè)為正例的

    2024年02月10日
    瀏覽(91)
  • Python 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)教程

    詳情點(diǎn)擊鏈接:Python 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) 一: Python編程 Python編程入門(mén) 1、Python環(huán)境搭建(?下載、安裝與版本選擇)。 2、如何選擇Python編輯器?(IDLE、Notepad++、PyCharm、Jupyter…) 3、Python基礎(chǔ)(數(shù)據(jù)類(lèi)型和變量、字符串和編碼、list和tuple、條件判斷、循環(huán)、函數(shù)的定義與調(diào)

    2024年02月16日
    瀏覽(96)
  • 機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用

    在數(shù)據(jù)挖掘的實(shí)踐中,各種機(jī)器學(xué)習(xí)算法都扮演著重要的角色,它們能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律和模式,并用于預(yù)測(cè)、分類(lèi)、聚類(lèi)等任務(wù)。以下是幾種常見(jiàn)的機(jī)器學(xué)習(xí)算法以及它們?cè)跀?shù)據(jù)挖掘任務(wù)中的應(yīng)用場(chǎng)景和優(yōu)缺點(diǎn)。 1. 決策樹(shù)(Decision Trees): ? ?- 應(yīng)用場(chǎng)景:決策樹(shù)廣泛應(yīng)

    2024年03月17日
    瀏覽(96)
  • 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘01- lasso regularization

    Lasso正則化是一種線(xiàn)性回歸中的正則化技術(shù),旨在減少模型的復(fù)雜性并防止過(guò)擬合。Lasso(Least Absolute Shrinkage and Selection Operator)通過(guò)在損失函數(shù)中添加正則項(xiàng),促使模型的系數(shù)變得稀疏,即某些系數(shù)會(huì)被壓縮到零,從而實(shí)現(xiàn)特征選擇。 在Lasso正則化中,我們引入了一個(gè)懲罰項(xiàng)

    2024年02月09日
    瀏覽(86)
  • 機(jī)器學(xué)習(xí)——數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘復(fù)習(xí)(選擇題、判斷題)

    1. 以下不是分類(lèi)問(wèn)題的是(? B )。 A. 用戶(hù)流失模型 B. 身高和體重關(guān)系 C. 信用評(píng)分 D. 營(yíng)銷(xiāo)響應(yīng) 2. 對(duì)于回歸分析,下列說(shuō)法錯(cuò)誤的是( D ) A. 在回歸分析中,變量間的關(guān)系若是非確定關(guān)系,那么因變量不能由自變量唯一確定 B. 線(xiàn)性相關(guān)系數(shù)可以是正的,也可以是負(fù)的 C. 回歸

    2024年02月06日
    瀏覽(117)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包