国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【數(shù)據(jù)挖掘】練習6:上機題目

這篇具有很好參考價值的文章主要介紹了【數(shù)據(jù)挖掘】練習6:上機題目。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

練習6:上機題目

一:實驗?zāi)康呐c要求

1:了解R語言中各種圖形元素的添加方法,并能夠靈活應(yīng)用這些元素。

2:了解R語言中的各種圖形函數(shù),掌握常見圖形的繪制方法。

二:實驗內(nèi)容

1:某銀行在降低貸款拖欠率的數(shù)據(jù) bankloan 的示例數(shù)據(jù)。

2:比較違約與不違約情形不同特征的人群分布。

3:探索不同特征的人群收入與負債的分布情況。口 探索不同特征的人群收入與負債的關(guān)系。

三:實驗方法與步驟

1)數(shù)據(jù)預(yù)處理,調(diào)整數(shù)據(jù)類型,按照年齡、工齡分組。

2)繪制違約與不違約客戶的年齡、教育和工齡的條形圖、Cleveland 點圖。

3)繪制不同年齡、教育和工齡的客戶收入與負債的直方圖、核密度圖、箱線圖、小揭琴圖。

4)繪制不同年齡、教育和工齡下客戶的收入與負債的散點圖。

第1步:讀入數(shù)據(jù)

bankloan <- read.csv(file="bankloan.csv", header=T)

bankloan

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第2步:按照年齡分組

(agesort <- cut(bankloan$age,c(0,10,20,30,40,50,60)))

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R


第3步:按照工齡分組

(worksort <- cut(bankloan$seniority,c(0,5,10,20,30,40), include.lowest = T))

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第4步:繪制違約與不違約客戶的年齡條形圖

library(ggplot2)

ggplot(data=bankloan,aes(x=agesort,fill=agesort))+geom_bar()+facet_wrap(~default)

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第5步:繪制違約與不違約客戶的教育條形圖

ggplot(data=bankloan,aes(x=education,fill=education))+geom_bar()+facet_wrap(~default)

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第6步:繪制違約與不違約客戶的工齡條形圖

ggplot(data=bankloan,aes(x=worksort,fill=worksort))+geom_bar()+facet_wrap(~default)

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第7步:繪制違約與不違約客戶的年齡Cleveland點圖

ggplot(data=bankloan,aes(x=age,y=age))+geom_point()+facet_wrap(~default)

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R


第8步:繪制違約與不違約客戶的教育Cleveland點圖

ggplot(data=bankloan,aes(x=education,y=education))+geom_point()+facet_wrap(~default)

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第9步:繪制違約與不違約客戶的工齡Cleveland點圖

ggplot(data=bankloan,aes(x=seniority,y=seniority))+geom_point()+facet_wrap(~default)

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

?

第10步:繪制不同年齡的客戶收入與負債的直方圖

ggplot(data=bankloan,aes(x=age,group=factor(income)))+geom_histogram()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第11步:繪制不同教育的客戶收入與負債的直方圖

ggplot(data=bankloan,aes(x=education,group=factor(income)))+geom_histogram()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第12步:繪制不同工齡的客戶收入與負債的直方圖

ggplot(data=bankloan,aes(x=seniority,group=factor(income)))+geom_histogram()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第13步:繪制不同年齡的客戶收入與負債的核密度圖

ggplot(data=bankloan,aes(x=income,group=factor(age),colour=factor(age)))+geom_density()

ggplot(data=bankloan,aes(x=debt_rate,group=factor(age),colour=factor(age)))+geom_density()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第14步:繪制不同教育的客戶收入與負債的核密度圖

ggplot(data=bankloan,aes(x=income,group=factor(education),colour=factor(education)))+geom_density()

ggplot(data=bankloan,aes(x=debt_rate,group=factor(education),colour=factor(education)))+geom_density()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第15步:繪制不同工齡的客戶收入與負債的核密度圖

ggplot(data=bankloan,aes(x=income,group=factor(seniority),colour=factor(seniority)))+geom_density()

ggplot(data=bankloan,aes(x=debt_rate,group=factor(seniority),colour=factor(seniority)))+geom_density()

?【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第16步:繪制不同年齡的客戶收入與負債的箱線圖

ggplot(bankloan,aes(x=age,y=income))+geom_boxplot()

ggplot(bankloan,aes(x=age,y=debt_rate))+geom_boxplot()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第17步:繪制不同教育的客戶收入與負債的箱線圖

ggplot(bankloan,aes(x=education,y=income))+geom_boxplot()

ggplot(bankloan,aes(x=education,y=debt_rate))+geom_boxplot()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第18步:繪制不同工齡的客戶收入與負債的箱線圖

ggplot(bankloan,aes(x=seniority,y=income))+geom_boxplot()

ggplot(bankloan,aes(x=seniority,y=debt_rate))+geom_boxplot()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第19步:繪制不同年齡的客戶收入與負債的小揭琴圖

ggplot(bankloan,aes(factor(age),income))+geom_violin()

ggplot(bankloan,aes(factor(age),debt_rate))+geom_violin()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

第20步:繪制不同教育的客戶收入與負債的小揭琴圖

ggplot(bankloan,aes(factor(education),income))+geom_violin()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R


第21步:繪制不同工齡的客戶收入與負債的小揭琴圖

ggplot(bankloan,aes(factor(seniority),income))+geom_violin()

ggplot(bankloan,aes(factor(seniority),debt_rate))+geom_violin()

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

?【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

?

第22步:繪制不同年齡下客戶的收入與負債的散點圖。

ggplot(bankloan,aes(income,debt_rate))+geom_point(aes(colour=factor(age)))

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R


第23步:繪制不同教育下客戶的收入與負債的散點圖。

ggplot(bankloan,aes(income,debt_rate))+geom_point(aes(colour=factor(education)))

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R


第24步:繪制不同工齡下客戶的收入與負債的散點圖。

ggplot(bankloan,aes(income,debt_rate))+geom_point(aes(colour=factor(seniority)))

【數(shù)據(jù)挖掘】練習6:上機題目,專業(yè)選修課系列,數(shù)據(jù)挖掘,人工智能,R

四:思考與實驗總結(jié)

1)如何選擇繪制的圖形類型?

選擇繪制的圖形類型通常取決于數(shù)據(jù)的類型和分析的目的。

柱狀圖(Bar Plot):用于顯示不同類別之間的頻數(shù)或數(shù)量關(guān)系。適用于比較類別變量之間的差異。

折線圖(Line Plot):用于顯示連續(xù)變量隨時間或其他有序變量的變化。適用于顯示趨勢和變化的方向。

散點圖(Scatter Plot):用于顯示兩個連續(xù)變量之間的關(guān)系。適用于發(fā)現(xiàn)變量之間的相關(guān)性和觀察異常值。

箱線圖(Box Plot):用于顯示連續(xù)變量的分布情況,包括中位數(shù)、四分位數(shù)和異常值。適用于比較多個組的分布,并識別異常值。

直方圖(Histogram):用于顯示連續(xù)變量的分布情況。適用于了解數(shù)據(jù)的分布形狀和集中程度。

密度圖(Density Plot):用于顯示連續(xù)變量的分布密度估計。適用于比較兩個或多個分布,并觀察它們之間的重疊程度。

小提琴圖(Violin Plot):結(jié)合了箱線圖和密度圖的特點,展示了數(shù)據(jù)的分布形狀和中位數(shù)。適用于比較多個組的分布,并觀察它們之間的差異。

Cleveland 點圖(Cleveland Dot Plot):用于顯示類別變量和連續(xù)變量之間的關(guān)系。適用于顯示組內(nèi)變量的分布情況和組間的差異。

2)如何向原始圖形添加合適的圖形元素,使圖形簡單明了且更能表達數(shù)據(jù)含義?

添加合適的圖形元素可以幫助圖形更加清晰地傳達數(shù)據(jù)的含義。常見的圖形元素如下:

標題(Title):描述圖形內(nèi)容和目的,使讀者可以快速理解圖形。

坐標軸標簽(Axis Labels):標明 x 軸和 y 軸的含義,提供數(shù)據(jù)的單位或范圍。

圖例(Legend):用于解釋圖形中的顏色或圖案代表的含義,特別適用于多組數(shù)據(jù)的比較。

參考線(Reference Lines):在圖形中添加水平線或垂直線,表示特定數(shù)值或閾值,有助于對比數(shù)據(jù)和發(fā)現(xiàn)模式。

數(shù)據(jù)標簽(Data Labels):在圖形中添加數(shù)據(jù)點的數(shù)值標簽,使得讀者可以直觀地了解數(shù)據(jù)。

注釋(Annotations):添加文字說明或箭頭指向特定數(shù)據(jù)點或趨勢,提供更多背景信息或關(guān)鍵觀察。

圖形形狀(Geometric Shapes):在圖形中添加幾何形狀,如矩形、圓形等,以突出或強調(diào)特定區(qū)域或數(shù)據(jù)。

背景色(Background Color):調(diào)整圖形背景色,使得圖形更具對比度或吸引力。文章來源地址http://www.zghlxwxcb.cn/news/detail-854866.html

到了這里,關(guān)于【數(shù)據(jù)挖掘】練習6:上機題目的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 【數(shù)據(jù)挖掘競賽】零基礎(chǔ)入門數(shù)據(jù)挖掘-二手汽車價格預(yù)測

    【數(shù)據(jù)挖掘競賽】零基礎(chǔ)入門數(shù)據(jù)挖掘-二手汽車價格預(yù)測

    目錄 一、導入數(shù)據(jù)? 二、數(shù)據(jù)查看 可視化缺失值占比? 繪制所有變量的柱形圖,查看數(shù)據(jù) 查看各特征與目標變量price的相關(guān)性 三、數(shù)據(jù)處理 ?處理異常值 查看seller,offerType的取值 查看特征 notRepairedDamage? ?異常值截斷 ?填充缺失值? ?刪除取值無變化的特征 查看目標變量p

    2023年04月27日
    瀏覽(25)
  • 數(shù)據(jù)挖掘-實戰(zhàn)記錄(一)糖尿病python數(shù)據(jù)挖掘及其分析

    數(shù)據(jù)挖掘-實戰(zhàn)記錄(一)糖尿病python數(shù)據(jù)挖掘及其分析

    一、準備數(shù)據(jù) 1.查看數(shù)據(jù) 二、數(shù)據(jù)探索性分析 1.數(shù)據(jù)描述型分析 2.各特征值與結(jié)果的關(guān)系 a)研究各個特征值本身類別 b)研究懷孕次數(shù)特征值與結(jié)果的關(guān)系 c)其他特征值 3.研究各特征互相的關(guān)系 三、數(shù)據(jù)預(yù)處理 1.去掉唯一屬性 2.處理缺失值 a)標記缺失值 b)刪除缺失值行數(shù) ?c

    2024年02月11日
    瀏覽(23)
  • 數(shù)據(jù)挖掘(3.1)--頻繁項集挖掘方法

    數(shù)據(jù)挖掘(3.1)--頻繁項集挖掘方法

    目錄 1.Apriori算法 Apriori性質(zhì) 偽代碼 apriori算法 apriori-gen(Lk-1)【候選集產(chǎn)生】 has_infrequent_subset(c,Lx-1)【判斷候選集元素】 例題 求頻繁項集: 對于頻繁項集L={B,C,E},可以得到哪些關(guān)聯(lián)規(guī)則: 2.FP-growth算法 FP-tree構(gòu)造算法【自頂向下建樹】 insert_tree([plP],T) 利用FP-tree挖掘頻繁項集

    2023年04月09日
    瀏覽(29)
  • 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

    數(shù)據(jù)挖掘(Data mining),又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge-Discovery in Databases,KDD)中的一個步驟。 數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中的信息的過程。 數(shù)據(jù)挖掘通常與計算機科學有關(guān),并通過統(tǒng)計、在線分析處理、情報檢索、

    2024年02月06日
    瀏覽(27)
  • 數(shù)據(jù)挖掘與圖像挖掘:計算機視覺的創(chuàng)新

    計算機視覺是人工智能領(lǐng)域的一個重要分支,它涉及到計算機對圖像和視頻數(shù)據(jù)進行分析和理解。數(shù)據(jù)挖掘則是數(shù)據(jù)科學領(lǐng)域的一個核心技術(shù),它涉及到從大量數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和規(guī)律。隨著數(shù)據(jù)量的增加,數(shù)據(jù)挖掘技術(shù)在計算機視覺領(lǐng)域得到了廣泛應(yīng)用,以提高計算機

    2024年04月17日
    瀏覽(29)
  • 《數(shù)據(jù)挖掘基礎(chǔ)》實驗:Weka平臺實現(xiàn)關(guān)聯(lián)規(guī)則挖掘

    《數(shù)據(jù)挖掘基礎(chǔ)》實驗:Weka平臺實現(xiàn)關(guān)聯(lián)規(guī)則挖掘

    進一步理解關(guān)聯(lián)規(guī)則算法(Apriori算法、FP-tree算法),利用weka實現(xiàn)數(shù)據(jù)集的挖掘處理,學會調(diào)整模型參數(shù),讀懂挖掘規(guī)則,解釋規(guī)則的含義 (1)隨機選取數(shù)據(jù)集為對象,完成以下內(nèi)容:(用兩種方法:Apriori算法、FP-tree算法) 文件導入與編輯; 參數(shù)設(shè)置說明; 結(jié)果截圖;

    2024年02月02日
    瀏覽(98)
  • 數(shù)據(jù)挖掘|序列模式挖掘及其算法的python實現(xiàn)

    序列(sequence)模式挖掘也稱為序列分析。 序列模式發(fā)現(xiàn)(Sequential Patterns Discovery)是由R.Agrawal于1995年首先提出的。 序列模式尋找的是事件之間在順序上的相關(guān)性。 例如,“凡是買了噴墨打印機的顧客中,80%的人在三個月之后又買了墨盒”,就是一個序列關(guān)聯(lián)規(guī)則。對于保險

    2024年04月09日
    瀏覽(31)
  • 數(shù)據(jù)挖掘(7.1)--數(shù)據(jù)倉庫

    數(shù)據(jù)挖掘(7.1)--數(shù)據(jù)倉庫

    目錄 引言 一、數(shù)據(jù)庫 1.簡介 2.數(shù)據(jù)庫管理系統(tǒng)(DBMS) 二、數(shù)據(jù)倉庫 數(shù)據(jù)倉庫特征 數(shù)據(jù)倉庫作用 數(shù)據(jù)倉庫和DBMS對比 分離數(shù)據(jù)倉庫和數(shù)據(jù)庫 數(shù)據(jù)倉庫的歷史可以追溯到20世紀60年代,當時計算機領(lǐng)域的主要工作是創(chuàng)建運行在主文件上的單個應(yīng)用,這些應(yīng)用以報表處理和程序為特

    2024年02月08日
    瀏覽(19)
  • 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘小結(jié)

    數(shù)據(jù)倉庫與數(shù)據(jù)挖掘小結(jié)

    更加詳細的只找得到pdf版本? 填空10分 判斷并改錯10分 計算8分 綜合20分 客觀題 填空10分 判斷并改錯10分--錯的要改 mooc中的--尤其考試題 ? 名詞解釋12分 4個,每個3分 經(jīng)常碰到的專業(yè)術(shù)語 簡答題40分 5個,每道8分 綜合 畫 roc 曲線 類似于和計算相關(guān)的題目 C1 什么是數(shù)據(jù)挖掘?

    2024年01月22日
    瀏覽(26)
  • 數(shù)據(jù)挖掘與數(shù)據(jù)分析

    目錄 數(shù)據(jù)挖掘與數(shù)據(jù)分析 一.數(shù)據(jù)的本質(zhì) 二.什么是數(shù)據(jù)挖掘和數(shù)據(jù)分析 三.數(shù)據(jù)挖掘和數(shù)據(jù)分析有什么區(qū)別 案例及應(yīng)用 1. 基于分類模型的案例 2. 基于預(yù)測模型的案例 3. 基于關(guān)聯(lián)分析的案例 4. 基于聚類分析的案例 5. 基于異常值分析的案例 6. 基于協(xié)同過濾的案例 7. 基于

    2024年04月28日
    瀏覽(21)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包