国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

2年前作者：葡萄成熟時_分類：Toy博客閱讀(29)違法舉報

這篇具有很好參考價值的文章主要介紹了數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例（7/16）：

2022 年首屆釘釘杯大學(xué)生大數(shù)據(jù)挑戰(zhàn)賽練習(xí)題目練習(xí)題 A：二手房房價分析與預(yù)測

要點：

1、機器學(xué)習(xí)

2、數(shù)據(jù)挖掘

3、數(shù)據(jù)清洗、分析、pyeahcrs可視化

4、隨機森林回歸預(yù)測模型預(yù)測房價

整體代碼：

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

過程代碼：

1、讀入數(shù)據(jù)、清洗數(shù)據(jù)：

import pandas as pd
import numpy as np
df=pd.read_csv("data.csv",encoding='utf-8')  #文件路徑為絕對路徑，根據(jù)自己電腦文件夾的路徑修改
df

df.info() #查看df信息

df.dropna(inplace=True) #刪除空值行
df.drop('Unnamed: 0',axis=1,inplace=True)  #刪除無用列
df

df=df.drop_duplicates()  ###消除重復(fù)記錄
df

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

2、解決相關(guān)問題：

（一）根據(jù)附件中的數(shù)據(jù)集，將二手房數(shù)據(jù)按照“區(qū)域”屬性進(jìn)行劃分，然后計算每個區(qū)域的二手房均價，最后將區(qū)域及對應(yīng)的房屋均價信息通過縱向條形圖顯示：

import re 
zonjia = []
for v in df['總價']:
    a = re.findall(r'\d+',str(v))[0] 
#     print(a)
    zonjia.append(int(a))
df['總價1'] = zonjia
df   #得到數(shù)字類型的總價1

df1_1 = df[['區(qū)域','總價1']].groupby('區(qū)域').mean()
df1_1.columns = ['區(qū)域均價'] 
df1_1['區(qū)域均價']  = df1_1['區(qū)域均價'].astype(int)
df1_1

#畫圖：
from pyecharts.charts import Bar
from pyecharts import options as opts
%matplotlib inline

bar = Bar()
bar.add_xaxis(list(df1_1.index)) 
bar.add_yaxis("單位：萬", list(df1_1['區(qū)域均價']))

bar.set_global_opts(title_opts=opts.TitleOpts(title="區(qū)域房屋均價"))
bar.render_notebook()
# bar.render()  #生成html

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

（二）根據(jù)附件的數(shù)據(jù)集，計算各個區(qū)域二手房數(shù)量占總二手房數(shù)量的百分比，并畫出餅狀圖：

df['計數(shù)'] =1
df1_2 = df[['區(qū)域','計數(shù)']].groupby('區(qū)域').count()
df1_2  #得到統(tǒng)計數(shù)據(jù)的dataform表格

#畫圖：
from pyecharts.charts import Pie
from pyecharts import options as opts
# 富文本
rich_text = {
    "a": {"color": "#999", "lineHeight": 22, "align": "center"},
    "abg": {
        "backgroundColor": "#e3e3e3",
        "width": "100%",
        "align": "right",
        "height": 22,
        "borderRadius": [4, 4, 0, 0],
    },
    "hr": {
        "borderColor": "#aaa",
        "width": "100%",
        "borderWidth": 0.5,
        "height": 0,
    },
    "b": {"fontSize": 16, "lineHeight": 33},
    "per": {
        "color": "#eee",
        "backgroundColor": "#334455",
        "padding": [2, 4],
        "borderRadius": 2,
    },
}


# 虛假數(shù)據(jù)
cate = list(df1_2.index)
data = list(df1_2['計數(shù)']) 

pie = (Pie()
       .add('二手房數(shù)量', [list(z) for z in zip(cate, data)],
       label_opts=opts.LabelOpts(position='outsiede',
                     formatter="{a|{a}}{abg|}\n{hr|}\n {b|: }{c}  {per|n5n3t3z%}  ",
                     rich=rich_text))
       )

pie.render_notebook()

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

（三）將二手房按照“裝修”屬性進(jìn)行劃分，然后計算不同裝修程度的二手房數(shù)量，并用條形圖顯示不同裝修程度二手房的數(shù)量。：

df1_3 = df[['裝修','計數(shù)']].groupby('裝修').count()
df1_3

from pyecharts.charts import Bar
from pyecharts import options as opts
%matplotlib inline

bar = Bar()
bar.add_xaxis(list(df1_3.index))  
bar.add_yaxis("統(tǒng)計數(shù)量", list(df1_3['計數(shù)']))

bar.set_global_opts(title_opts=opts.TitleOpts(title="裝修程度統(tǒng)計"))
bar.render_notebook()
# bar.render()  #生成html

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

3、機器學(xué)習(xí)隨機森林建模預(yù)測房價：

（一）將二手房按照戶型進(jìn)行分組，然后提取前 5 組最熱門的二手房戶型（出售數(shù)量最多的 5 組戶型），最后計算這 5 個熱門戶型的均價并畫圖顯示。

df2_1 = df[['戶型','計數(shù)']].groupby('戶型').count()
df2_1
df2_1.sort_values(by='計數(shù)',axis=0,ascending=False,inplace=True)
df2_1

names = list(df2_1.index[0:5])
names

df2_1_1 = df[['戶型','總價1']].groupby('戶型').mean()
df2_1_1
datas = []
for v in names:
    datas.append(int(df2_1_1.loc[v]))
datas

from pyecharts import options as opts
from pyecharts.charts import Bar,Line,Grid
B = ["草莓","芒果","葡萄","雪梨","西瓜","檸檬","車?yán)遄?]
CB = [78,95,120,102,88,108,98]


line = Line()
line.add_xaxis(names)

line.add_yaxis("均價單位：萬",datas)
line.set_global_opts(title_opts=opts.TitleOpts(title="最熱五戶型均價"),
                    legend_opts=opts.LegendOpts())
line.render_notebook()

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

（二）選擇附件中適合的屬性，建立模型預(yù)測二手房的價格

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

特征工程：（提取出數(shù)字?jǐn)?shù)據(jù)，拆分?jǐn)?shù)據(jù)、特征編碼等：）

df2 = df.drop(['小區(qū)名字','計數(shù)','總價'],axis=1)   #刪除明顯無關(guān)的特征列
df2

# 字符型數(shù)據(jù)和離散型數(shù)據(jù)轉(zhuǎn)為數(shù)字特征：

df2['建筑面積1'] = df2['建筑面積'].str[:-2]
df2 
df2['單價1'] = df2['單價'].str[:-4]
df2 

shi = []
ting = []
wei = []
for v in df2['戶型']:
    re_ = re.findall(r'\d+',v) 
#     print(re_)
    if len(re_) >=3:
        shi.append(re_[0])
        ting.append(re_[1])
        wei.append(re_[2])
    else:
        shi.append(0)
        ting.append(0)
        wei.append(0)
    
df2['室'] = shi
df2['廳'] =ting
df2['衛(wèi)'] =wei

df2

df2 = df2.drop(['戶型','建筑面積','單價'],axis=1)  #刪除無用的列
df2

df2 = df2.drop(['戶型','建筑面積','單價'],axis=1)  #刪除無用的列
df2

# 將字符標(biāo)簽或者類別數(shù)字化
df2['朝向'] = pd.Categorical(df2['朝向']).codes
df2
df2['樓層'] = pd.Categorical(df2['樓層']).codes
df2['裝修'] = pd.Categorical(df2['裝修']).codes
df2['區(qū)域'] = pd.Categorical(df2['區(qū)域']).codes
df2

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

建模：

y=df2.iloc[:,-4]  #目標(biāo)列
y
x=df2.drop('單價1',axis=1)
x #特征列數(shù)據(jù)
#劃分?jǐn)?shù)據(jù)集：
from sklearn.model_selection import train_test_split

x_train,x_test,y_train,y_test = train_test_split(x,y,
                                                 test_size=0.30,
                                                 random_state=100,
                                                
                                                    )
# 顯示訓(xùn)練集和測試集的維度
print("x_train.shape:",x_train.shape)
print("x_test.shape:",x_test.shape)
print("y_train.shape:",y_train.shape)
print('y_test.shape:',y_test.shape)

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import GridSearchCV
# 隨機森林去進(jìn)行預(yù)測
rf = RandomForestRegressor()

#設(shè)置網(wǎng)格超參數(shù)
param = {"n_estimators": [120,200,300,500,800,1200], "max_depth": [5, 8, 15, 25, 30]}

# 超參數(shù)調(diào)優(yōu)
gc = GridSearchCV(rf, param_grid=param, cv=2)   #網(wǎng)格搜索與交叉驗證

gc.fit(x_train, y_train)
y_pre=gc.predict(x_test)
print(y_pre)#輸出預(yù)測值
print("隨機森林預(yù)測的準(zhǔn)確率為：", gc.score(x_test, y_test))   #會運行一段時間

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

print("最佳參數(shù)：",gc.best_params_)
print("最佳分?jǐn)?shù)：",gc.best_score_)
print("最佳估計器:",gc.best_estimator_)
print("交叉驗證結(jié)果：\n",gc.cv_results_)

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：

最后（源碼）：

這樣一個簡單的數(shù)據(jù)挖掘?qū)嵺`案例就做好了，我還有很多平時積累的案例，后續(xù)我會持續(xù)編寫分享的，如果您覺得有一定的意義，請點個關(guān)注唄，您的支持是我創(chuàng)作的最大動力，如果需要源碼：

鏈接：https://pan.baidu.com/s/1BIXUNwOrSEydEskuOB-_6g
提取碼：8848

數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：文章來源地址http://www.zghlxwxcb.cn/news/detail-465597.html

到了這里，關(guān)于數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)崙?zhàn)案例本地房價預(yù)測（716）：的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

Python數(shù)據(jù)挖掘：入門、進(jìn)階與實用案例分析——基于非侵入式負(fù)荷檢測與分解的電力數(shù)據(jù)挖掘
本案例將根據(jù)已收集到的電力數(shù)據(jù)，深度挖掘各電力設(shè)備的電流、電壓和功率等情況，分析各電力設(shè)備的實際用電量，進(jìn)而為電力公司制定電能能源策略提供一定的參考依據(jù)。更多詳細(xì)內(nèi)容請參考《Python數(shù)據(jù)挖掘：入門進(jìn)階與實用案例分析》一書。為了更好地監(jiān)測用電設(shè)備的
2024年02月08日
瀏覽(25)
數(shù)據(jù)挖掘?qū)崙?zhàn)（2）：信用卡詐騙分析
??????????歡迎來到我的博客?????????? ??作者：秋無之地 ??簡介：CSDN爬蟲、后端、大數(shù)據(jù)領(lǐng)域創(chuàng)作者。目前從事python爬蟲、后端和大數(shù)據(jù)等相關(guān)工作，主要擅長領(lǐng)域有：爬蟲、后端、大數(shù)據(jù)開發(fā)、數(shù)據(jù)分析等。 ??歡迎小伙伴們點贊????、收藏
2024年02月07日
瀏覽(153)
python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(商品零售購物籃分析）
? ? ? ? 購物籃分析是商業(yè)領(lǐng)域最前沿、最具挑戰(zhàn)性的問題之一，也是許多企業(yè)重點研究的問題。購物籃分析是通過發(fā)現(xiàn)顧客在一次購買行為中放入購物籃中不同商品之間的關(guān)聯(lián)，研究顧客的購買行為，從而輔助零售企業(yè)制定營銷策略的一種數(shù)據(jù)分析方法。 ? ? ? ?本篇文章
2024年02月06日
瀏覽(46)
大數(shù)據(jù)圖書推薦：Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)（第2版）
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)（第2版）》的配套學(xué)習(xí)視頻，課程內(nèi)容共分為基礎(chǔ)篇（第1~5章）和實戰(zhàn)篇（第6~11章）。 ? ? ?基礎(chǔ)篇內(nèi)容包括數(shù)據(jù)挖掘的概述、基本流程、常用工具、開發(fā)環(huán)境，Python數(shù)據(jù)挖掘的編程基礎(chǔ)、數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘算法基礎(chǔ)等基礎(chǔ)知識；
2024年02月02日
瀏覽(25)
GEO生信數(shù)據(jù)挖掘（六）實踐案例——四分類結(jié)核病基因數(shù)據(jù)預(yù)處理分析
前面五節(jié)，我們使用阿爾茲海默癥數(shù)據(jù)做了一個數(shù)據(jù)預(yù)處理案例，包括如下內(nèi)容： GEO生信數(shù)據(jù)挖掘（一）數(shù)據(jù)集下載和初步觀察 GEO生信數(shù)據(jù)挖掘（二）下載基因芯片平臺文件及注釋 GEO生信數(shù)據(jù)挖掘（三）芯片探針I(yè)D與基因名映射處理 GEO生信數(shù)據(jù)挖掘（四）數(shù)據(jù)清洗（離群值
2024年02月07日
瀏覽(66)
【數(shù)據(jù)挖掘?qū)崙?zhàn)】——輿情分析：對微博文本進(jìn)行情緒分類
???♂? 個人主頁：@Lingxw_w的個人主頁 ???作者簡介：計算機科學(xué)與技術(shù)研究生在讀 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對你有幫助的話，歡迎評論 ??點贊???? 收藏 ??加關(guān)注+ ? 目錄一、背景介紹二、比賽任務(wù)
2024年02月08日
瀏覽(22)
Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)期末考復(fù)習(xí)（抱佛腳啦）
期末三天賽高考我真的會謝，三天學(xué)完數(shù)據(jù)挖掘……真的很極限了的。課本是那本綠色的Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)（第2版），作者張良均 … 圖片來自老師給的ppt，以下內(nèi)容是我自己總結(jié)的，自己復(fù)習(xí)用，覆蓋了老師給畫的重點考點，八九不離十，期末考抱佛腳的可以看看
2024年02月08日
瀏覽(22)
第七篇【傳奇開心果系列】Python自動化辦公庫技術(shù)點案例示例：深度解讀數(shù)據(jù)分析數(shù)據(jù)挖掘的幾個重要算法為代表的核心技術(shù)
在對大學(xué)生數(shù)據(jù)分析和數(shù)據(jù)挖掘時，會接觸到許多重要的算法，這些算法代表了數(shù)據(jù)分析和數(shù)據(jù)挖掘領(lǐng)域中的一些核心技術(shù)，大學(xué)生可以通過學(xué)習(xí)和實踐這些算法為代表的核心技術(shù)來提升自己的數(shù)據(jù)分析能力和數(shù)據(jù)挖掘探索分析能力。深入理解這些算法為代表的核心技術(shù)的原
2024年03月19日
瀏覽(34)
第六篇【傳奇開心果系列】Python的自動化辦公庫技術(shù)點案例示例：大學(xué)生數(shù)據(jù)全方位分析挖掘經(jīng)典案例
Pandas在大學(xué)生數(shù)據(jù)的分析和挖掘中發(fā)揮著重要作用，幫助研究人員和教育工作者更好地理解大學(xué)生群體、優(yōu)化教學(xué)管理和提升教育質(zhì)量。 Pandas庫可以用來分析挖掘大學(xué)生數(shù)據(jù)的各各方面，包括但不限于：學(xué)生成績數(shù)據(jù)：可以通過Pandas對大學(xué)生的成績數(shù)據(jù)進(jìn)行統(tǒng)計分析、可視
2024年03月15日
瀏覽(39)
關(guān)聯(lián)規(guī)則挖掘（上）：數(shù)據(jù)分析 | 數(shù)據(jù)挖掘 | 十大算法之一
??????????歡迎來到我的博客?????????? ??作者：秋無之地 ??簡介：CSDN爬蟲、后端、大數(shù)據(jù)領(lǐng)域創(chuàng)作者。目前從事python爬蟲、后端和大數(shù)據(jù)等相關(guān)工作，主要擅長領(lǐng)域有：爬蟲、后端、大數(shù)據(jù)開發(fā)、數(shù)據(jù)分析等。 ??歡迎小伙伴們點贊????、收藏
2024年02月07日
瀏覽(32)