国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

這篇具有很好參考價值的文章主要介紹了python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

前言

嗨嘍~大家好呀,這里是魔王吶 ? ~!

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

今天我們的目的想必大家看標題就能明白了~

準備

首先,我們要提前準備好數(shù)據(jù)

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

然后打開我們的數(shù)據(jù)分析工具: Jupyter

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

代碼及效果展示

導入模塊

# 導入做數(shù)據(jù)處理的模塊pandas
import pandas as pd
# 導入繪圖模塊pyecharts,*號代表模塊里面的所有圖形
from pyecharts.charts import *
from pyecharts import options as opts
數(shù)據(jù)處理
1.讀取數(shù)據(jù)

導入數(shù)據(jù)

設置編碼encoding='gbk'

設置解釋器為engine='python'

df = pd.read_csv('二手房數(shù)據(jù).csv', encoding='gbk', engine='python')
df

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

2.查看表格數(shù)據(jù)描述

describe可以直接計算數(shù)值類型數(shù)據(jù)的平均值,標準差

df.describe()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

3.查看表格是否有數(shù)據(jù)缺失

通過isnull查找出包含缺失值的字段

然后進行求和,計算每一列的缺失數(shù)據(jù)的數(shù)量

df.isnull().sum()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

可以看到電梯數(shù)據(jù)缺失8257行

4.查看電梯列共有幾種值

通過unique可以統(tǒng)計數(shù)據(jù)里面出現(xiàn)了幾種值

方便后面進行填充

df['電梯'].unique()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

5.缺失值填充

用“未知”填充缺失值

缺失值的處理方式有兩種

第一種刪除,第二種填補

  • 缺失值少,就直接刪除

  • 缺失值多,就進行填補

這里缺失值占比較多,所以進行填補

df['電梯'].fillna('未知',inplace=True)
# 填補之后查看是否還有缺失值
df.isnull().sum()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

6.查看房屋朝向數(shù)據(jù)

查看朝向值的種類

df['朝向'].unique()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

朝向數(shù)據(jù)包含了‘西南’和‘南西’兩個方向,將其合并為一個方向‘西南’:

# replace(被替換的值,替換后的值):
df['朝向'] = df['朝向'].str.replace('南西','西南')
df['朝向'].unique()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

可以看到,豐臺、朝陽、海淀、昌平在售的房源數(shù)量最多,高達12000多套,占了總量的1/2

?? 博主文章素材、解答、源碼、教程領(lǐng)取處:點擊

Pyecharts可視化

1.統(tǒng)計各城區(qū)二手房數(shù)據(jù)

# 這里我們要用到分組
g = df.groupby('市區(qū)')
df_region = g.count()['小區(qū)']
region = df_region.index.tolist()
count = df_region.values.tolist()
df_region

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

1.各城區(qū)二手房數(shù)量北京市地圖
# 各城區(qū)二手房數(shù)量北京市地圖
new = [x + '區(qū)' for x in region]
m = (
        Map()
        .add('北京市', [list(z) for z in zip(new, count)], '北京')
        .set_global_opts(
            title_opts=opts.TitleOpts(title='北京市二手房各區(qū)分布'),
            visualmap_opts=opts.VisualMapOpts(max_=3000),
        )
    )
m.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

2.各城區(qū)二手房數(shù)量-平均價格柱狀圖
df_price = g.mean()['價格(萬元)']
df_price = round(df_price,2)
price = df_price.values.tolist()
bar = (
    Bar()
    .add_xaxis(region)
    .add_yaxis('數(shù)量',count,
              label_opts=opts.LabelOpts(is_show=True)
              )
    .extend_axis(
        yaxis=opts.AxisOpts(
            name='價格(萬元)',
            type_='value',
            min_=200,
            max_=900,
            interval=100,
            axislabel_opts=opts.LabelOpts(formatter='{value}')
        )
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title='各城區(qū)二手房數(shù)量-平均價格柱狀圖'),
        tooltip_opts=opts.TooltipOpts(
            is_show=True, trigger="axis", axis_pointer_type="cross"
        ),
        xaxis_opts=opts.AxisOpts(
            type_="category",
            axispointer_opts=opts.AxisPointerOpts(is_show=True, type_="shadow"),
        ),
        yaxis_opts=opts.AxisOpts(name='數(shù)量',
            axistick_opts=opts.AxisTickOpts(is_show=True),
            splitline_opts=opts.SplitLineOpts(is_show=False),)
    )
)
line2 = (
    Line()
    .add_xaxis(xaxis_data=region)
    .add_yaxis(
        series_name="價格",
        yaxis_index=1,
        y_axis=price,
        label_opts=opts.LabelOpts(is_show=True),
        z=10
        )
)
bar.overlap(line2)
grid = Grid()
grid.add(bar, opts.GridOpts(pos_left="5%", pos_right="20%"), is_control_axis_index=True)
grid.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

3.二手房價格最低Top15
top_price = df.sort_values(by='價格(萬元)')[:15]
top_price

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

area0 = top_price['小區(qū)'].values.tolist()
count = top_price['價格(萬元)'].values.tolist()

bar = (
    Bar()
    .add_xaxis(area0)
    .add_yaxis('數(shù)量', count, category_gap='50%')
    .set_global_opts(
        yaxis_opts=opts.AxisOpts(name='價格(萬元)'),
        xaxis_opts=opts.AxisOpts(name='數(shù)量'),
        datazoom_opts=opts.DataZoomOpts(type_='slider')
    )
)
bar.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

4 二手房總價與面積散點圖
s = (
    Scatter()
    .add_xaxis(df['面積(㎡)'].values.tolist())
    .add_yaxis('',df['價格(萬元)'].values.tolist())
    .set_global_opts(xaxis_opts=opts.AxisOpts(type_='value'))
)
s.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

5.房屋朝向餅圖
g = df.groupby('朝向')
g.count()['小區(qū)']

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

df_direction =  g.count()['小區(qū)']
df_direction

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

directions = df_direction.index.tolist()
count = df_direction.values.tolist()

c1 = (
    Pie(init_opts=opts.InitOpts(
            width='800px', height='600px',
            )
       )
        .add(
        '',
        [list(z) for z in zip(directions, count)],
        radius=['20%', '60%'],
        center=['40%', '50%'],
#         rosetype="radius",
        label_opts=opts.LabelOpts(is_show=True),
        )    
        .set_global_opts(title_opts=opts.TitleOpts(title='房屋朝向占比',pos_left='33%',pos_top="5%"),
                        legend_opts=opts.LegendOpts(type_="scroll", pos_left="80%",pos_top="25%",orient="vertical")
                        )
        .set_series_opts(label_opts=opts.LabelOpts(formatter=':{c} (n5n3t3z%)'),position="outside")
    )
c1.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

6.裝修情況/有無電梯玫瑰圖
g1 = df.groupby('裝修情況')
g1.count()['小區(qū)']
g2 = df.groupby('電梯')
g2.count()['小區(qū)']

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

df_fitment =  g1.count()['小區(qū)']
df_direction =  g2.count()['小區(qū)']
df_fitment

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

fitment = df_fitment.index.tolist()
count1 = df_fitment.values.tolist()

directions = df_direction.index.tolist()
count2 = df_direction.values.tolist()

bar = (
    Bar()
    .add_xaxis(fitment)
    .add_yaxis('', count1, category_gap = '50%')
    .reversal_axis()
    .set_series_opts(label_opts=opts.LabelOpts(position='right'))    
    .set_global_opts(
        xaxis_opts=opts.AxisOpts(name='數(shù)量'),
        title_opts=opts.TitleOpts(title='裝修情況/有無電梯玫瑰圖(組合圖)',pos_left='33%',pos_top="5%"),
        legend_opts=opts.LegendOpts(type_="scroll", pos_left="90%",pos_top="58%",orient="vertical")
    )
)

c2 = (
    Pie(init_opts=opts.InitOpts(
            width='800px', height='600px',
            )
       )
        .add(
        '',
        [list(z) for z in zip(directions, count2)],
        radius=['10%', '30%'],
        center=['75%', '65%'],
        rosetype="radius",
        label_opts=opts.LabelOpts(is_show=True),
        )    
        .set_global_opts(title_opts=opts.TitleOpts(title='有/無電梯',pos_left='33%',pos_top="5%"),
                        legend_opts=opts.LegendOpts(type_="scroll", pos_left="90%",pos_top="15%",orient="vertical")
                        )
        .set_series_opts(label_opts=opts.LabelOpts(formatter=':{c} \n (n5n3t3z%)'),position="outside")
    )

bar.overlap(c2)
bar.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

7.二手房樓層分布柱狀圖
g = df.groupby('樓層')
df_floor = g.count()['小區(qū)']
df_floor

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

floor = df_floor.index.tolist()
count = df_floor.values.tolist()
bar = (
    Bar()
    .add_xaxis(floor)
    .add_yaxis('數(shù)量', count)
    .set_global_opts(
        title_opts=opts.TitleOpts(title='二手房樓層分布柱狀縮放圖'),
        yaxis_opts=opts.AxisOpts(name='數(shù)量'),
        xaxis_opts=opts.AxisOpts(name='樓層'),
        datazoom_opts=opts.DataZoomOpts(type_='slider')
    )
)
bar.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

8.房屋面積分布柱狀圖
area_level = [0, 50, 100, 150, 200, 250, 300, 350, 400, 1500]    
label_level = ['小于50', '50-100', '100-150', '150-200', '200-250', '250-300', '300-350', '350-400', '大于400']    
jzmj_cut = pd.cut(df['面積(㎡)'], area_level, labels=label_level)        
df_area = jzmj_cut.value_counts()
df_area

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

area = df_area.index.tolist()
count = df_area.values.tolist()

bar = (
    Bar()
    .add_xaxis(area)
    .add_yaxis('數(shù)量', count)
    .reversal_axis()
    .set_series_opts(label_opts=opts.LabelOpts(position="right"))
    .set_global_opts(
        title_opts=opts.TitleOpts(title='房屋面積分布縱向柱狀圖'),
        yaxis_opts=opts.AxisOpts(name='面積(㎡)'),
        xaxis_opts=opts.AxisOpts(name='數(shù)量'),
    )
)
bar.render_notebook()

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位

結(jié)論

豐臺、朝陽、海淀、昌平在售的房源數(shù)量最多,高達12000多套,占了總量的1/2。

東城區(qū)、西城區(qū)和海淀區(qū)二手房平均售價最高,均在800萬元以上。

二手房面積多集中于0-400平米,價格在0-3000萬元居多。

房屋朝向約50%是坐北朝南的

推薦往期文章

?? 博主所有文章素材、解答、源碼、教程領(lǐng)取處:點擊

對python感興趣的小伙伴也可以看一下博主其他相關(guān)文章哦~

python小介紹:

python是什么?工作前景如何?怎么算有基礎(chǔ)?爬數(shù)據(jù)違法嘛?。。

python數(shù)據(jù)分析前景:

用python分析“數(shù)據(jù)分析”到底值不值得學習,以及學完之后大概能拿到多少工資

python基礎(chǔ)自測題:

Python 800 道習題 (°ー°〃) 測試你學廢了嘛

最后推薦一套Python視頻給大家,希望對大家有所幫助:

全套教程!你和大佬只有一步之遙【python教程】

尾語

要成功,先發(fā)瘋,下定決心往前沖!

學習是需要長期堅持的,一步一個腳印地走向未來!

未來的你一定會感謝今天學習的你。

—— 心靈雞湯

本文章到這里就結(jié)束啦~感興趣的小伙伴可以復制代碼去試試哦 ??

python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位文章來源地址http://www.zghlxwxcb.cn/news/detail-495620.html

??問題解答 · 源碼獲取 · 技術(shù)交流 · 抱團學習請聯(lián)系??

到了這里,關(guān)于python帶你對北京二手房進行數(shù)據(jù)分析,看看大概都什么價位的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務器費用

相關(guān)文章

  • 大數(shù)據(jù)畢業(yè)設計 二手房數(shù)據(jù)爬取與分析可視化系統(tǒng) -python

    大數(shù)據(jù)畢業(yè)設計 二手房數(shù)據(jù)爬取與分析可視化系統(tǒng) -python

    # 1 前言 ?? 這兩年開始畢業(yè)設計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設題目缺少創(chuàng)新和亮點,往往達不到畢業(yè)答辯的要求,這兩年不斷有學弟學妹告訴學長自己做的項目系統(tǒng)達不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設,學長分享優(yōu)質(zhì)畢業(yè)設計項

    2024年02月16日
    瀏覽(31)
  • Python教你一招,爬取鏈家二手房并做數(shù)據(jù)可視化分析

    Python教你一招,爬取鏈家二手房并做數(shù)據(jù)可視化分析

    發(fā)送請求, 模擬瀏覽器對于url地址發(fā)送請求 獲取數(shù)據(jù), 獲取網(wǎng)頁數(shù)據(jù)內(nèi)容 -- 請求那個鏈接地址, 返回服務器響應數(shù)據(jù) 解析數(shù)據(jù), 提取我們需要的數(shù)據(jù)內(nèi)容 保存數(shù)據(jù), 保存本地文件 win + R 輸入cmd 輸入安裝命令 pip install 模塊名 (如果你覺得安裝速度比較慢, 你可以切換國內(nèi)鏡像源

    2024年02月08日
    瀏覽(39)
  • python畢設選題 - 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    python畢設選題 - 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設題目缺少創(chuàng)新和亮點,往往達不到畢業(yè)答辯的要求,這兩年不斷有學弟學妹告訴學長自己做的項目系統(tǒng)達不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設,學長分享優(yōu)質(zhì)畢業(yè)設計項

    2024年01月20日
    瀏覽(30)
  • 基于python重慶二手房數(shù)據(jù)可視化分析全屏大屏系統(tǒng)設計與實現(xiàn)(django框架)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學生畢業(yè)設計教育和輔導。 所有項目都配有從入門到精通的基礎(chǔ)知識視頻課程,免費 項目配有對應開發(fā)文檔、開題報告、任務書、

    2024年02月05日
    瀏覽(27)
  • 計算機畢設 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    計算機畢設 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設題目缺少創(chuàng)新和亮點,往往達不到畢業(yè)答辯的要求,這兩年不斷有學弟學妹告訴學長自己做的項目系統(tǒng)達不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設,學長分享優(yōu)質(zhì)畢業(yè)設計項

    2024年02月04日
    瀏覽(30)
  • 基于python海南??诙址繑?shù)據(jù)可視化分析全屏大屏系統(tǒng)設計與實現(xiàn)(django框架)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學生畢業(yè)設計教育和輔導。 所有項目都配有從入門到精通的基礎(chǔ)知識視頻課程,免費 項目配有對應開發(fā)文檔、開題報告、任務書、

    2024年02月05日
    瀏覽(28)
  • 大數(shù)據(jù)畢設分享 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    大數(shù)據(jù)畢設分享 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設題目缺少創(chuàng)新和亮點,往往達不到畢業(yè)答辯的要求,這兩年不斷有學弟學妹告訴學長自己做的項目系統(tǒng)達不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設,學長分享優(yōu)質(zhì)畢業(yè)設計項

    2024年01月23日
    瀏覽(34)
  • 大數(shù)據(jù)分析案例-基于隨機森林算法構(gòu)建二手房價格預測模型

    大數(shù)據(jù)分析案例-基于隨機森林算法構(gòu)建二手房價格預測模型

    ???♂? 個人主頁:@艾派森的個人主頁 ???作者簡介:Python學習者 ?? 希望大家多多支持,我們一起進步!?? 如果文章對你有幫助的話, 歡迎評論 ??點贊???? 收藏 ??加關(guān)注+ 喜歡大數(shù)據(jù)分析項目的小伙伴,希望可以多多支持該系列的其他文章 大數(shù)據(jù)分析案例合集

    2024年02月09日
    瀏覽(20)
  • Python二手房價格預測(三)——二手房價格預測模型baseline

    Python二手房價格預測(三)——二手房價格預測模型baseline

    一、Python二手房價格預測(一)——數(shù)據(jù)獲取 二、Python二手房價格預測(二)——數(shù)據(jù)處理及數(shù)據(jù)可視化 ? ? ? ? 在上次分享中我們對數(shù)據(jù)進行了部分預處理和數(shù)據(jù)可視化,接下來將對數(shù)據(jù)完全處理,并且使用幾種基線模型對二手房的價格進行預測。 ? ? ? ? 上次分享中我

    2024年01月20日
    瀏覽(27)
  • Python爬蟲-貝殼二手房

    Python爬蟲-貝殼二手房

    前言 本文是該專欄的第3篇,后面會持續(xù)分享python爬蟲案例干貨,記得關(guān)注。 本文以某二手房網(wǎng)為例,如下圖所示,采集對應城市的二手房源數(shù)據(jù)。具體思路和方法跟著筆者直接往下看正文詳細內(nèi)容。(附帶完整代碼) 正文 地址 :aHR0cHM6Ly9zei5rZS5jb20vZXJzaG91ZmFuZy8= 目標 :采集

    2024年02月16日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包