国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

EDA-數(shù)據(jù)探索-pandas自帶可視化-iris

這篇具有很好參考價值的文章主要介紹了EDA-數(shù)據(jù)探索-pandas自帶可視化-iris。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

# 加載yellowbrick數(shù)據(jù)集
import os
import pandas as pd
FIXTURES  = os.path.join(os.getcwd(), "data")
df = pd.read_csv(os.path.join(FIXTURES,"iris.csv"))
df.head()
sepal_length sepal_width petal_length petal_width species
0 5.1 3.5 1.4 0.2 setosa
1 4.9 3.0 1.4 0.2 setosa
2 4.7 3.2 1.3 0.2 setosa
3 4.6 3.1 1.5 0.2 setosa
4 5.0 3.6 1.4 0.2 setosa
df.head().to_dict()
{'sepal_length': {0: 5.1, 1: 4.9, 2: 4.7, 3: 4.6, 4: 5.0},
 'sepal_width': {0: 3.5, 1: 3.0, 2: 3.2, 3: 3.1, 4: 3.6},
 'petal_length': {0: 1.4, 1: 1.4, 2: 1.3, 3: 1.5, 4: 1.4},
 'petal_width': {0: 0.2, 1: 0.2, 2: 0.2, 3: 0.2, 4: 0.2},
 'species': {0: 'setosa', 1: 'setosa', 2: 'setosa', 3: 'setosa', 4: 'setosa'}}

可視化相關(guān)的庫

import warnings
warnings.filterwarnings('ignore')

import numpy as np
from scipy.stats import norm

import seaborn as sns
import matplotlib.pyplot as plt
get_ipython().run_line_magic('matplotlib', 'inline')

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False 
df.columns
Index(['sepal_length', 'sepal_width', 'petal_length', 'petal_width',
       'species'],
      dtype='object')
plt.style.available
['Solarize_Light2',
 '_classic_test_patch',
 '_mpl-gallery',
 '_mpl-gallery-nogrid',
 'bmh',
 'classic',
 'dark_background',
 'fast',
 'fivethirtyeight',
 'ggplot',
 'grayscale',
 'seaborn-v0_8',
 'seaborn-v0_8-bright',
 'seaborn-v0_8-colorblind',
 'seaborn-v0_8-dark',
 'seaborn-v0_8-dark-palette',
 'seaborn-v0_8-darkgrid',
 'seaborn-v0_8-deep',
 'seaborn-v0_8-muted',
 'seaborn-v0_8-notebook',
 'seaborn-v0_8-paper',
 'seaborn-v0_8-pastel',
 'seaborn-v0_8-poster',
 'seaborn-v0_8-talk',
 'seaborn-v0_8-ticks',
 'seaborn-v0_8-white',
 'seaborn-v0_8-whitegrid',
 'tableau-colorblind10']
plt.style.use( 'seaborn-v0_8')

字符特征

條形圖(柱狀圖)展示每個字符特征的頻數(shù)分布。

df[‘字符特征’].value_counts().plot(kind=‘bar’)

df['species'].value_counts().plot(kind='bar')  # 均衡的一筆
<Axes: xlabel='species'>

數(shù)字特征

直方圖展示數(shù)字特征的分布情況。

df[‘?dāng)?shù)字特征’].plot(kind=‘hist’)

df['sepal_length'].plot(kind='hist')
<Axes: ylabel='Frequency'>
from scipy.stats import gaussian_kde

# 繪制直方圖
ax = df['sepal_length'].plot(kind='hist', bins=10, density=True)

# 計算核密度估計
density = gaussian_kde(df['sepal_length'])

x, y = np.linspace(df['sepal_length'].min(), df['sepal_length'].max(), 100), density(np.linspace(df['sepal_length'].min(), df['sepal_length'].max(), 100))

# 繪制擬合曲線
ax.plot(x, y) # ,color='red'

# 顯示圖形
plt.show()

分類結(jié)果

餅圖展示分類結(jié)果的占比情況。

df[‘分類結(jié)果’].value_counts().plot(kind=‘pie’)

ax = df['species'].value_counts().plot(kind='pie') # 均衡的一筆
# 自定義ylabel
ax.set_ylabel(' ')
# 顯示圖形
plt.show()

字符特征與數(shù)字特征關(guān)系

箱線圖展示不同字符特征對應(yīng)的數(shù)字特征的分布情況。

df.boxplot(column=‘?dāng)?shù)字特征’, by=‘字符特征’)

df.boxplot(column='sepal_length', by='species') # ,color='orange'
# 自定義標(biāo)題
plt.title(' ')
# 顯示圖形
plt.show()

字符特征與數(shù)字特征關(guān)系

折線圖展示不同字符特征對應(yīng)的數(shù)字特征的均值變化趨勢。

df.groupby(‘字符特征’)[‘?dāng)?shù)字特征’].mean().plot(kind=‘line’)

df.groupby('species')['sepal_length'].mean().plot(kind='line')
<Axes: xlabel='species'>

數(shù)字特征間的關(guān)系

散點圖展示兩個數(shù)字特征之間的相關(guān)性。

df.plot(kind=‘scatter’, x=‘?dāng)?shù)字特征1’, y=‘?dāng)?shù)字特征2’)

df.plot(kind='scatter', x='sepal_length', y='sepal_width')
<Axes: xlabel='sepal_length', ylabel='sepal_width'>

數(shù)字特征的分布情況

箱線圖展示數(shù)字特征的分布情況和異常值。

df.boxplot(column=‘?dāng)?shù)字特征’)

df.boxplot(column='sepal_length') # ,color='#4C72B0'
<Axes: >

數(shù)字特征的分布情況

核密度估計圖展示數(shù)字特征的概率密度分布。

df[‘?dāng)?shù)字特征’].plot(kind=‘density’)

df['sepal_length'].plot(kind='density')
<Axes: ylabel='Density'>

字符特征和分類結(jié)果的交叉統(tǒng)計

交叉表展示字符特征和分類結(jié)果之間的頻數(shù)統(tǒng)計。

pd.crosstab(df[‘字符特征’], df[‘分類結(jié)果’]).plot(kind=‘bar’)文章來源地址http://www.zghlxwxcb.cn/news/detail-803406.html

pd.crosstab(df['species'], df['species']).plot(kind='bar')
<Axes: xlabel='species'>

到了這里,關(guān)于EDA-數(shù)據(jù)探索-pandas自帶可視化-iris的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Pandas實戰(zhàn)100例 | 案例 24: 數(shù)據(jù)可視化 - 繪制基本圖形

    案例 24: 數(shù)據(jù)可視化 - 繪制基本圖形 知識點講解 數(shù)據(jù)可視化是數(shù)據(jù)分析中的一個重要環(huán)節(jié),可以幫助更好地理解和解釋數(shù)據(jù)。Pandas 集成了 Matplotlib,提供了簡單的方法來繪制各種圖形,如折線圖、條形圖、散點圖等。 繪制圖形 : 使用 DataFrame 的 plot 方法可以繪制不同類型的圖

    2024年01月17日
    瀏覽(35)
  • 數(shù)據(jù)可視化工具中的顯眼包:奧威BI自帶方案上陣

    數(shù)據(jù)可視化工具中的顯眼包:奧威BI自帶方案上陣

    根據(jù)經(jīng)驗來看,BI數(shù)據(jù)可視化分析項目是由BI數(shù)據(jù)可視化工具和數(shù)據(jù)分析方案兩大部分共同組成,且大多數(shù)時候方案都需從零開始,反復(fù)調(diào)整,會耗費大量時間精力成本。而奧威BI數(shù)據(jù)可視化工具別具匠心,將17年經(jīng)驗?zāi)鄢蓸?biāo)準(zhǔn)化、系統(tǒng)化方案,開箱即用,極大地提高了效率

    2024年02月10日
    瀏覽(25)
  • 【數(shù)據(jù)可視化】(二)數(shù)據(jù)探索組件

    目錄 0.簡介 一、數(shù)據(jù)模式與數(shù)據(jù)組織 1、數(shù)據(jù)的定義 2、數(shù)據(jù)庫的定義 3、什么是數(shù)據(jù)模式? 4、數(shù)據(jù)模式舉例 5、什么是數(shù)據(jù)綱要? 6、數(shù)據(jù)組織的層次 二、矢量數(shù)據(jù) 1、什么是

    2024年02月14日
    瀏覽(26)
  • Pandas+Pyecharts | 北京近五年歷史天氣數(shù)據(jù)可視化

    Pandas+Pyecharts | 北京近五年歷史天氣數(shù)據(jù)可視化

    大家好,我是 ?? 【Python當(dāng)打之年(點擊跳轉(zhuǎn))】 本期利用 python 的 pyecharts 可視化庫繪制 北京市歷史天氣數(shù)據(jù) ,看看 歷史高溫、歷史低溫分布以及白天、夜晚的風(fēng)力、風(fēng)向分布等情況 ,希望對大家有所幫助,如有疑問或者需要改進的地方可以聯(lián)系小編。 2018-2022年五年的歷史

    2024年02月12日
    瀏覽(32)
  • Pandas+Pyecharts | 雙十一美妝銷售數(shù)據(jù)分析可視化

    Pandas+Pyecharts | 雙十一美妝銷售數(shù)據(jù)分析可視化

    大家好,我是 ?? 【Python當(dāng)打之年(點擊跳轉(zhuǎn))】 本期利用 python 分析 雙十一美妝銷售數(shù)據(jù) ,看看: 雙十一前后幾天美妝訂單數(shù)量、總銷量 各美妝品牌銷量情況 美妝品牌一級/二級分類占比 各美妝品牌價格箱型分布情況 各美妝品牌平均價格 美妝品牌詞云 等等… 希望對大家有

    2024年02月13日
    瀏覽(28)
  • 數(shù)據(jù)之美:探索數(shù)據(jù)可視化設(shè)計的奇妙世界

    數(shù)據(jù)之美:探索數(shù)據(jù)可視化設(shè)計的奇妙世界

    在信息時代的浪潮中,海量的數(shù)據(jù)正在影響著我們的生活和決策。然而,數(shù)據(jù)本身雖然有力量,但如何將其有機地呈現(xiàn)給我們,卻成為了一個挑戰(zhàn)。數(shù)據(jù)可視化設(shè)計應(yīng)運而生,它不僅讓枯燥的數(shù)字變得生動,還帶來了一場視覺和認(rèn)知的盛宴。 數(shù)字的生動畫面 數(shù)據(jù)可視化設(shè)計

    2024年02月11日
    瀏覽(32)
  • 探索規(guī)律:Python地圖數(shù)據(jù)可視化藝術(shù)

    探索規(guī)律:Python地圖數(shù)據(jù)可視化藝術(shù)

    使用 Pyecharts 構(gòu)建地圖可視化也是很簡單的。Pyecharts 支持多種地圖類型,包括普通地圖、熱力圖、散點地圖等。以下是一個構(gòu)建簡單地圖的示例,以中國地圖為例: 首先,確保已安裝了Pyecharts 庫??梢允褂靡韵旅顏戆惭b: 然后,創(chuàng)建一個 Python 腳本,例如 map_example.py ,并

    2024年02月13日
    瀏覽(25)
  • 【python】數(shù)據(jù)可視化,使用pandas.merge()對dataframe和geopandas類型數(shù)據(jù)進行數(shù)據(jù)對齊

    【python】數(shù)據(jù)可視化,使用pandas.merge()對dataframe和geopandas類型數(shù)據(jù)進行數(shù)據(jù)對齊

    目錄 0.環(huán)境 1.適用場景 2.pandas.merge()函數(shù)詳細(xì)介紹 3.名詞解釋“數(shù)據(jù)對齊”(來自chatGPT3.5) 4.本文將給出兩種數(shù)據(jù)對齊的例子 1)dataframe類型數(shù)據(jù)和dataframe類型數(shù)據(jù)對齊(對齊NAME列); 數(shù)據(jù)對齊前的兩組數(shù)據(jù)集: 數(shù)據(jù)對齊后的數(shù)據(jù)集(通過pandas.merge()函數(shù)對齊): 代碼 2)

    2024年02月09日
    瀏覽(40)
  • Python 3 中使用 pandas 和 Jupyter Notebook 進行數(shù)據(jù)分析和可視化

    Python 3 中使用 pandas 和 Jupyter Notebook 進行數(shù)據(jù)分析和可視化

    簡介 Python 的 pandas 包用于數(shù)據(jù)操作和分析,旨在讓您以直觀的方式處理帶標(biāo)簽或關(guān)聯(lián)數(shù)據(jù)。 pandas 包提供了電子表格功能,但由于您正在使用 Python,因此它比傳統(tǒng)的圖形電子表格程序要快得多且更高效。 在本教程中,我們將介紹如何設(shè)置一個大型數(shù)據(jù)集, pandas 的 groupby() 和

    2024年02月19日
    瀏覽(35)
  • 數(shù)據(jù)分析:麥當(dāng)勞食品營養(yǎng)數(shù)據(jù)探索并可視化

    數(shù)據(jù)分析:麥當(dāng)勞食品營養(yǎng)數(shù)據(jù)探索并可視化

    作者:i阿極 作者簡介:Python領(lǐng)域新星作者、多項比賽獲獎?wù)撸翰┲鱾€人首頁 ??????如果覺得文章不錯或能幫助到你學(xué)習(xí),可以點贊??收藏??評論??+關(guān)注哦!?????? ??????如果有小伙伴需要數(shù)據(jù)集和學(xué)習(xí)交流,文章下方有交流學(xué)習(xí)區(qū)!一起學(xué)習(xí)進步!?? 專欄案例:

    2023年04月10日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包