国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類

這篇具有很好參考價(jià)值的文章主要介紹了掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

pandas中的cut函數(shù)可將一維數(shù)據(jù)按照給定的區(qū)間進(jìn)行分組,并為每個(gè)值分配對(duì)應(yīng)的標(biāo)簽。
其主要功能是將連續(xù)的數(shù)值數(shù)據(jù)轉(zhuǎn)化為離散的分組數(shù)據(jù),方便進(jìn)行分析和統(tǒng)計(jì)。

1. 數(shù)據(jù)準(zhǔn)備

下面的示例中使用的數(shù)據(jù)采集自王者榮耀比賽的統(tǒng)計(jì)數(shù)據(jù)。
數(shù)據(jù)下載地址:https://databook.top/。

導(dǎo)入數(shù)據(jù):

# 2023年世冠比賽選手的數(shù)據(jù)
fp = r"D:\data\player-2023世冠.csv"

df = pd.read_csv(fp)

# 這里只保留了下面示例中需要的列
df = df.loc[:, ["排名", "選手", "場(chǎng)均經(jīng)濟(jì)", "場(chǎng)均傷害"]]
df

掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類

2. 使用示例

每個(gè)選手的“場(chǎng)均經(jīng)濟(jì)”“場(chǎng)均傷害”是連續(xù)分布的數(shù)據(jù),為了整體了解所有選手的情況,
可以使用下面的方法將“場(chǎng)均經(jīng)濟(jì)”“場(chǎng)均傷害”分類。

2.1. 查看數(shù)據(jù)分布

首先,可以使用直方圖的方式看看數(shù)據(jù)連續(xù)分布的情況:

import matplotlib.pyplot as plt

df.loc[:, ["場(chǎng)均經(jīng)濟(jì)", "場(chǎng)均傷害"]].hist()
plt.show()

掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類
圖中的橫軸是“經(jīng)濟(jì)”和“傷害”的數(shù)值,縱軸是選手的數(shù)量。

2.2. 定制分布參數(shù)

從默認(rèn)的直方圖中可以看出大部分選手的“場(chǎng)均經(jīng)濟(jì)”“場(chǎng)均傷害”大致在什么范圍,
不過(guò),為了更精細(xì)的分析,我們可以進(jìn)一步定義自己的分類范圍,看看各個(gè)分類范圍內(nèi)的選手?jǐn)?shù)量情況。

比如,我們將“場(chǎng)均經(jīng)濟(jì)”分為3塊,分別為0~5000),5000~10000),10000~20000)。
同樣,對(duì)于“場(chǎng)均傷害”,也分為3塊,分別為0~50000),50000~100000),100000~200000)。

bins1 = [0, 5000, 10000, 20000]
bins2 = [0, 50000, 100000, 200000]

labels = ["低", "中", "高"]
s1 = "場(chǎng)均經(jīng)濟(jì)"
s2 = "場(chǎng)均傷害"
df[f"{s1}-分類"] = pd.cut(df[s1], bins=bins1, labels=labels)
df[f"{s2}-分類"] = pd.cut(df[s2], bins=bins2, labels=labels)

df

掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類
分類之后,選手被分到3個(gè)類別之中,然后再繪制直方圖。

df.loc[:, f"{s1}-分類"].hist()
plt.title(f"{s1}-分類")
plt.show()

掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類
從這個(gè)圖看出,大部分選手都是“中”,“高”的經(jīng)濟(jì),說(shuō)明職業(yè)選手很重視英雄發(fā)育。

df.loc[:, f"{s2}-分類"].hist()
plt.title(f"{s2}-分類")
plt.show()

掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類
從圖中可以看出,打出高傷害的選手比例并不高,可能職業(yè)比賽中,更多的是團(tuán)隊(duì)作戰(zhàn)。

3. 總結(jié)

總的來(lái)說(shuō),cut函數(shù)的主要作用是將輸入的數(shù)值數(shù)據(jù)(可以是一維數(shù)組、Series或DataFrame的列)按照指定的間隔或自定義的區(qū)間邊界進(jìn)行劃分,并為每個(gè)劃分后的區(qū)間分配一個(gè)標(biāo)簽。

這樣,原始的連續(xù)數(shù)據(jù)就被轉(zhuǎn)化為了離散的分組數(shù)據(jù),每個(gè)數(shù)據(jù)點(diǎn)都被分配到了一個(gè)特定的組中,從而方便后續(xù)進(jìn)行分析和統(tǒng)計(jì)。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-837884.html

到了這里,關(guān)于掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Pandas實(shí)戰(zhàn)100例 | 案例 31: 轉(zhuǎn)換為分類數(shù)據(jù)

    案例 31: 轉(zhuǎn)換為分類數(shù)據(jù) 知識(shí)點(diǎn)講解 在處理包含文本數(shù)據(jù)的 DataFrame 時(shí),將文本列轉(zhuǎn)換為分類數(shù)據(jù)類型通常是一個(gè)好主意。這可以提高性能并節(jié)省內(nèi)存。Pandas 允許將列轉(zhuǎn)換為 category 類型。 分類數(shù)據(jù)類型 : category 類型適用于那些只包含有限數(shù)量不同值的列(例如,性別、產(chǎn)品

    2024年02月02日
    瀏覽(24)
  • Pandas.DataFrame.groupby() 數(shù)據(jù)分組(數(shù)據(jù)透視、分類匯總) 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    Pandas.DataFrame.groupby() 數(shù)據(jù)分組(數(shù)據(jù)透視、分類匯總) 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    關(guān)于Pandas版本: 本文基于 pandas2.2.0 編寫。 關(guān)于本文內(nèi)容更新: 隨著pandas的stable版本更迭,本文持續(xù)更新,不斷完善補(bǔ)充。 傳送門: Pandas API參考目錄 傳送門: Pandas 版本更新及新特性 傳送門: Pandas 由淺入深系列教程 DataFrame.groupby() 方法用于使用映射器或指定的列,對(duì) D

    2024年01月16日
    瀏覽(18)
  • Python pandas庫(kù)怎樣根據(jù)某一列的數(shù)據(jù)將所有數(shù)據(jù)分類

    在數(shù)據(jù)處理中,數(shù)據(jù)分類是一項(xiàng)基礎(chǔ)而重要的工作。本文將介紹如何使用Python pandas庫(kù),根據(jù)某一列的數(shù)據(jù)將所有數(shù)據(jù)分類。 1. 讀取數(shù)據(jù)文件,生成數(shù)據(jù)框(DataFrame)對(duì)象 首先,需要讀取數(shù)據(jù)文件,生成數(shù)據(jù)框(DataFrame)對(duì)象。這里以讀取CSV格式的數(shù)據(jù)文件為例,代碼如下:

    2024年02月07日
    瀏覽(51)
  • 【Python】使用Pandas和隨機(jī)森林對(duì)鳶尾花數(shù)據(jù)集進(jìn)行分類

    我在鼓樓的夜色中 為你唱花香自來(lái) 在別處 沉默相遇和期待 飛機(jī)飛過(guò) 車水馬龍的城市 千里之外 不離開 把所有的春天 都揉進(jìn)了一個(gè)清晨 把所有停不下的言語(yǔ)變成秘密 關(guān)上了門 莫名的情愫啊 請(qǐng)問(wèn) 誰(shuí)來(lái)將它帶走呢 只好把歲月化成歌 留在山河 ???????????????????????

    2024年04月26日
    瀏覽(20)
  • 用 Python 制作可視化 GUI 界面,一鍵實(shí)現(xiàn)自動(dòng)分類管理文件!

    用 Python 制作可視化 GUI 界面,一鍵實(shí)現(xiàn)自動(dòng)分類管理文件!

    經(jīng)常雜亂無(wú)章的文件夾會(huì)讓我們找不到所想要的文件,因此小編特意制作了一個(gè) 可視化GUI界面 ,通過(guò)輸入路徑一鍵點(diǎn)擊實(shí)現(xiàn)文件分門別類的歸檔。 不同的文件后綴歸類為不同的類別 我們先羅列一下大致有幾類文件,根據(jù)文件的后綴來(lái)設(shè)定,大致如下 上面所羅列出來(lái)的文件

    2024年01月19日
    瀏覽(24)
  • 7個(gè)Pandas繪圖函數(shù)助力數(shù)據(jù)可視化

    7個(gè)Pandas繪圖函數(shù)助力數(shù)據(jù)可視化

    大家好,在使用Pandas分析數(shù)據(jù)時(shí),會(huì)使用Pandas函數(shù)來(lái)過(guò)濾和轉(zhuǎn)換列,連接多個(gè)數(shù)據(jù)幀中的數(shù)據(jù)等操作。但是,生成圖表將數(shù)據(jù)在數(shù)據(jù)幀中可視化 , 通常比僅僅查看數(shù)字更有幫助。 Pandas具有幾個(gè)繪圖函數(shù),可以使用它們快速輕松地實(shí)現(xiàn)數(shù)據(jù)可視化,文中將介紹這些函數(shù)。 首先

    2024年01月21日
    瀏覽(49)
  • pandas plot函數(shù):數(shù)據(jù)可視化的快捷通道

    pandas plot函數(shù):數(shù)據(jù)可視化的快捷通道

    一般來(lái)說(shuō),我們先用 pandas 分析數(shù)據(jù),然后用 matplotlib 之類的可視化庫(kù)來(lái)顯示分析結(jié)果。 而 pandas 庫(kù)中有一個(gè)強(qiáng)大的工具-- plot 函數(shù),可以使數(shù)據(jù)可視化變得簡(jiǎn)單而高效。 plot 函數(shù)是 pandas 中用于數(shù)據(jù)可視化的一個(gè)重要工具, 通過(guò) plot 函數(shù),可以輕松地將 DataFrame 或 Series 對(duì)象

    2024年03月09日
    瀏覽(36)
  • 別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

    別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

    數(shù)據(jù)過(guò)濾在數(shù)據(jù)分析過(guò)程中具有極其重要的地位,因?yàn)樵谡鎸?shí)世界的數(shù)據(jù)集中,往往存在重復(fù)、缺失或異常的數(shù)據(jù)。 pandas 提供的數(shù)據(jù)過(guò)濾功能可以幫助我們輕松地識(shí)別和處理這些問(wèn)題數(shù)據(jù),從而確保數(shù)據(jù)的質(zhì)量和準(zhǔn)確性。 今天介紹的 query 函數(shù),為我們提供了強(qiáng)大靈活的數(shù)據(jù)

    2024年03月09日
    瀏覽(20)
  • Python-pandas:數(shù)據(jù)合并merge函數(shù)用法詳解

    Python-pandas:數(shù)據(jù)合并merge函數(shù)用法詳解

    介紹一下數(shù)據(jù)分析中很常用的一個(gè)函數(shù)——merge,它能夠進(jìn)行高效的數(shù)據(jù)合并操作。先看一下語(yǔ)法格式及其初步解釋: 生成的兩個(gè)DataFrame對(duì)象如下: 1、參數(shù)left,right: 將df_d作為左側(cè)的frame,df_e作為右側(cè)的frame,則參數(shù)left=df_d,right=df_e; 2、參數(shù)how: 當(dāng)參數(shù)how=\\\'left\\\':僅使用左

    2024年02月15日
    瀏覽(24)
  • Pandas庫(kù):從入門到應(yīng)用(一)--數(shù)據(jù)結(jié)構(gòu)及基礎(chǔ)函數(shù)

    Pandas庫(kù):從入門到應(yīng)用(一)--數(shù)據(jù)結(jié)構(gòu)及基礎(chǔ)函數(shù)

    一、Pandas簡(jiǎn)介 pandas是 Python 的核?數(shù)據(jù)分析?持庫(kù),提供了快速、靈活、明確的數(shù)據(jù)結(jié)構(gòu),旨在簡(jiǎn)單、直觀地處理關(guān)系型、標(biāo)記型數(shù)據(jù)。pandas是Python進(jìn)?數(shù)據(jù)分析的必備?級(jí)?具。 pandas的主要數(shù)據(jù)結(jié)構(gòu)是 Series (?維數(shù)據(jù))與 DataFrame (?維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)?以處理?融、

    2024年02月13日
    瀏覽(20)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包