国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

pandas 筆記:pivot_table 數(shù)據(jù)透視表

這篇具有很好參考價(jià)值的文章主要介紹了pandas 筆記:pivot_table 數(shù)據(jù)透視表。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

1 基本使用方法

pandas.pivot_table(
    data, 
    values=None, 
    index=None, 
    columns=None, 
    aggfunc='mean', 
    fill_value=None, 
    margins=False, 
    dropna=True, 
    margins_name='All', 
    observed=False, 
    sort=True)

2 主要參數(shù)

data DataFrame
values 要進(jìn)行聚合的列
index 在數(shù)據(jù)透視表索引(index)上進(jìn)行分組的鍵
columns 在數(shù)據(jù)透視表列(column)上進(jìn)行分組的鍵
agg_func 聚合方式
fill_value 缺省值的填充方式,默認(rèn)為NAN
margins 默認(rèn)為False,設(shè)置為True之后,會(huì)計(jì)算一個(gè)總的value值

3 使用方法

3.0 導(dǎo)入數(shù)據(jù)

import pandas as pd
# Visual Python: Data Analysis > File
vp_df = pd.read_csv('https://raw.githubusercontent.com/visualpython/visualpython/main/visualpython/data/sample_csv/tips.csv')

import seaborn as sns
import numpy as np
vp_df.head()

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

3.1 基本使用

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill')

?

?3.2 index

  • aggfunc默認(rèn)按平均值聚合,values默認(rèn)只顯示可以按平均值聚合的數(shù)據(jù)

index為一列名字的效果如3.1所示,多列的話,效果如下

vp_df.pivot_table(index=['day','size'],
                 columns='time',
                 values='total_bill')

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?順序不同,效果也不同

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?3.3 values

篩選需要顯示的列

values 中一個(gè)元素的結(jié)果和3.1一樣,如果是多個(gè)元素,那就是一個(gè)value的透視表之后接另一個(gè):

vp_df.pivot_table(index='day',
                 columns='time',
                 values=['total_bill','size'])

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?3.4 columns

列索引

columns中一個(gè)元素的結(jié)果和3.1一樣,如果是多個(gè)元素,那就是

vp_df.pivot_table(index='day',
                 columns=['time','size'],
                 values='total_bill')

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

3.5 aggfunc

聚合方式,默認(rèn)為求平均

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill',
                 aggfunc=sum)

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

3.5.1 不同的列不同的聚合方式

vp_df.pivot_table(index='day',
                 columns='time',
                 values=['total_bill','size'],
                  aggfunc={'total_bill':sum,'size':min},
                 margins=True)

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?3.5 fill_value

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill',
                 fill_value='Not a Num')

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?3.6 margins

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill',
                  aggfunc=sum,
                 margins=True)

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

4 pivot

不同于pivot_table,pivot不會(huì)進(jìn)行聚合操作,換言之,如果index中有重復(fù)值,那么pivot會(huì)報(bào)錯(cuò)

vp_df.pivot_table(index='day',
            columns='time',
           values='total_bill')

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-584739.html

vp_df.pivot(index='day',
            columns='time',
           values='total_bill')

#ValueError: Index contains duplicate entries, cannot reshape
vp_df.pivot_table(index='tip',
            columns='time',
           values='total_bill')

pandas 筆記:pivot_table 數(shù)據(jù)透視表,python庫(kù)整理,pandas,筆記,python

?

到了這里,關(guān)于pandas 筆記:pivot_table 數(shù)據(jù)透視表的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【100天精通Python】Day57:Python 數(shù)據(jù)分析_Pandas數(shù)據(jù)描述性統(tǒng)計(jì),分組聚合,數(shù)據(jù)透視表和相關(guān)性分析

    目錄 1 描述性統(tǒng)計(jì)(Descriptive Statistics) 2 數(shù)據(jù)分組和聚合 3 數(shù)據(jù)透視表 4 相關(guān)性分析

    2024年02月07日
    瀏覽(44)
  • Pandas數(shù)據(jù)分析系列9-數(shù)據(jù)透視與行列轉(zhuǎn)換

    ?? 當(dāng)數(shù)據(jù)量較大時(shí),為了更好的分析數(shù)據(jù)特征,通常會(huì)采用數(shù)據(jù)透視表。 數(shù)據(jù)透視表是一種對(duì)數(shù)據(jù)進(jìn)行匯總和分析的工具,通過(guò)重新排列和聚合原始數(shù)據(jù),可以快速獲得更全面的數(shù)據(jù)洞察。數(shù)據(jù)透視表在 Excel 中也是經(jīng)常使用的一個(gè)強(qiáng)大功能,在 Pandas 模塊,其提供了 pivot

    2024年02月08日
    瀏覽(19)
  • Pandas.DataFrame.groupby() 數(shù)據(jù)分組(數(shù)據(jù)透視、分類匯總) 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    Pandas.DataFrame.groupby() 數(shù)據(jù)分組(數(shù)據(jù)透視、分類匯總) 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    關(guān)于Pandas版本: 本文基于 pandas2.2.0 編寫。 關(guān)于本文內(nèi)容更新: 隨著pandas的stable版本更迭,本文持續(xù)更新,不斷完善補(bǔ)充。 傳送門: Pandas API參考目錄 傳送門: Pandas 版本更新及新特性 傳送門: Pandas 由淺入深系列教程 DataFrame.groupby() 方法用于使用映射器或指定的列,對(duì) D

    2024年01月16日
    瀏覽(18)
  • pandas筆記:groupby整理

    pandas筆記:groupby整理

    按照Type 聚類,聚類后將同組的Kg屬性合并,求均值 聚合的內(nèi)容可以是 max, min, mean, unique(唯一值), nunique(唯一值數(shù)量),lambda 表達(dá)式 ?? ? ?按照Type 聚類,聚類后將同組的Kg、Depth屬性合并,求均值 ? 重命名的名字=(需要操作的列名,需要的操作名) ? ? ? 參考內(nèi)容:

    2024年02月16日
    瀏覽(51)
  • 【Python數(shù)據(jù)處理】-Pandas筆記

    【Python數(shù)據(jù)處理】-Pandas筆記

    Pandas是一個(gè)強(qiáng)大的Python數(shù)據(jù)處理庫(kù),它提供了高效的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具,使數(shù)據(jù)處理變得簡(jiǎn)單而快速。本篇筆記將介紹Pandas中最常用的數(shù)據(jù)結(jié)構(gòu)——Series和DataFrame,以及數(shù)據(jù)處理的各種操作和技巧。 (一)創(chuàng)建Series Series是Pandas中的一維數(shù)組,類似于帶有標(biāo)簽的NumPy數(shù)組

    2024年02月12日
    瀏覽(19)
  • python數(shù)據(jù)分析學(xué)習(xí)筆記之matplotlib、numpy、pandas

    python數(shù)據(jù)分析學(xué)習(xí)筆記之matplotlib、numpy、pandas

    為了學(xué)習(xí)機(jī)器學(xué)習(xí),在此先學(xué)習(xí)以下數(shù)據(jù)分析的matplotlib,numpy,pandas,主要是為自己的學(xué)習(xí)做個(gè)記錄,如有不會(huì)的可以隨時(shí)查閱。希望大家可以一起學(xué)習(xí)共同進(jìn)步,我們最終都可以說(shuō):功不唐捐,玉汝于成。就算遇到困難也不要?dú)怵H,大聲說(shuō):我不怕,我敏而好學(xué)??! 把大量

    2024年02月08日
    瀏覽(26)
  • 【pandas基礎(chǔ)】--數(shù)據(jù)整理

    pandas 進(jìn)行數(shù)據(jù)整理的意義在于,它是數(shù)據(jù)分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的前置步驟。 通過(guò)數(shù)據(jù)整理可以提前了解數(shù)據(jù)的概要,缺失值、重復(fù)值等情況,為后續(xù)的分析和建模提供更為可靠的數(shù)據(jù)基礎(chǔ)。 本篇主要介紹利用 pandas 進(jìn)行數(shù)據(jù)整理的各種方法。 獲取數(shù)據(jù)概要信息可以幫

    2024年02月04日
    瀏覽(14)
  • pandas 透視表

    index: 分類列, 透視表的row索引 columns: 透視表中的列索引 values: 統(tǒng)計(jì)的列 aggfunc:統(tǒng)計(jì)函數(shù) fill_value: 空值填充 margins: 是否添加匯總行和列 margins_name: 匯總行和列的名稱

    2024年02月15日
    瀏覽(10)
  • (CDA數(shù)據(jù)分析師學(xué)習(xí)筆記)第五章多維數(shù)據(jù)透視分析一

    商業(yè)智能報(bào)表:BI報(bào)表。 ETL: 全稱 Extract-Transform-Load ,即提?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)。 E 是第一步對(duì)源數(shù)據(jù)進(jìn)行抽取,源數(shù)據(jù)主要來(lái)源于業(yè)務(wù)系統(tǒng)、文件數(shù)據(jù)、第三方數(shù)據(jù)。T是第二步,對(duì)數(shù)據(jù)進(jìn)行適當(dāng)處理,目的是為了下一步的加載。主要是篩選(有價(jià)值

    2024年04月11日
    瀏覽(19)
  • Python學(xué)習(xí)——數(shù)據(jù)分組統(tǒng)計(jì)、分組運(yùn)算及透視

    Python學(xué)習(xí)——數(shù)據(jù)分組統(tǒng)計(jì)、分組運(yùn)算及透視

    分割 split : 按照鍵值(key)或者分組變量將數(shù)據(jù)分組 應(yīng)用 apply : 對(duì)每個(gè)組應(yīng)用函數(shù), 通常是累計(jì),轉(zhuǎn)換或過(guò)濾函數(shù) 組合 combine : 將每一組的結(jié)果合并成一個(gè)輸出組 常用功能 新增加一列 年齡ew 將填充后的年齡補(bǔ)充上去 數(shù)據(jù)聚合(agg):一般指的是能夠從數(shù)組產(chǎn)生的標(biāo)量值的數(shù)

    2024年02月10日
    瀏覽(22)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包