国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭

這篇具有很好參考價值的文章主要介紹了pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

案例背景

真的很容易瘋....上班的單位的表格都是不同的人做的,所以就會出現(xiàn)各種合并單元格的情況,要知道我們用pandas讀取數(shù)據(jù)最怕合并單元格了,因為沒規(guī)律...可能前幾列沒合并,后面幾列又合并了....而且pandas對于索引很嚴(yán)格,這種合并單元讀取進來就是空的,還怎么查找數(shù)據(jù)......例如:

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?還有這種:
pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?讀取的時候....真的很無語。雖然手工做的表頭方便人看,但真的不方便代碼來取數(shù)。

下面我們來看看怎么自動化讀取這種多合并表格的數(shù)據(jù),并規(guī)范表頭。就用這個資產(chǎn)的樣例


代碼實現(xiàn)

讀取數(shù)據(jù),前2行都是標(biāo)題沒用跳過,然后header=0,1表示2行作為多層索引。

name='資產(chǎn)類別統(tǒng)計表2023.7.xlsx'

df=pd.read_excel(f'{name}',skiprows=2,header=[0,1],converters={'類別編號': str})
df.head(3)

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?

可以看到有‘unnamed’這種合并單元出現(xiàn)的空值的情況。?

我們可以打印查看一下行索引名稱:

df.columns

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?像這種只有部分下面缺失的,可以直接用上面的第一層索引填充第二層索引,讓它還是兩層索引,然后繼續(xù)做多層索引數(shù)據(jù)框。

cols = df.columns.map(lambda x: [x[0]if 'Unnamed' in i else i for i in x])
multi_cols = pd.MultiIndex.from_arrays([list(col) for col in zip(*cols)])
df.columns=multi_cols
df.head(2)

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?這樣就是處理好, 然后按照多層索引的方法去進行取數(shù)。

若多層索引不熟悉,只想變成正常 的二維數(shù)據(jù)框,那么就這樣:

cols = df.columns.map(lambda x: ''.join('' if 'Unnamed' in i else i for i in x))
cols

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?把第一層和第二層的名稱都進行合并,然后賦值:
?

df.columns=cols
df.head(2)

pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭,pandas數(shù)據(jù)分析,pandas,數(shù)據(jù)分析,excel,自動化辦公

?這樣就變成了單層數(shù)據(jù)框,完成!

后面就正常的pandas索引進行取數(shù)修改篩選計算等工作了。文章來源地址http://www.zghlxwxcb.cn/news/detail-660412.html

到了這里,關(guān)于pandas數(shù)據(jù)分析40——讀取 excel 合并單元格的表頭的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 【Python數(shù)據(jù)分析】利用Python將多個EXCEL表格合并為一個EXCEL表格

    【Python數(shù)據(jù)分析】利用Python將多個EXCEL表格合并為一個EXCEL表格

    ? ? ? ? 如何將EXCEL的多個表格合并成一個表格呢?比如每月銷售額是一個單獨的表格,我想把它們合并成一個表格,今天就與大家分享如何利用Python數(shù)據(jù)分析3分鐘搞定,不管你要合并多少個文件,代碼總是那么幾行。不多說了,上案例。 ? ? ? ? ?現(xiàn)在有3個月的銷售額,需

    2023年04月24日
    瀏覽(25)
  • 解決pandas讀取excel單元格出錯_x0000_

    如果已經(jīng)讀出來了這個問題,那么就只能使用 replace 替換了: 這是因為pandas解析excel的 .xlsx 文件時,使用的引擎是openpyxl,而有些情況下因為excel文件修修改改,導(dǎo)致有些編碼格式被遺留在了excel單元格中,會在使用openpyxl時出現(xiàn)意外

    2024年02月11日
    瀏覽(22)
  • 40 | NBA球員信息數(shù)據(jù)分析

    本文將以NBA球員薪資數(shù)據(jù)并進行數(shù)據(jù)分析為例,展示如何獲取網(wǎng)絡(luò)上的數(shù)據(jù)資源,并通過數(shù)據(jù)處理和可視化方法揭示有關(guān)NBA球員薪資的信息。我們將使用提供的URL(www.espn.com/nba/salaries)來抓取NBA球員薪資數(shù)據(jù),然后運用數(shù)據(jù)分析工具,對數(shù)據(jù)進行清洗、整理和計算,最終通過

    2024年02月12日
    瀏覽(21)
  • 用Python的pandas讀取excel文件中的數(shù)據(jù)

    用Python的pandas讀取excel文件中的數(shù)據(jù)

    hello呀!各位鐵子們大家好呀,今天呢來和大家聊一聊用Python的pandas讀取excel文件中的數(shù)據(jù)。 使用pandas的 read_excel() 方法,可通過文件路徑直接讀取。注意到,在一個excel文件中有多個sheet,因此,對excel文件的讀取實際上是讀取指定文件、并同時指定sheet下的數(shù)據(jù)??梢砸淮巫x

    2024年02月02日
    瀏覽(89)
  • pandas數(shù)據(jù)分析之?dāng)?shù)據(jù)繪圖

    pandas數(shù)據(jù)分析之?dāng)?shù)據(jù)繪圖

    一圖勝千言,將信息可視化(繪圖)是數(shù)據(jù)分析中最重要的工作之一。它除了讓人們對數(shù)據(jù)更加直觀以外,還可以幫助我們找出異常值、必要的數(shù)據(jù)轉(zhuǎn)換、得出有關(guān)模型的想法等等。pandas 在數(shù)據(jù)分析、數(shù)據(jù)可視化方面有著較為廣泛的應(yīng)用。本文將通過實例介紹pandas的數(shù)據(jù)繪圖

    2024年02月10日
    瀏覽(18)
  • 數(shù)據(jù)分析 — Pandas 數(shù)據(jù)處理

    Pandas (Python Data Analysis Library)是一個基于 NumPy 的 數(shù)據(jù)分析工具 ,專為解決數(shù)據(jù)分析任務(wù)而創(chuàng)建。它匯集了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,可以更高效地操作大型數(shù)據(jù)集。 數(shù)據(jù)結(jié)構(gòu): Pandas 提供了兩種主要的數(shù)據(jù)結(jié)構(gòu),即 Series 和 DataFrame ,用于處理 一維和二維 數(shù)據(jù)。 標(biāo)簽

    2024年02月22日
    瀏覽(26)
  • C#實現(xiàn)Excel合并單元格數(shù)據(jù)導(dǎo)入數(shù)據(jù)集

    C#實現(xiàn)Excel合并單元格數(shù)據(jù)導(dǎo)入數(shù)據(jù)集

    目錄 功能需求 Excel與DataSet的映射關(guān)系 范例運行環(huán)境 Excel DCOM 配置 設(shè)計實現(xiàn) 組件庫引入 ?方法設(shè)計 返回值? 參數(shù)設(shè)計 打開數(shù)據(jù)源并計算Sheets 拆分合并的單元格 創(chuàng)建DataTable 將單元格數(shù)據(jù)寫入DataTable 總結(jié) 將Excel里的worksheet表格導(dǎo)入到DataSet里,是項目應(yīng)用里常用的一種操作。

    2024年02月02日
    瀏覽(21)
  • pandas讀取Excel核心源碼剖析,面向過程仿openpyxl源碼實現(xiàn)Excel數(shù)據(jù)加載

    pandas讀取Excel核心源碼剖析,面向過程仿openpyxl源碼實現(xiàn)Excel數(shù)據(jù)加載

    ??作者: 小小明-代碼實體 ??博客主頁:https://blog.csdn.net/as604049322 ??歡迎點贊 ?? 收藏 ?留言 ?? 歡迎討論! 今天我們將研究pandas如何使用openpyxl引擎讀取xlsx格式的Excel的數(shù)據(jù),并考慮以面向過程的形式簡單的自己實現(xiàn)一下。 截止目前本人所使用的pandas和openpyxl版本為:

    2023年04月19日
    瀏覽(30)
  • 【數(shù)據(jù)分析】pandas (三)

    【數(shù)據(jù)分析】pandas (三)

    在這里,我們將討論pandas數(shù)據(jù)結(jié)構(gòu)中常見的許多基本功能 讓我們創(chuàng)建一些示例對象: index = pd.date_range(“1/1/2000”, periods=8) s = pd.Series(np.random.randn(5), index=[“a”, “b”, “c”, “d”, “e”]). df = pd.DataFrame(np.random.randn(8, 3), index=index, columns=[“A”, “B”, “C”]) 要查看一個Seri

    2024年02月13日
    瀏覽(24)
  • 【數(shù)據(jù)分析 - 基礎(chǔ)入門之pandas篇③】- pandas數(shù)據(jù)結(jié)構(gòu)——DataFrame

    【數(shù)據(jù)分析 - 基礎(chǔ)入門之pandas篇③】- pandas數(shù)據(jù)結(jié)構(gòu)——DataFrame

    大家好!我是一朵向陽花(花花花)??,本期跟大家分享的知識是 pandas 數(shù)據(jù)結(jié)構(gòu)——DataFrame。 作者的【 Python 數(shù)據(jù)分析】專欄正在火熱更新中??,如果本文對您有幫助,歡迎大家點贊 + 評論 + 收藏 ! 每日金句分享: 慢慢來,誰還沒有一個努力的過程?!弧?pony「網(wǎng)易云

    2024年02月16日
    瀏覽(19)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包