国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

超實(shí)用!使用Python快速對比兩個(gè)Excel表格之間的差異

這篇具有很好參考價(jià)值的文章主要介紹了超實(shí)用!使用Python快速對比兩個(gè)Excel表格之間的差異。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

這是「活用數(shù)據(jù)」的第 11 篇原創(chuàng)文章

主要介紹如何通過DeepDiff實(shí)現(xiàn)兩個(gè)Excel文件數(shù)據(jù)的快速對比。

對于日常辦公中需要處理數(shù)據(jù)的同學(xué)來說,有時(shí)候需要對比兩個(gè)Excel表格(或者是數(shù)據(jù)庫)的數(shù)據(jù)是否完全相同。

對于簡單少量的數(shù)據(jù),我們當(dāng)然可以人工肉眼對比,但是如果數(shù)據(jù)量一大,那么最好還是借助工具實(shí)現(xiàn)。

這篇文章主要通過使用DeepDiff庫,介紹了一種簡單地對比兩個(gè)Excel文件是否完全相同的方法。

首先,我們需要下載DeepDiff庫:

pip install deepdiff

接著再進(jìn)行導(dǎo)入:

from deepdiff import DeepDiff

DeepDiff簡單使用

接下來我們創(chuàng)建4個(gè)簡單的Excel數(shù)據(jù),方便后續(xù)對比,通過pandas讀取數(shù)據(jù):

import pandas as pd

df1 = pd.read_excel('data1.xlsx')
df2 = pd.read_excel('data2.xlsx')
df3 = pd.read_excel('data3.xlsx')
df4 = pd.read_excel('data4.xlsx')

4個(gè)Excel表格數(shù)據(jù)如下:
pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

上面4個(gè)簡單示例數(shù)據(jù)中,我們可以非常明顯地看出來,data1跟data2時(shí)完全一致的,而data3跟data4只是數(shù)據(jù)的行順序跟列順序不一致,其本質(zhì)上還是一致的,在我們實(shí)際工作中,我們希望的出來的結(jié)果也是data3跟data4是一致的。

首先,我們直接對兩個(gè)不一樣的DataFrame進(jìn)行對比:
pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

對比結(jié)果為{},這在DeepDiff中是表示沒有差異的意思,但是,這個(gè)結(jié)果顯然不符合實(shí)際,因?yàn)槲覀兊膁ata1跟data3其實(shí)是完全不一樣的才對。

這是因?yàn)?code>DeepDiff并不支持DataFrame對象的比較。

為了能夠使用DeepDiff,我們可以把DataFrame對象轉(zhuǎn)成字典對象。

可以看到,轉(zhuǎn)成字典之后我們成功地對data1和data2進(jìn)行比較,并給出了正確的結(jié)果:
pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

為了驗(yàn)證,我們再拿data1和data3進(jìn)行比較:
pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

很明顯,這兩個(gè)對象是有區(qū)別的,沒有任何問題。

接下來進(jìn)入我們的重頭戲,對比data3和data4,為了對比這兩個(gè)對象,我們可以先把數(shù)據(jù)轉(zhuǎn)成列表,然后再設(shè)置DeepDiff中的ignore_order參數(shù)忽略字典元素的順序:
pandas對比兩張表數(shù)據(jù)差異,Python,python,pandas

可以看到,結(jié)果非常簡單完美地實(shí)現(xiàn)了我們的對比需求。

本文小結(jié)

本文只是對DeepDiff的使用場景進(jìn)行了簡單介紹,實(shí)際上基于這個(gè)Python庫,我們還可以實(shí)現(xiàn)諸如JSON文件對比、數(shù)據(jù)庫數(shù)據(jù)對比等拓展操作。

本文完整示例代碼及文件可關(guān)注公眾號,回復(fù)“python”獲取。文章來源地址http://www.zghlxwxcb.cn/news/detail-608940.html

到了這里,關(guān)于超實(shí)用!使用Python快速對比兩個(gè)Excel表格之間的差異的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • excel表格怎么設(shè)置密碼?excel文件加密的兩個(gè)方法

    excel表格怎么設(shè)置密碼?excel文件加密的兩個(gè)方法

    一、加密碼的原理 ? Excel加密碼的原理主要基于加密算法和密鑰管理。當(dāng)用戶為Excel文件或工作表設(shè)置密碼時(shí),Excel會(huì)采用一種加密算法對文件或工作表進(jìn)行加密處理。這種加密算法通常是對稱加密算法,如AES(高級加密標(biāo)準(zhǔn))或DES(數(shù)據(jù)加密標(biāo)準(zhǔn))。 二,excel加密的必要性 首先,

    2024年04月26日
    瀏覽(24)
  • 一種使用Java的快速將Web中表格轉(zhuǎn)換成Excel的方法

    一種使用Java的快速將Web中表格轉(zhuǎn)換成Excel的方法

    ????????隨著后疫情時(shí)代的到來,在過去的2022年,全國的經(jīng)濟(jì)情況,想必是很多學(xué)者和研究對象都非常關(guān)心的事。而這些數(shù)據(jù)在國家統(tǒng)計(jì)局網(wǎng)站上都有相應(yīng)的記錄。通過分析這些數(shù)據(jù),可以從某一個(gè)角度來驗(yàn)證和觀察當(dāng)下的經(jīng)濟(jì)情況。 ????????全國共計(jì)有1279個(gè)縣級單

    2024年02月06日
    瀏覽(22)
  • Vscode快速對比兩個(gè)文件的不同部分

    Vscode快速對比兩個(gè)文件的不同部分

    打開vscode,打開文件或者文件夾 選中需要對比的文件 按住 ctrl 選擇要對比的另一個(gè)文件,鼠標(biāo)右鍵選擇將已選項(xiàng)進(jìn)行比較 結(jié)果如下: 打開文件,點(diǎn)擊鼠標(biāo)右鍵 命令面板 輸入 compare 選擇要比較的文件 結(jié)果如下 點(diǎn)擊擴(kuò)展,查找 file-compare ,并安裝插件 打開文件,鼠標(biāo)右鍵,

    2024年02月12日
    瀏覽(16)
  • 在Excel中將數(shù)值差距極大的兩個(gè)序列用對比明顯的折線圖表示

    在Excel中將數(shù)值差距極大的兩個(gè)序列用對比明顯的折線圖表示

    在Excel中,如果兩個(gè)數(shù)據(jù)序列的數(shù)值差距太大,用這樣的數(shù)據(jù)序列生成折線圖時(shí),折線圖會(huì)顯得過于平緩,趨勢對比不明顯。如下圖: 這時(shí)候只要將趨勢圖設(shè)置成雙坐標(biāo)軸,將其中一條趨勢線繪制到次坐標(biāo)軸上,兩條趨勢線就會(huì)出現(xiàn)明顯的起伏對比。具體操作為:通過鼠標(biāo)左

    2024年02月13日
    瀏覽(16)
  • Pandas快速合并多張excel表格

    目錄 一、Excel表格命名存在規(guī)律的情況下 二、Excel表格文件名不規(guī)律的情況下 1.首先將所有excel表格放到一個(gè)文件夾下面 2.用pandas進(jìn)行合并 三、身份證號合并亂碼解決 最近用Pandas合并表格,發(fā)現(xiàn)效率非常高,現(xiàn)總結(jié)以下兩種方法: 對身份證號碼合并的時(shí)候,會(huì)因?yàn)榫幋a方式

    2024年02月08日
    瀏覽(21)
  • 在Microsoft Excel中如何快速合并表格

    在Microsoft Excel中如何快速合并表格

    在 Excel 中分析數(shù)據(jù)時(shí),在一個(gè)工作表中收集所有必要信息的頻率是多少?幾乎從來沒有!當(dāng)不同的數(shù)據(jù)分散在許多工作表和工作簿中時(shí),這是一種非常常見的情況。幸運(yùn)的是,有幾種不同的方法可以將多個(gè)表中的數(shù)據(jù)組合成一個(gè)表,本教程將教你如何快速有效地做到這一點(diǎn)。

    2024年02月15日
    瀏覽(17)
  • 【辦公自動(dòng)化】使用Python一鍵提取PDF中的表格到Excel

    【辦公自動(dòng)化】使用Python一鍵提取PDF中的表格到Excel

    ? ???♂? 個(gè)人主頁:@艾派森的個(gè)人主頁 ???作者簡介:Python學(xué)習(xí)者 ?? 希望大家多多支持,我們一起進(jìn)步!?? 如果文章對你有幫助的話, 歡迎評論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄 一、Python處理Excel 二、提取PDF表格到excel 三、往期推薦 文末推薦? 文末福利 ? Pyth

    2024年02月13日
    瀏覽(22)
  • 【Python】使用文件哈希算法快速比較兩個(gè)文件是否相同(代碼實(shí)現(xiàn))

    哈希值(Hash Value),也稱為哈希碼、散列值或摘要,是一種將任意長度的輸入數(shù)據(jù)轉(zhuǎn)換為固定長度字符串(通常是一串?dāng)?shù)字和字母)的算法的結(jié)果。哈希值通常用于唯一標(biāo)識(shí)數(shù)據(jù),以便快速檢索或比較數(shù)據(jù)。哈希值的特點(diǎn)包括: 固定長度:無論輸入數(shù)據(jù)的大小如何,哈希函

    2024年01月21日
    瀏覽(23)
  • 【Excel】WPS單元格快速轉(zhuǎn)換表格字母大小寫

    【Excel】WPS單元格快速轉(zhuǎn)換表格字母大小寫

    使用WPS Office打開表格,選擇需要處理的單元格或單元格區(qū)域。 依次點(diǎn)擊「會(huì)員專享」選項(xiàng)卡 —「智能工具箱」。 再點(diǎn)擊「格式」—「大小寫」,選擇一種大小寫轉(zhuǎn)換方式即可。

    2024年02月08日
    瀏覽(95)
  • 【辦公自動(dòng)化】使用Python一鍵提取PDF中的表格到Excel(文末送書5本)

    【辦公自動(dòng)化】使用Python一鍵提取PDF中的表格到Excel(文末送書5本)

    ? ???♂? 個(gè)人主頁:@艾派森的個(gè)人主頁 ???作者簡介:Python學(xué)習(xí)者 ?? 希望大家多多支持,我們一起進(jìn)步!?? 如果文章對你有幫助的話, 歡迎評論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄 一、Python處理Excel 二、提取PDF表格到excel 三、往期推薦 文末推薦? 文末福利 ? Pyth

    2024年02月14日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包