国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

pandas中DataFrame數(shù)據(jù)合并、連接

這篇具有很好參考價(jià)值的文章主要介紹了pandas中DataFrame數(shù)據(jù)合并、連接。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

為解決數(shù)據(jù)冗余等問(wèn)題,大量的數(shù)據(jù)會(huì)分開(kāi)存放在不同的文件(表格)里。在數(shù)據(jù)處理時(shí),經(jīng)常會(huì)有不同表格的數(shù)據(jù)需要進(jìn)行合并操作??梢酝ㄟ^(guò)pandas庫(kù)的merge函數(shù)concat函數(shù)來(lái)實(shí)現(xiàn)數(shù)據(jù)集的合并。

1、DataFrame數(shù)據(jù)合并—merge()

1.1 簡(jiǎn)介:連接行,列數(shù)增加

根據(jù)一個(gè)或多個(gè)鍵將不同DataFrame中的連接起來(lái)。

說(shuō)明:類似于關(guān)系數(shù)據(jù)庫(kù)的連接(join)操作、excel的vlookup

應(yīng)用場(chǎng)景:

  • 針對(duì)同一個(gè)主鍵存在兩張包含不同字段的表,現(xiàn)在想把他們整合到一張表里。

  • 在此典型情況下,結(jié)果集的行數(shù)并沒(méi)有增加,列數(shù)則為兩個(gè)元數(shù)據(jù)的列數(shù)和減去連接鍵的數(shù)量

例:

原有的兩個(gè)DataFrame,分別為:df1;df2

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

合并后:按指定的鍵連接,列數(shù)增加,去掉了多余的鍵

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

1.2 格式

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False, sort=True,suffixes=('_x', '_y'), copy=True, indicator=False)

1.3 按指定的鍵連接

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

1.4 按索引連接

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

1.5 按多個(gè)鍵連接

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

結(jié)果:

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

1.6 參數(shù)說(shuō)明

  • on=None 用于指定用于連接的列名(鍵名),如果該列在兩個(gè)對(duì)象上的列名不同,則可以通過(guò) left_on=None, right_on=None 來(lái)分別指定

例:

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔
dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔
  • 或者想直接使用行索引作為連接鍵的話,就left_index=False, right_index=False 設(shè)為 True

例:

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔
dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔
  • how='inner' 參數(shù)指的是當(dāng)左右兩個(gè)對(duì)象中存在不重合的鍵時(shí),取結(jié)果的方式:inner 代表交集;outer 代表并集;left 和 right 分別為取一邊。

例:

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

inner和outer分別取交集和并集

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

left和right分別以一邊為參考合并

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔
  • suffixes=(‘_x’,‘_y’) 指的是當(dāng)左右對(duì)象中存在除連接鍵外相同列名時(shí),結(jié)果集中的區(qū)分方式,可各加一個(gè)小尾巴。

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

注:對(duì)于多對(duì)多連接,結(jié)果采用的是行的笛卡爾積。

2、DataFrame數(shù)據(jù)連接—concat()

2.1 簡(jiǎn)介:連接列,行數(shù)增加

  • 可以沿著一條軸將多個(gè)對(duì)象堆疊到一起,concat函數(shù)相當(dāng)于數(shù)據(jù)庫(kù)中的全連接(UNION ALL)

  • 可以指定按某個(gè)軸進(jìn)行連接,也可以指定連接的方式join(outer,inner 只有這兩種)

  • 與數(shù)據(jù)庫(kù)不同的是concat不會(huì)去重,要達(dá)到去重的效果可以使用drop_duplicates方法

2.2 格式

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,keys=None, levels=None, names=None, verify_integrity=False,copy=True)

2.3 參數(shù)說(shuō)明

  • 軸向連接 pd.concat() 就是單純地把兩個(gè)表拼在一起,這個(gè)過(guò)程也被稱作連接(concatenation)、綁定(binding)或堆疊(stacking)。

  • 因此可以想見(jiàn),這個(gè)函數(shù)的關(guān)鍵參數(shù)應(yīng)該是 axis,用于指定連接的軸向。

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔
  • 在默認(rèn)的 axis=0 情況下:

pd.concat([obj1,obj2]) 函數(shù)的效果與obj1.append(obj2) 是相同的,即obj1行與obj2行的疊加;

  • axis=1 的情況下:

pd.concat([df1,df2],axis=1)pd.merge(df1,df2,left_index=True,right_index=True,how='outer')的效果是相同的,即兩個(gè)DataFrame數(shù)據(jù)的按照索引進(jìn)行列的鏈接。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-612946.html

dataframe合并,pandas學(xué)習(xí)筆記,pandas,數(shù)據(jù)分析,python,Powered by 金山文檔

到了這里,關(guān)于pandas中DataFrame數(shù)據(jù)合并、連接的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • pandas--DataFrame--數(shù)據(jù)切片/篩選/取值
  • python中Pandas之DataFrame索引、選取數(shù)據(jù)

    總結(jié)一下 DataFrame 索引問(wèn)題 先創(chuàng)建一個(gè)簡(jiǎn)單的 DataFrame 。 DataFrame 中有兩種索引: 行索引( index ):對(duì)應(yīng)最左邊那一豎列 列索引( columns ):對(duì)應(yīng)最上面那一橫行 兩種索引默認(rèn)均為從 0 開(kāi)始的自增整數(shù)。 可以使用 index 這個(gè)參數(shù)指定行索引, columns 這個(gè)參數(shù)指定列索引。 輸出此時(shí)

    2023年04月08日
    瀏覽(18)
  • 【數(shù)據(jù)分析 - 基礎(chǔ)入門之pandas篇③】- pandas數(shù)據(jù)結(jié)構(gòu)——DataFrame

    【數(shù)據(jù)分析 - 基礎(chǔ)入門之pandas篇③】- pandas數(shù)據(jù)結(jié)構(gòu)——DataFrame

    大家好!我是一朵向陽(yáng)花(花花花)??,本期跟大家分享的知識(shí)是 pandas 數(shù)據(jù)結(jié)構(gòu)——DataFrame。 作者的【 Python 數(shù)據(jù)分析】專欄正在火熱更新中??,如果本文對(duì)您有幫助,歡迎大家點(diǎn)贊 + 評(píng)論 + 收藏 ! 每日金句分享: 慢慢來(lái),誰(shuí)還沒(méi)有一個(gè)努力的過(guò)程?!弧?pony「網(wǎng)易云

    2024年02月16日
    瀏覽(19)
  • pandas DataFrame內(nèi)存優(yōu)化技巧:讓數(shù)據(jù)處理更高效

    pandas DataFrame內(nèi)存優(yōu)化技巧:讓數(shù)據(jù)處理更高效

    Pandas 無(wú)疑是我們數(shù)據(jù)分析時(shí)一個(gè)不可或缺的工具,它以其強(qiáng)大的數(shù)據(jù)處理能力、靈活的數(shù)據(jù)結(jié)構(gòu)以及易于上手的API贏得了廣大數(shù)據(jù)分析師和機(jī)器學(xué)習(xí)工程師的喜愛(ài)。 然而,隨著數(shù)據(jù)量的不斷增長(zhǎng),如何高效、合理地管理內(nèi)存,確保 Pandas DataFrame 在運(yùn)行時(shí)不會(huì)因內(nèi)存不足而崩

    2024年03月14日
    瀏覽(39)
  • 【Python】【pandas】打印 DataFrame 的每一列數(shù)據(jù)類型。

    可以使用 dtypes 屬性來(lái)打印 DataFrame 的每一列數(shù)據(jù)類型。 dtypes 屬性返回一個(gè) Series,其中包含每個(gè)列的名稱和對(duì)應(yīng)的數(shù)據(jù)類型。 以下是打印 DataFrame 每一列數(shù)據(jù)類型的示例代碼: 這將輸出一個(gè)包含列名和數(shù)據(jù)類型的 Series。每一行都代表 DataFrame 的一列,列名作為索引,數(shù)據(jù)類

    2024年02月14日
    瀏覽(30)
  • Pandas 數(shù)據(jù)分析系列1--Series&DataFrame數(shù)據(jù)結(jié)構(gòu)詳解

    ?? P andas 是一個(gè)開(kāi)源的數(shù)據(jù)分析和數(shù)據(jù)處理庫(kù),是基于 NumPy 開(kāi)發(fā)的。它提供了靈活且高效的數(shù)據(jù)結(jié)構(gòu),使得處理和分析結(jié)構(gòu)化、缺失和時(shí)間序列數(shù)據(jù)變得更加容易。其在數(shù)據(jù)分析和數(shù)據(jù)處理領(lǐng)域廣泛應(yīng)用,在金融、社交媒體、科學(xué)研究等領(lǐng)域都有很高的使用率和廣泛的應(yīng)用

    2024年02月08日
    瀏覽(19)
  • python學(xué)習(xí)——pandas庫(kù)的使用之series及DataFrame創(chuàng)建、查看、切片、運(yùn)算

    python學(xué)習(xí)——pandas庫(kù)的使用之series及DataFrame創(chuàng)建、查看、切片、運(yùn)算

    Pandas是基于NumPy的數(shù)據(jù)分析模塊 Pandas納入了大量庫(kù)和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效操作大型數(shù)據(jù)集所需的工具 Pandas提供了大量能使我們快速便捷處理數(shù)據(jù)的函數(shù)和方法 Pandas的數(shù)據(jù)結(jié)構(gòu) Series :帶標(biāo)簽的一維數(shù)組,與Numpy中的一維array類似。與列表也很相近。 區(qū)別是:列表

    2024年02月03日
    瀏覽(50)
  • 【python】pandas-DataFrame類型數(shù)據(jù)重命名列表頭

    【python】pandas-DataFrame類型數(shù)據(jù)重命名列表頭

    目錄 0.環(huán)境 1.將DataFrame類型數(shù)據(jù)某一列重命名 windows + jupyter notebook + python? 使用場(chǎng)景: 在處理數(shù)據(jù)對(duì)齊的問(wèn)題時(shí),兩個(gè)表格的對(duì)齊列名不相同(一個(gè)數(shù)據(jù)集是DataFrame類型,一個(gè)數(shù)據(jù)集是geopandas類型),所以想修改一下DataFrame類型數(shù)據(jù)的某一列名字,特此記錄分享 1)重命名前

    2024年02月14日
    瀏覽(35)
  • Pandas.DataFrame.loc[ ] 篩選數(shù)據(jù)-標(biāo)簽法 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    Pandas.DataFrame.loc[ ] 篩選數(shù)據(jù)-標(biāo)簽法 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    關(guān)于Pandas版本: 本文基于 pandas2.2.0 編寫。 關(guān)于本文內(nèi)容更新: 隨著pandas的stable版本更迭,本文持續(xù)更新,不斷完善補(bǔ)充。 傳送門: Pandas API參考目錄 傳送門: Pandas 版本更新及新特性 傳送門: Pandas 由淺入深系列教程 Pandas.DataFrame.loc[] 方法用于通過(guò) 索引、列名 篩選 DataF

    2024年01月19日
    瀏覽(19)
  • Python 之 Pandas DataFrame 數(shù)據(jù)類型的簡(jiǎn)介、創(chuàng)建的列操作

    Python 之 Pandas DataFrame 數(shù)據(jù)類型的簡(jiǎn)介、創(chuàng)建的列操作

    DataFrame 是 Pandas 的重要數(shù)據(jù)結(jié)構(gòu)之一,也是在使用 Pandas 進(jìn)行數(shù)據(jù)分析過(guò)程中最常用的結(jié)構(gòu)之一,可以這么說(shuō),掌握了 DataFrame 的用法,你就擁有了學(xué)習(xí)數(shù)據(jù)分析的基本能力。 DataFrame 是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),既有行標(biāo)簽(index),又有列標(biāo)簽(columns),它也被稱異構(gòu)數(shù)據(jù)表

    2024年02月06日
    瀏覽(24)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包