国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

這篇具有很好參考價(jià)值的文章主要介紹了別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

數(shù)據(jù)過(guò)濾在數(shù)據(jù)分析過(guò)程中具有極其重要的地位,因?yàn)樵谡鎸?shí)世界的數(shù)據(jù)集中,往往存在重復(fù)、缺失或異常的數(shù)據(jù)。
pandas提供的數(shù)據(jù)過(guò)濾功能可以幫助我們輕松地識(shí)別和處理這些問(wèn)題數(shù)據(jù),從而確保數(shù)據(jù)的質(zhì)量和準(zhǔn)確性。

今天介紹的query函數(shù),為我們提供了強(qiáng)大靈活的數(shù)據(jù)過(guò)濾方式,有助于從復(fù)雜的數(shù)據(jù)集中提取有價(jià)值的信息,提高分析的效率。

1. 準(zhǔn)備數(shù)據(jù)

下面的示例中使用的數(shù)據(jù)采集自鏈家網(wǎng)的真實(shí)房屋成交數(shù)據(jù)。
數(shù)據(jù)下載地址:https://databook.top/。

導(dǎo)入數(shù)據(jù):

import pandas as pd

fp = "D:/data/南京二手房交易/南京建鄴區(qū).csv"

df = pd.read_csv(fp)
df.head()

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

2. query 使用示例

query提供的查詢接口非常靈活,可以用類似sql的方式組合查詢條件。

2.1. 比較

比較是最常用的過(guò)濾手段,
比如:相等比較,檢索2023年3月1日的成交數(shù)據(jù)。

df.query('dealDate == "2023.03.01"').head()

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

同樣,也可以進(jìn)行大于或者小于的比較:

# 成交總價(jià)大于1000萬(wàn)的房屋
df.query('totalPrice > 1000').head()

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

# 成交總價(jià)小于100萬(wàn)的房屋
df.query('totalPrice < 100').head()

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

2.2. 多條件組合

query函數(shù)中組合查詢條件也非常簡(jiǎn)單,它的查詢字符串中可以直接使用邏輯運(yùn)算符。
比如,邏輯與的查詢,用 & 來(lái)連接查詢條件。

# 總價(jià)大于1000萬(wàn),且每平米單價(jià)小于6萬(wàn)的房屋
df.query('totalPrice > 1000 & unitPrice < 60000').head()

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

邏輯或的查詢,用|來(lái)連接查詢條件。

# 總價(jià)小于200萬(wàn),或者每平米單價(jià)小于3萬(wàn)的房屋
df.query('totalPrice < 200 | unitPrice < 30000').head()

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)
因?yàn)槭?strong>邏輯或,兩個(gè)條件滿足一個(gè)就行,所以查詢出的數(shù)據(jù)有總價(jià)大于200萬(wàn),也有單價(jià)大于3萬(wàn)的數(shù)據(jù)。

還有一個(gè)邏輯非的運(yùn)算,用 not 關(guān)鍵字來(lái)表示。

2.3. 模糊查詢

除了比較,也可以對(duì)字符串進(jìn)行模糊查詢,類似sql中的LIKE檢索。
比如,查詢名稱包含萬(wàn)科的樓盤。

# 名稱包含萬(wàn)科
df.query('name.str.contains("萬(wàn)科")').head(5)

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

包含的字符串也支持正則表達(dá)式匹配,比如,查詢?nèi)f科樓盤中3室的房屋。

df.query('name.str.contains("萬(wàn)科.*3室")').head(5)

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

2.4. 匹配列表

查詢時(shí),可以匹配某個(gè)列表中的一項(xiàng),類似于SQL中的IN檢索。
比如,查詢?nèi)我馊齻€(gè)日期的房屋成交信息,且總價(jià)大于500萬(wàn)。

dates = ["2023.02.28", "2022.12.11", "2022.04.10"]
df.query('totalPrice > 600 & dealDate == @dates').head(5)

別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)

3. 總結(jié)

pandasDataFrame提供了各種過(guò)濾檢索數(shù)據(jù)的方式,與之相比,query函數(shù)允許用戶以字符串的形式對(duì)DataFrame進(jìn)行查詢操作。
這樣的好處有:文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-837878.html

  1. 直觀易讀:類似SQL的語(yǔ)法,且查詢語(yǔ)句以字符串形式表示,易于理解和閱讀,有助于提高代碼的可讀性
  2. 靈活性高:支持復(fù)雜的查詢條件,可以通過(guò)邏輯運(yùn)算符組合多個(gè)條件,也支持模糊的匹配方式
  3. 減少代碼量:可以減少編寫過(guò)濾和條件判斷的代碼量,使代碼更加簡(jiǎn)潔
  4. 易于調(diào)試:由于查詢語(yǔ)句以字符串形式表示,因此在調(diào)試過(guò)程中可以輕松地打印和查看查詢條件

到了這里,關(guān)于別再低效篩選數(shù)據(jù)了!試試pandas query函數(shù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【Python】數(shù)據(jù)分析+數(shù)據(jù)挖掘——探索Pandas中的數(shù)據(jù)篩選

    【Python】數(shù)據(jù)分析+數(shù)據(jù)挖掘——探索Pandas中的數(shù)據(jù)篩選

    當(dāng)涉及數(shù)據(jù)處理和分析時(shí),Pandas是Python編程語(yǔ)言中最強(qiáng)大、靈活且廣泛使用的工具之一。Pandas提供了豐富的功能和方法,使得數(shù)據(jù)的選擇、篩選和處理變得簡(jiǎn)單而高效。在本博客中,我們將重點(diǎn)介紹Pandas中數(shù)據(jù)篩選的關(guān)鍵知識(shí)點(diǎn),包括條件索引、邏輯操作符、 query() 方法以及

    2024年02月15日
    瀏覽(22)
  • Pandas.DataFrame.loc[ ] 篩選數(shù)據(jù)-標(biāo)簽法 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    Pandas.DataFrame.loc[ ] 篩選數(shù)據(jù)-標(biāo)簽法 詳解 含代碼 含測(cè)試數(shù)據(jù)集 隨Pandas版本持續(xù)更新

    關(guān)于Pandas版本: 本文基于 pandas2.2.0 編寫。 關(guān)于本文內(nèi)容更新: 隨著pandas的stable版本更迭,本文持續(xù)更新,不斷完善補(bǔ)充。 傳送門: Pandas API參考目錄 傳送門: Pandas 版本更新及新特性 傳送門: Pandas 由淺入深系列教程 Pandas.DataFrame.loc[] 方法用于通過(guò) 索引、列名 篩選 DataF

    2024年01月19日
    瀏覽(19)
  • Python 教學(xué) | Pandas 妙不可言的條件數(shù)據(jù)篩選

    Python 教學(xué) | Pandas 妙不可言的條件數(shù)據(jù)篩選

    目錄 Part 1? 前言 Part 2? Excel 的數(shù)據(jù)篩選與分布統(tǒng)計(jì) Part 3? Pandas 條件數(shù)據(jù)篩選 1、條件數(shù)據(jù)篩選的不同維度 (1) 比較數(shù)據(jù)值 (2) 是否為空值 (3) 文本內(nèi)容篩選 (4) 數(shù)據(jù)值長(zhǎng)度 (5) 日期篩選 (6) 其他 2、復(fù)合條件篩選 Part 4? 總結(jié) Part 5? Python教程 在 Python 中,第三方庫(kù) Pandas 是數(shù)據(jù)清

    2024年02月10日
    瀏覽(19)
  • 篩選符合條件的數(shù)據(jù)行(Python Pandas 數(shù)據(jù)框中基于條件的行選擇)

    篩選符合條件的數(shù)據(jù)行(Python Pandas 數(shù)據(jù)框中基于條件的行選擇) 在處理數(shù)據(jù)的過(guò)程中,有時(shí)需要篩選出數(shù)據(jù)框中符合特定條件的行,以便對(duì)這些行進(jìn)行進(jìn)一步的處理或者分析。Python Pandas 庫(kù)提供了多種方式來(lái)實(shí)現(xiàn)基于條件的行選擇。 下面我們將演示如何使用 Pandas 實(shí)現(xiàn)基于

    2024年02月12日
    瀏覽(32)
  • DataFrame.query()--Pandas

    DataFrame.query()--Pandas

    Pandas 中的一個(gè)函數(shù),用于在 DataFrame 中執(zhí)行查詢操作。這個(gè)方法會(huì)返回一個(gè)新的 DataFrame,其中包含符合查詢條件的數(shù)據(jù)行。請(qǐng)注意,query 方法只能用于篩選行,而不能用于篩選列。 參數(shù) 含義 expr 查詢字符串;對(duì)于不是有效python變量名的列名:如:UnitPrice(USD),需要將列名

    2024年02月11日
    瀏覽(24)
  • 【Pandas學(xué)習(xí)】多條件篩選DataFrame

    目錄 一、按列篩選 1、簡(jiǎn)單篩選 2、多條件篩選? 二、按行篩選 三、多條件組合 DataFrameSeries ?執(zhí)行 、 、 == 這些運(yùn)算符時(shí),會(huì)將每一個(gè)元素進(jìn)行比較,得到一個(gè)由結(jié)果( Boolean 值)組成的相同大小的 DataFrameSeries 返回。 相同大小的 DataFrameSeries 之間可以用 、 | 、 ~ 運(yùn)算符進(jìn)

    2024年02月16日
    瀏覽(19)
  • 5.14 PowerBI系列之DAX函數(shù)專題-DAX函數(shù)使切片器可篩選多列數(shù)據(jù)

    5.14 PowerBI系列之DAX函數(shù)專題-DAX函數(shù)使切片器可篩選多列數(shù)據(jù)

    需求:把多個(gè)列標(biāo)題當(dāng)作切片器篩選 思路: 1.創(chuàng)建一個(gè)輔助表將列轉(zhuǎn)成行; 2.寫度量值用于判斷當(dāng)期選擇的列和抓取對(duì)應(yīng)的數(shù)據(jù); 3.將度量值應(yīng)用到展示圖表的篩選器當(dāng)中 實(shí)現(xiàn) 將度量值‘產(chǎn)品大類篩選’0作為對(duì)應(yīng)視覺對(duì)象的展示條件。 需要注意的是,是否大于0是是否展現(xiàn)

    2024年02月12日
    瀏覽(18)
  • Python實(shí)用技巧:Pandas--DataFrame--篩選和刪除含特定值的行與列

    Python實(shí)用技巧:Pandas--DataFrame--篩選和刪除含特定值的行與列

    Python實(shí)用技巧:Pandas–DataFrame–篩選和刪除含特定值的行與列 ?? 個(gè)人主頁(yè):高斯小哥 ?? 高質(zhì)量專欄:Matplotlib之旅:零基礎(chǔ)精通數(shù)據(jù)可視化、Python基礎(chǔ)【高質(zhì)量合集】、PyTorch零基礎(chǔ)入門教程 ?? 希望得到您的訂閱和支持~ ?? 創(chuàng)作高質(zhì)量博文,分享更多關(guān)于深度學(xué)習(xí)、PyT

    2024年04月13日
    瀏覽(18)
  • 掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類

    掌握pandas cut函數(shù),一鍵實(shí)現(xiàn)數(shù)據(jù)分類

    pandas 中的 cut 函數(shù)可將一維數(shù)據(jù)按照給定的區(qū)間進(jìn)行分組,并為每個(gè)值分配對(duì)應(yīng)的標(biāo)簽。 其主要功能是將連續(xù)的數(shù)值數(shù)據(jù)轉(zhuǎn)化為離散的分組數(shù)據(jù),方便進(jìn)行分析和統(tǒng)計(jì)。 下面的示例中使用的數(shù)據(jù)采集自王者榮耀比賽的統(tǒng)計(jì)數(shù)據(jù)。 數(shù)據(jù)下載地址:https://databook.top/。 導(dǎo)入數(shù)據(jù):

    2024年03月09日
    瀏覽(21)
  • 7個(gè)Pandas繪圖函數(shù)助力數(shù)據(jù)可視化

    7個(gè)Pandas繪圖函數(shù)助力數(shù)據(jù)可視化

    大家好,在使用Pandas分析數(shù)據(jù)時(shí),會(huì)使用Pandas函數(shù)來(lái)過(guò)濾和轉(zhuǎn)換列,連接多個(gè)數(shù)據(jù)幀中的數(shù)據(jù)等操作。但是,生成圖表將數(shù)據(jù)在數(shù)據(jù)幀中可視化 , 通常比僅僅查看數(shù)字更有幫助。 Pandas具有幾個(gè)繪圖函數(shù),可以使用它們快速輕松地實(shí)現(xiàn)數(shù)據(jù)可視化,文中將介紹這些函數(shù)。 首先

    2024年01月21日
    瀏覽(48)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包