国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<th id="ueo4i"></th>

<thead id="ueo4i"><div id="ueo4i"><small id="ueo4i"></small></div></thead>

pandas 篩選數(shù)據(jù)的 8 個騷操作

1年前作者：Elivis Hu分類：Toy博客閱讀(15)違法舉報

這篇具有很好參考價值的文章主要介紹了pandas 篩選數(shù)據(jù)的 8 個騷操作。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

日常用Python做數(shù)據(jù)分析最常用到的就是查詢篩選了，按各種條件、各種維度以及組合挑出我們想要的數(shù)據(jù)，以方便我們分析挖掘。

東哥總結(jié)了日常查詢和篩選常用的種騷操作，供各位學習參考。本文采用sklearn的boston數(shù)據(jù)舉例介紹。

from sklearn import datasets
import pandas as pd

boston = datasets.load_boston()
df = pd.DataFrame(boston.data, columns=boston.feature_names)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

1. []

第一種是最快捷方便的，直接在dataframe的[]中寫篩選的條件或者組合條件。比如下面，想要篩選出大于NOX這變量平均值的所有數(shù)據(jù)，然后按NOX降序排序。

df[df['NOX']>df['NOX'].mean()].sort_values(by='NOX',ascending=False).head()

外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳

當然，也可以使用組合條件，條件之間使用邏輯符號& |等。比如下面這個例子除了上面條件外再加上且條件CHAS為1，注意邏輯符號分開的條件要用()隔開。

df[(df['NOX']>df['NOX'].mean())& (df['CHAS'] ==1)].sort_values(by='NOX',ascending=False).head()

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

2. loc/iloc

除[]之外，loc/iloc應該是最常用的兩種查詢方法了。loc按標簽值（列名和行索引取值）訪問，iloc按數(shù)字索引訪問，均支持單值訪問或切片查詢。除了可以像[]按條件篩選數(shù)據(jù)以外，loc還可以指定返回的列變量，從行和列兩個維度篩選。

比如下面這個例子，按條件篩選出數(shù)據(jù)，并篩選出指定變量，然后賦值。

df.loc[(df['NOX']>df['NOX'].mean()),['CHAS']] = 2

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

3. isin

上面我們篩選條件< > == !=都是個范圍，但很多時候是需要鎖定某些具體的值的，這時候就需要isin了。比如我們要限定NOX取值只能為0.538,0.713,0.437中時。

df.loc[df['NOX'].isin([0.538,0.713,0.437]),:].sample(5)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

當然，也可以做取反操作，在篩選條件前加~符號即可。

df.loc[~df['NOX'].isin([0.538,0.713,0.437]),:].sample(5)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

4. str.contains

上面的舉例都是數(shù)值大小比較的篩選條件，除數(shù)值以外當然也有字符串的查詢需求。pandas里實現(xiàn)字符串的模糊篩選，可以用.str.contains()來實現(xiàn)，有點像在SQL語句里用的是like。

下面利用titanic的數(shù)據(jù)舉例，篩選出人名中包含Mrs或者Lily的數(shù)據(jù)，|或邏輯符號在引號內(nèi)。

train.loc[train['Name'].str.contains('Mrs|Lily'),:].head()

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

.str.contains()中還可以設置正則化篩選邏輯。

case=True：使用case指定區(qū)分大小寫
na=True：就表示把有NAN的轉(zhuǎn)換為布爾值True
flags=re.IGNORECASE：標志傳遞到re模塊，例如re.IGNORECASE
regex=True：regex ：如果為True，則假定第一個字符串是正則表達式，否則還是字符串

5. where/mask

在SQL里，我們知道where的功能是要把滿足條件的篩選出來。pandas中where也是篩選，但用法稍有不同。

where接受的條件需要是布爾類型的，如果不滿足匹配條件，就被賦值為默認的NaN或其他指定值。舉例如下，將Sex為male當作篩選條件，cond就是一列布爾型的Series，非male的值就都被賦值為默認的NaN空值了。

cond = train['Sex'] == 'male'
train['Sex'].where(cond, inplace=True)
train.head()

外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳

也可以用other賦給指定值。

cond = train['Sex'] == 'male'
train['Sex'].where(cond, other='FEMALE', inplace=True)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

甚至還可以寫組合條件。

train['quality'] = ''
traincond1 = train['Sex'] == 'male'
cond2 = train['Age'] > 25

train['quality'].where(cond1 & cond2, other='低質(zhì)量男性', inplace=True)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

mask和where是一對操作，與where正好反過來。

train['quality'].mask(cond1 & cond2, other='低質(zhì)量男性', inplace=True)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

6. query

這是一種非常優(yōu)雅的篩選數(shù)據(jù)方式。所有的篩選操作都在''之內(nèi)完成。

# 常用方式
train[train.Age > 25]
# query方式
train.query('Age > 25')

上面的兩種方式效果上是一樣的。再比如復雜點的，加入上面的str.contains用法的組合條件，注意條件里有''時，兩邊要用""包住。

train.query("Name.str.contains('William') & Age > 25")

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

在query里還可以通過@來設定變量。

name = 'William'
train.query("Name.str.contains(@name)")

7. filter

filter是另外一個獨特的篩選功能。filter不篩選具體數(shù)據(jù)，而是篩選特定的行或列。它支持三種篩選方式：

items：固定列名
regex：正則表達式
like：以及模糊查詢
axis：控制是行index或列columns的查詢

下面舉例介紹下。

train.filter(items=['Age', 'Sex'])

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

train.filter(regex='S', axis=1) # 列名包含S的

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

train.filter(like='2', axis=0) # 索引中有2的

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

train.filter(regex='^2', axis=0).filter(like='S', axis=1)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

8. any/all

any方法意思是，如果至少有一個值為True結(jié)果便為True，all需要所有值為True結(jié)果才為True，比如下面這樣。

>> train['Cabin'].all()
>> False
>> train['Cabin'].any()
>> True

any和all一般是需要和其它操作配合使用的，比如查看每列的空值情況。

train.isnull().any(axis=0)

pandas 篩選數(shù)據(jù)的 8 個騷操作,python,pandas

再比如查看含有空值的行數(shù)。

>>> train.isnull().any(axis=1).sum()
>>> 708

e


`any`和`all`一般是需要和其它操作配合使用的，比如查看每列的空值情況。

train.isnull().any(axis=0)


[外鏈圖片轉(zhuǎn)存中...(img-QYyk6pc2-1694485667807)]

再比如查看含有空值的行數(shù)。

train.isnull().any(axis=1).sum()
708文章來源地址http://www.zghlxwxcb.cn/news/detail-708104.html

到了這里，關于pandas 篩選數(shù)據(jù)的 8 個騷操作的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

篩選符合條件的數(shù)據(jù)行（Python Pandas 數(shù)據(jù)框中基于條件的行選擇）
篩選符合條件的數(shù)據(jù)行（Python Pandas 數(shù)據(jù)框中基于條件的行選擇）在處理數(shù)據(jù)的過程中，有時需要篩選出數(shù)據(jù)框中符合特定條件的行，以便對這些行進行進一步的處理或者分析。Python Pandas 庫提供了多種方式來實現(xiàn)基于條件的行選擇。下面我們將演示如何使用 Pandas 實現(xiàn)基于
2024年02月12日
瀏覽(32)
pandas--DataFrame--數(shù)據(jù)切片/篩選/取值
2024年02月13日
瀏覽(20)
別再低效篩選數(shù)據(jù)了！試試pandas query函數(shù)
數(shù)據(jù)過濾在數(shù)據(jù)分析過程中具有極其重要的地位，因為在真實世界的數(shù)據(jù)集中，往往存在重復、缺失或異常的數(shù)據(jù)。 pandas 提供的數(shù)據(jù)過濾功能可以幫助我們輕松地識別和處理這些問題數(shù)據(jù)，從而確保數(shù)據(jù)的質(zhì)量和準確性。今天介紹的 query 函數(shù)，為我們提供了強大靈活的數(shù)據(jù)
2024年03月09日
瀏覽(20)
Pandas.DataFrame.loc[ ] 篩選數(shù)據(jù)-標簽法詳解含代碼含測試數(shù)據(jù)集隨Pandas版本持續(xù)更新
關于Pandas版本：本文基于 pandas2.2.0 編寫。關于本文內(nèi)容更新：隨著pandas的stable版本更迭，本文持續(xù)更新，不斷完善補充。傳送門： Pandas API參考目錄傳送門： Pandas 版本更新及新特性傳送門： Pandas 由淺入深系列教程 Pandas.DataFrame.loc[] 方法用于通過索引、列名篩選 DataF
2024年01月19日
瀏覽(19)
Python實用技巧：Pandas--DataFrame--篩選和刪除含特定值的行與列
Python實用技巧：Pandas–DataFrame–篩選和刪除含特定值的行與列 ?? 個人主頁：高斯小哥 ?? 高質(zhì)量專欄：Matplotlib之旅：零基礎精通數(shù)據(jù)可視化、Python基礎【高質(zhì)量合集】、PyTorch零基礎入門教程 ?? 希望得到您的訂閱和支持~ ?? 創(chuàng)作高質(zhì)量博文，分享更多關于深度學習、PyT
2024年04月13日
瀏覽(18)
【100天精通Python】Day55：Python 數(shù)據(jù)分析_Pandas數(shù)據(jù)選取和常用操作
目錄 Pandas數(shù)據(jù)選擇和操作 1 選擇列和行 2 過濾數(shù)據(jù) 3 添加、刪除和修改數(shù)據(jù)
2024年02月09日
瀏覽(22)
Python 之 Pandas DataFrame 數(shù)據(jù)類型的簡介、創(chuàng)建的列操作
DataFrame 是 Pandas 的重要數(shù)據(jù)結(jié)構之一，也是在使用 Pandas 進行數(shù)據(jù)分析過程中最常用的結(jié)構之一，可以這么說，掌握了 DataFrame 的用法，你就擁有了學習數(shù)據(jù)分析的基本能力。 DataFrame 是一個表格型的數(shù)據(jù)結(jié)構，既有行標簽（index），又有列標簽（columns），它也被稱異構數(shù)據(jù)表
2024年02月06日
瀏覽(24)
【100天精通Python】Day59：Python 數(shù)據(jù)分析_Pandas高級功能-多層索引創(chuàng)建訪問切片和重塑操作，pandas自定義函數(shù)和映射功能
目錄 1 多層索引（MultiIndex） 1.1 創(chuàng)建多層索引 1.1.1 從元組創(chuàng)建多層索引
2024年02月09日
瀏覽(29)
【Pandas學習】多條件篩選DataFrame
目錄一、按列篩選 1、簡單篩選 2、多條件篩選? 二、按行篩選三、多條件組合 DataFrameSeries ?執(zhí)行、、 == 這些運算符時，會將每一個元素進行比較，得到一個由結(jié)果（ Boolean 值）組成的相同大小的 DataFrameSeries 返回。相同大小的 DataFrameSeries 之間可以用、 | 、 ~ 運算符進
2024年02月16日
瀏覽(19)
[數(shù)據(jù)分析實戰(zhàn)]對比用Excel和Python用來做數(shù)據(jù)分析的優(yōu)缺點，用Python的Pandas操作Excel數(shù)據(jù)表格原來如此簡單？還不趕緊學起來？
目錄首先，我先總結(jié)一下用Excel和Python用來做數(shù)據(jù)分析的優(yōu)缺點 Excel做數(shù)據(jù)分析的優(yōu)點： Excel做數(shù)據(jù)分析的缺點： Python做數(shù)據(jù)分析的優(yōu)點： Python做數(shù)據(jù)分析的缺點： 1.展示本例子中使用的數(shù)據(jù) 2.開始動手一、導入數(shù)據(jù)以及理解數(shù)據(jù)部分? 1.1查看數(shù)據(jù)維度(行列) 2.2.查看數(shù)據(jù)格
2024年02月04日
瀏覽(21)