国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

pandas數(shù)據(jù)清洗——缺失值處理

這篇具有很好參考價(jià)值的文章主要介紹了pandas數(shù)據(jù)清洗——缺失值處理。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

查看缺失值

使用DataFrame對(duì)象的info()方法

pandas刪除缺失值,機(jī)器學(xué)習(xí),pandas,python,pandas,python
原始數(shù)據(jù)??

注:NaN為空缺值

?查看是否有缺失值

print(df.info())  # 查看是否有缺失值

?pandas刪除缺失值,機(jī)器學(xué)習(xí),pandas,python,pandas,python

?Non-Null Count列顯示的是每個(gè)索引中不是空缺的個(gè)數(shù)

判斷數(shù)據(jù)是否存在缺失值

使用DataFrame的isnull()方法和notnull()方法

1. isnull()方法——判斷是否為空,輸出結(jié)果為True和False,不為NaN時(shí)返回False,為NaN時(shí)返回True。

print(df.isnull())  # 結(jié)果為True或False, 不為NaN時(shí)為False

?

pandas刪除缺失值,機(jī)器學(xué)習(xí),pandas,python,pandas,python

?

2. notnull()方法——判斷是否不為空,輸出結(jié)果也是True和False,為NaNcy時(shí)返回False,不為NaN時(shí)返回True。

?

print(df.notnull()) # 不為NaN時(shí)為True

pandas刪除缺失值,機(jī)器學(xué)習(xí),pandas,python,pandas,python

?

缺失值的處理方式

????????1.不處理

? ? ? ? 有的數(shù)據(jù)空著也不影響整體,所以就放那吧。。。。。

????????2.刪除

? ? ? ? ?可以使用dropna()函數(shù),這個(gè)函數(shù)比較狂野,只要有一有個(gè)數(shù)據(jù)時(shí)空缺的,就會(huì)把整行刪除

df = df.dropna()  #將所有含空缺值的行都刪除

????????3.填充或替換

df['課程總數(shù)量'] = df['課程總數(shù)量'].fillna(0)  # 把‘課程總數(shù)量’中為空的值填充為0,并賦值給‘課程總數(shù)量’
print(df)

pandas刪除缺失值,機(jī)器學(xué)習(xí),pandas,python,pandas,python

重復(fù)值處理

刪除唄,見Pandas基本操作——增加、修改和刪除

# 判斷是否存在重復(fù)值,  值為True說(shuō)明為重復(fù)值
print(df.duplicated())
print('---------------------------')
# 刪除全部重復(fù)值
print(df.drop_duplicates())

# 刪除指定列的重復(fù)數(shù)據(jù),,,保留重復(fù)行的最后一行
print('---------刪除指定列的重復(fù)數(shù)據(jù)---------')
print(df.drop_duplicates(['買家實(shí)際付款金額'],keep='last')) # 刪除重復(fù)數(shù)據(jù)中的最后一條

# 直接刪除,保留一個(gè)副本
df1 = df.drop_duplicates(['買家實(shí)際付款金額'],inplace=False)
print(df1)

?-----------------------------------算是對(duì)今天學(xué)的東西的總結(jié)了-----------------------------文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-520370.html

到了這里,關(guān)于pandas數(shù)據(jù)清洗——缺失值處理的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【python】數(shù)據(jù)挖掘分析清洗——缺失值處理方法匯總

    【python】數(shù)據(jù)挖掘分析清洗——缺失值處理方法匯總

    本文鏈接:https://blog.csdn.net/weixin_47058355/article/details/128866686 數(shù)據(jù)挖掘系列: 缺失值處理方法匯總 離散化方法匯總 離群點(diǎn)(異常值)處理方法匯總 標(biāo)準(zhǔn)化(數(shù)據(jù)歸一化)處理方法匯總 特征選擇(特征篩選)方法匯總 特征選擇篩選(降維)方法匯總 分類預(yù)測(cè)方法匯總 看了下網(wǎng)絡(luò)上做

    2024年02月02日
    瀏覽(34)
  • 【100天精通Python】Day56:Python 數(shù)據(jù)分析_Pandas數(shù)據(jù)清洗和處理

    【100天精通Python】Day56:Python 數(shù)據(jù)分析_Pandas數(shù)據(jù)清洗和處理

    目錄 數(shù)據(jù)清洗和處理 1.處理缺失值 1.1 刪除缺失值: 1.2? 填充缺失值: 1.3 插值: 2 數(shù)據(jù)類型轉(zhuǎn)換 2.1 數(shù)據(jù)類型轉(zhuǎn)換 2.2 日期和時(shí)間的轉(zhuǎn)換: 2.3 分類數(shù)據(jù)的轉(zhuǎn)換: 2.4 自定義數(shù)據(jù)類型的轉(zhuǎn)換: 3 數(shù)據(jù)去重 4 數(shù)據(jù)合并和連接 數(shù)據(jù)清洗和處理 ????????在數(shù)據(jù)清洗和處理方面,

    2024年02月09日
    瀏覽(39)
  • 利用Python進(jìn)行數(shù)據(jù)清洗與預(yù)處理:Pandas的高級(jí)用法【第147篇—Pandas的高級(jí)用法】

    利用Python進(jìn)行數(shù)據(jù)清洗與預(yù)處理:Pandas的高級(jí)用法【第147篇—Pandas的高級(jí)用法】

    前些天發(fā)現(xiàn)了一個(gè)巨牛的人工智能學(xué)習(xí)網(wǎng)站,通俗易懂,風(fēng)趣幽默,忍不住分享一下給大家?!军c(diǎn)擊進(jìn)入巨牛的人工智能學(xué)習(xí)網(wǎng)站】。 在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域,數(shù)據(jù)清洗和預(yù)處理是至關(guān)重要的步驟。Pandas庫(kù)作為Python中最受歡迎的數(shù)據(jù)處理工具之一,提供了強(qiáng)大的功能來(lái)處

    2024年04月09日
    瀏覽(37)
  • <2>【深度學(xué)習(xí) × PyTorch】pandas | 數(shù)據(jù)預(yù)處理 | 處理缺失值:插值法 | networkx模塊繪制知識(shí)圖譜 | 線性代數(shù)初步

    ? 你永遠(yuǎn)不可能真正的去了解一個(gè)人,除非你穿過(guò)ta的鞋子,走過(guò)ta走過(guò)的路,站在ta的角度思考問(wèn)題,可當(dāng)你真正走過(guò)ta走過(guò)的路時(shí),你連路過(guò)都會(huì)覺得難過(guò)。有時(shí)候你所看到的,并非事實(shí)真相,你了解的,不過(guò)是浮在水面上的冰山一角。—————《殺死一只知更鳥》 ? ??

    2024年02月01日
    瀏覽(32)
  • 【機(jī)器學(xué)習(xí)5】數(shù)據(jù)處理(二)Pandas:表格處理

    【機(jī)器學(xué)習(xí)5】數(shù)據(jù)處理(二)Pandas:表格處理

    Pandas提供了三種數(shù)據(jù)類型,分別是 Series 、 DataFrame 和 Panel 。Series用于保存一維數(shù)據(jù),DataFrame用于保存二維數(shù)據(jù),Panel用于保存三維數(shù)據(jù)或者可變維數(shù)據(jù)。平時(shí)的表格處理數(shù)據(jù)分析最常用的數(shù)據(jù)類型是 Series 和 DataFrame ,Panel較少用到。 Series本質(zhì)上是一個(gè)含有索引的 一維數(shù)組

    2024年02月13日
    瀏覽(18)
  • 【第三章 Python 機(jī)器學(xué)習(xí)入門之Series和DataFrame的創(chuàng)建、索引、切片、數(shù)據(jù)清洗、數(shù)據(jù)分析等】

    【第三章 Python 機(jī)器學(xué)習(xí)入門之Series和DataFrame的創(chuàng)建、索引、切片、數(shù)據(jù)清洗、數(shù)據(jù)分析等】

    第一章 Python 機(jī)器學(xué)習(xí)入門之Pandas庫(kù)的使用 第二章 Python 機(jī)器學(xué)習(xí)入門之NumPy庫(kù)的使用 第四章 Python 機(jī)器學(xué)習(xí)入門之?dāng)?shù)據(jù)可視化 第五章 Python 機(jī)器學(xué)習(xí)入門之機(jī)器學(xué)習(xí)算法 第六章 Python 機(jī)器學(xué)習(xí)入門之實(shí)戰(zhàn)項(xiàng)目 Series是一種一維數(shù)組,可以通過(guò)以下方式創(chuàng)建: 通過(guò)列表創(chuàng)建Ser

    2024年02月05日
    瀏覽(96)
  • 機(jī)器學(xué)習(xí)案例:運(yùn)營(yíng)商客戶流失的數(shù)據(jù)分析 #數(shù)據(jù)去重#數(shù)據(jù)分組整合#缺失值處理#相關(guān)性分析#樣本平衡#決策樹、隨機(jī)森林、邏輯回歸

    機(jī)器學(xué)習(xí)案例:運(yùn)營(yíng)商客戶流失的數(shù)據(jù)分析 #數(shù)據(jù)去重#數(shù)據(jù)分組整合#缺失值處理#相關(guān)性分析#樣本平衡#決策樹、隨機(jī)森林、邏輯回歸

    前提: 隨著業(yè)務(wù)快速發(fā)展、電信市場(chǎng)的競(jìng)爭(zhēng)愈演愈烈。如何最大程度地挽留在網(wǎng)用戶、吸取新客戶,是電信企業(yè)最 關(guān)注的問(wèn)題之一。 客戶流失 會(huì)給企業(yè)帶來(lái)一系列損失,故在發(fā)展用戶每月增加的同時(shí),如何挽留和爭(zhēng)取更多 的用戶,也是一項(xiàng)非常重要的工作。 能否利用大數(shù)

    2024年02月08日
    瀏覽(34)
  • 機(jī)器翻譯的大數(shù)據(jù)挑戰(zhàn):數(shù)據(jù)清洗與處理

    機(jī)器翻譯是人工智能領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是讓計(jì)算機(jī)能夠自動(dòng)地將一種自然語(yǔ)言翻譯成另一種自然語(yǔ)言。隨著大數(shù)據(jù)時(shí)代的到來(lái),機(jī)器翻譯面臨著巨大的數(shù)據(jù)挑戰(zhàn)。這篇文章將從數(shù)據(jù)清洗和處理的角度探討機(jī)器翻譯的大數(shù)據(jù)挑戰(zhàn)。 機(jī)器翻譯具有廣泛的應(yīng)用,例如

    2024年04月15日
    瀏覽(19)
  • 數(shù)據(jù)分析缺失值處理(Missing Values)——?jiǎng)h除法、填充法、插值法

    數(shù)據(jù)分析缺失值處理(Missing Values)——?jiǎng)h除法、填充法、插值法

    缺失值指數(shù)據(jù)集中某些變量的值有缺少的情況,缺失值也被稱為NA(not available)值。在pandas里使用浮點(diǎn)值NaN(Not a Number)表示浮點(diǎn)數(shù)和非浮點(diǎn)數(shù)中的缺失值,用NaT表示時(shí)間序列中的缺失值,此外python內(nèi)置的None值也會(huì)被當(dāng)作是缺失值。需要注意的是,有些缺失值也會(huì)以其他形式

    2024年02月05日
    瀏覽(41)
  • pandas 缺失值、異常值提取和處理

    遍歷每列 - 列長(zhǎng)是否小于總長(zhǎng) -缺失值所在行: df[\\\'列名\\\'][df[\\\'列名‘].isnull().values==True ] 1. 缺失值處理 dropna()刪除缺失值 使用 fillna() 方法填充缺失值,可以使用指定的值、前一個(gè)有效值、后一個(gè)有效值或者均值、中位數(shù)等。 最后一行的邊界情況指的是第一行、最后一行等情況

    2024年02月19日
    瀏覽(16)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包