查看缺失值
使用DataFrame對(duì)象的info()方法

注:NaN為空缺值
?查看是否有缺失值
print(df.info()) # 查看是否有缺失值
?
?Non-Null Count列顯示的是每個(gè)索引中不是空缺的個(gè)數(shù)
判斷數(shù)據(jù)是否存在缺失值
使用DataFrame的isnull()方法和notnull()方法
1. isnull()方法——判斷是否為空,輸出結(jié)果為True和False,不為NaN時(shí)返回False,為NaN時(shí)返回True。
print(df.isnull()) # 結(jié)果為True或False, 不為NaN時(shí)為False
?
?
2. notnull()方法——判斷是否不為空,輸出結(jié)果也是True和False,為NaNcy時(shí)返回False,不為NaN時(shí)返回True。
?
print(df.notnull()) # 不為NaN時(shí)為True
?
缺失值的處理方式
????????1.不處理
? ? ? ? 有的數(shù)據(jù)空著也不影響整體,所以就放那吧。。。。。
????????2.刪除
? ? ? ? ?可以使用dropna()函數(shù),這個(gè)函數(shù)比較狂野,只要有一有個(gè)數(shù)據(jù)時(shí)空缺的,就會(huì)把整行刪除
df = df.dropna() #將所有含空缺值的行都刪除
????????3.填充或替換
df['課程總數(shù)量'] = df['課程總數(shù)量'].fillna(0) # 把‘課程總數(shù)量’中為空的值填充為0,并賦值給‘課程總數(shù)量’
print(df)
重復(fù)值處理
刪除唄,見Pandas基本操作——增加、修改和刪除文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-520370.html
# 判斷是否存在重復(fù)值, 值為True說(shuō)明為重復(fù)值
print(df.duplicated())
print('---------------------------')
# 刪除全部重復(fù)值
print(df.drop_duplicates())
# 刪除指定列的重復(fù)數(shù)據(jù),,,保留重復(fù)行的最后一行
print('---------刪除指定列的重復(fù)數(shù)據(jù)---------')
print(df.drop_duplicates(['買家實(shí)際付款金額'],keep='last')) # 刪除重復(fù)數(shù)據(jù)中的最后一條
# 直接刪除,保留一個(gè)副本
df1 = df.drop_duplicates(['買家實(shí)際付款金額'],inplace=False)
print(df1)
?-----------------------------------算是對(duì)今天學(xué)的東西的總結(jié)了-----------------------------文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-520370.html
到了這里,關(guān)于pandas數(shù)據(jù)清洗——缺失值處理的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!