1.讀取本的數(shù)據(jù)集
# 讀取本地的數(shù)據(jù)集
# 數(shù)據(jù)集可以私信我我發(fā)給你們,同樣也可以
df = pd.read_excel('data1.xlsx')
df
2.查看數(shù)據(jù)的前5行
使用head()函數(shù)查看數(shù)據(jù)的前幾行,可以傳入具體的數(shù),默認(rèn)是5
# 查看數(shù)據(jù)的前5行
df.head()
3.將salary列的數(shù)據(jù)轉(zhuǎn)換為最大值和最小值的平均值
map和apply函數(shù)接受的參數(shù)都是一個(gè)行數(shù),而且都不會(huì)直接改變?cè)瓟?shù)據(jù),都是返回一個(gè)新的DataFrame對(duì)象
# 將salary列數(shù)據(jù)轉(zhuǎn)換為最大值和最小值的平均值
# 方式一 使用map函數(shù)
def fun(x):
a,b = x.split('-')
a = int(a.strip('k'))*1000
b = int(b.strip('k'))*1000
return int((a+b)/2)
df['salary'].map(fun)
# 方式二使用apply函數(shù)
df['salary'] = df['salary'].apply(fun)
df
4.將數(shù)據(jù)根據(jù)學(xué)歷進(jìn)行分組計(jì)算平均值
使用groupby()函數(shù)進(jìn)行分組
# 將數(shù)據(jù)根據(jù)學(xué)歷進(jìn)行分組并計(jì)算平均值
df.groupby('education').mean()
5.將createTime列轉(zhuǎn)換為月日
# 將create Time列轉(zhuǎn)換為月日
for i in range(len(df)):
df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime('%m-%d')
df.head()
6.查看所索引,數(shù)據(jù)類型和內(nèi)存信息
info()函數(shù)
# 查看索引,數(shù)據(jù)類型,和內(nèi)存信息
df.info()
7.查看數(shù)值型列的匯總統(tǒng)計(jì)
describe() 返回的數(shù)據(jù)包括,數(shù)量,數(shù)據(jù)的平均值,標(biāo)準(zhǔn)差,最小值,最大值,25%、50% 75 % 的分位數(shù)
# 查看數(shù)值型列的匯總統(tǒng)計(jì)
df.describe()
8.新增一列根據(jù)salary將數(shù)據(jù)分為三組
# 新增一列根據(jù)salary將數(shù)據(jù)分為三組,并且設(shè)置等級(jí)
bins = [0,5000,20000,50000]
group_names = ['底','中','高']
df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df
9.按照salary列隊(duì)數(shù)據(jù)降序排序
sort_values 默認(rèn)是升序
# 按照salary列對(duì)數(shù)據(jù)降序排列
# ascending=False降序
# ascending=True升序
df.sort_values('salary',ascending=False)
10.取出第33行的數(shù)據(jù)
根據(jù)索引選出第33行,索引從0開始
# 取出第33行的數(shù)據(jù)
df.loc[32]
今天的10道題涉及的東西多了一些,
groupby
、describe
、cut
、sort_values
、info
等,如果想要全部的了解這些,僅靠這10道題是遠(yuǎn)遠(yuǎn)不夠的,希望大家能夠額外找些試題練習(xí),也可以根據(jù)跟著博主的文章一塊刷題???
推薦使用??途W(wǎng)進(jìn)行練習(xí) 直達(dá)???,快人一步
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-417601.html
歡迎您的關(guān)注文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-417601.html
到了這里,關(guān)于數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(3)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!