1.實(shí)驗(yàn)?zāi)康?/h2>
掌握常見(jiàn)數(shù)據(jù)預(yù)處理方法,熟練運(yùn)用數(shù)據(jù)分析方法,并掌握?Python?中的?Numpy、 Pandas?模塊提供的數(shù)據(jù)分析方法。
2.實(shí)驗(yàn)內(nèi)容
1.?Pandas?基本數(shù)據(jù)處理
使用 Pandas?模塊,完成以下操作。
(1)創(chuàng)建一個(gè)由?0?到?50?之間的整數(shù)組成的 10?行 5?列的?dataframe。如下:

(2)匯總每一列的最小值。
(3)按行方向匯總每行數(shù)據(jù)的總和。

(4)按列方向匯總每列數(shù)據(jù)的總和。
代碼:
#創(chuàng)建一個(gè)由?0 到?50 之間的整數(shù)組成的?10 行?5 列的?dataframe
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(0, 50).reshape(10, 5))
# 輸出?dataframe
print('dataframe:',df)
# 匯總每一列的最小值
min_values = np.min(df, axis=0)
print("每列的最小值:", min_values)
# 按行方向匯總每行數(shù)據(jù)的總和
row_sums = np.sum(df, axis=1)
print("每行的總和:", row_sums)
# 按列方向匯總每列數(shù)據(jù)的總和
col_sums = np.sum(df, axis=0)
print("每列的總和:", col_sums)


2. ?城市夏季氣溫分析 在“tpData.csv”文件中存儲(chǔ)的是韓國(guó)某城市夏季的最高、最低氣溫?cái)?shù)據(jù),時(shí)間是
從?2013?年到 2018?年間,日期是從每年的?6?月?30?日到?8?月?30?日。其中?Present_Tmax
字段代表下午?2?點(diǎn)測(cè)量的最高溫度。Present_Tmin?代表凌晨?4?點(diǎn)測(cè)量的最低溫度。完 成以下操作。
(1)使用?Pandas?的?read_csv()函數(shù)讀取“tpData.csv”,并顯示數(shù)據(jù)。 import?pandas?as?pd
df?= pd.read_csv('tpData.csv')
#header:Year Month Day?Present_Tmax Present_Tmin df

圖?4-1 ??韓國(guó)某城市夏季溫度數(shù)據(jù)
(2)按年度分組,查看每年各有多少條數(shù)據(jù)。 操作提示:
使用 groupby?函數(shù),按 Year?字段分組。
#分組統(tǒng)計(jì)
df.groupby('Year').size() #查看組大小結(jié)果
(3)按年份統(tǒng)計(jì)每年的最高溫度的平均值。 操作提示:
使用?groupby?函數(shù),按?Year?字段分組,統(tǒng)計(jì) Present_Tmax?字段的平均值。
df.groupby('Year')['Present_Tmax'].mean()
(4)按月份統(tǒng)計(jì)?6、7、8?每個(gè)月的最高溫度的平均值。
df.groupby('Month')['Present_Tmax'].mean()
(5)按月份統(tǒng)計(jì)?6、7、8?每個(gè)月的最低溫度的平均值。
df.groupby('Month')['Present_Tmin'].mean()
代碼:
#使用?Pandas 的?read_csv()函數(shù)讀取“tpData.csv”,并顯示數(shù)據(jù)
import pandas as pd
df = pd.read_csv(r'D:\tpData.csv')
print(df)
#按年度分組,查看每年各有多少條數(shù)據(jù)。 操作提
print(df.groupby('Year').size())
#按年份統(tǒng)計(jì)每年的最高溫度的平均值。 操作提示
print(df.groupby('Year')['Present_Tmax'].mean())
#按月份統(tǒng)計(jì)?6、7、8 每個(gè)月的最高溫度的平均值。
print(df.groupby('Month')['Present_Tmax'].mean())
#按月份統(tǒng)計(jì)?6、7、8 每個(gè)月的最低溫度的平均值。
print(df.groupby('Month')['Present_Tmin'].mean()
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-845848.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-845848.html
到了這里,關(guān)于Python機(jī)器學(xué)習(xí)實(shí)驗(yàn) Python 數(shù)據(jù)分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!