国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

python-數(shù)據(jù)分析-pandas

這篇具有很好參考價值的文章主要介紹了python-數(shù)據(jù)分析-pandas。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

4.1 pandas及其數(shù)據(jù)結(jié)構(gòu)

4.1.2Series數(shù)據(jù)結(jié)構(gòu)及其創(chuàng)建

第一種:通過標(biāo)量創(chuàng)建Series

import pandas as pd 
s1=pd.Series(62)
s1
0    62
dtype: int64
import pandas as pd 
s1=pd.Series(62,index=["x","y","z"])
s1
x    62
y    62
z    62
dtype: int64

第二種:通過列表創(chuàng)建Series

import pandas as pd 
s2=pd.Series([30,10,60],index=["x","y","z"])
s2

x    30
y    10
z    60
dtype: int64

第三種:通過字典創(chuàng)建Series

import pandas as pd
s3=pd.Series({"匪警":110,"火警":119,"急救中心":120,"交通事故":122})
s3
匪警        110
火警        119
急救中心    120
交通事故    122
dtype: int64

第四種:通過ndarray創(chuàng)建Series

import pandas as pd
import numpy as np
s4=pd.Series(np.arange(6),index=["a","b","c","d","e","f"])
s4
a    0
b    1
c    2
d    3
e    4
f    5
dtype: int32

values和index

import pandas as pd
s3=pd.Series({"匪警":110,"火警":119,"急救中心":120,"交通事故":122})
s3.index
s3.values
array([110, 119, 120, 122], dtype=int64)

索引和切片

import pandas as pd 
s2=pd.Series([30,10,60],index=["x","y","z"])
s2["x"]
30
s2[0]
30
s2[:2]
x    30
y    10
dtype: int64

4.1.3DataFrame數(shù)據(jù)結(jié)構(gòu)及其創(chuàng)建

第一種:通過一維列表構(gòu)成的字典創(chuàng)建DataFrame

import pandas as pd
d1={"姓名":["張三","李四","王五","趙六"],"數(shù)學(xué)":[87,45,34,98],"語文":[54,76,55,90],"計算機(jī)":[34,56,77,87]}
df1=pd.DataFrame(d1)
df1
姓名 數(shù)學(xué) 語文 計算機(jī)
0 張三 87 54 34
1 李四 45 76 56
2 王五 34 55 77
3 趙六 98 90 87
import pandas as pd
d1={"姓名":["張三","李四","王五","趙六"],"數(shù)學(xué)":[87,45,34,98],"語文":[54,76,55,90],"計算機(jī)":[34,56,77,87]}
df1=pd.DataFrame(d1,index=[101,102,103,104])
df1
姓名 數(shù)學(xué) 語文 計算機(jī)
101 張三 87 54 34
102 李四 45 76 56
103 王五 34 55 77
104 趙六 98 90 87

通過二維ndarray創(chuàng)建DataFrame

import pandas as pd
import numpy as np
nd1=np.arange(12).reshape(3,4)
nd1
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
df2=pd.DataFrame(nd1)
df2
0 1 2 3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
df2=pd.DataFrame(nd1,index=["a","b","c"])
df2
0 1 2 3
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11

values,index和columns三部分

import pandas as pd
d1={"姓名":["張三","李四","王五","趙六"],"數(shù)學(xué)":[87,45,34,98],"語文":[54,76,55,90],"計算機(jī)":[34,56,77,87]}
df1=pd.DataFrame(d1,index=[202201,202202,202203,202204])
df1
姓名 數(shù)學(xué) 語文 計算機(jī)
202201 張三 87 54 34
202202 李四 45 76 56
202203 王五 34 55 77
202204 趙六 98 90 87
df1.columns
Index(['姓名', '數(shù)學(xué)', '語文', '計算機(jī)'], dtype='object')
df1.index
Int64Index([202201, 202202, 202203, 202204], dtype='int64')
df1.values
array([['張三', 87, 54, 34],
       ['李四', 45, 76, 56],
       ['王五', 34, 55, 77],
       ['趙六', 98, 90, 87]], dtype=object)

4.2利用pandas導(dǎo)入導(dǎo)出數(shù)據(jù)

導(dǎo)入外部數(shù)據(jù)

import pandas as pd
f1=pd.read_csv("C:\\Users\\wsy\\Desktop\\a.csv")
f1
a b
0 1 2
1 2 4
2 3 6
3 4 8
4 5 10
5 6 12
6 7 14
7 8 16
8 9 18
import pandas as pd
f1=pd.read_csv("C:\\Users\\wsy\\Desktop\\b.csv",encoding="gbk")
f1
青海 西寧
0 1 2
1 2 4
2 3 6
3 4 8
4 5 10
5 6 12
6 7 14
7 8 16
8 9 18

導(dǎo)出外部數(shù)據(jù)

4.3數(shù)據(jù)概覽及預(yù)處理

import pandas as pd
pd.set_option("display.unicode.east_asian_width",True)#解決數(shù)據(jù)輸出時列名不對齊的問題
df=pd.read_excel("C:\\Users\\wsy\\Desktop\\cj.xlsx")
df
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
20 2020844022 關(guān)帥 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00
21 2020844023 劉嘉雯 會計學(xué) 89.575000 86.0 90.00 100.0 103.00
22 2020844024 劉浩天 會計學(xué) 85.100000 83.2 85.00 100.0 98.00
23 2020844025 劉宇 NaN 75.200000 85.6 76.00 100.0 89.00
24 2020844026 胡童 會計學(xué) 84.050000 86.0 91.00 100.0 119.00
25 2020844027 丁燦 會計學(xué) 88.750000 86.2 66.00 100.0 79.00
26 2020844028 鄭武田 會計學(xué) 89.550000 87.4 91.00 NaN 104.00
27 2020844029 金耀 會計學(xué) 79.450000 87.2 68.00 100.0 81.00
28 2020844030 龐博 會計學(xué) 89.700000 92.0 92.00 100.0 105.00
29 2020848001 王春楊 會計學(xué) 88.100000 89.8 84.00 100.0 97.00
30 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
31 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
32 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
33 2020848003 張淳 會計學(xué) 91.300000 92.2 81.32 100.0 94.32
34 2020848004 王佳琳 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00
35 2020848005 鄭彤 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00
36 2020848006 張鶴同 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00
39 2020848010 閆宇 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32
41 2020848013 曹一一 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32
42 2020848014 賈晶晶 NaN 84.450000 93.0 82.66 100.0 95.66
43 2020848015 賈淏文 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00
45 2020848017 趙迎辰 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00
46 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
47 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.00 100.0 96.00
49 2020848020 孟德坤 金融學(xué) 83.450000 87.4 80.66 100.0 93.66
50 2020848021 王少祖 金融學(xué) 82.950000 91.6 78.00 90.0 91.00
51 2020848023 黃金雨 金融學(xué) 79.950000 89.8 86.00 100.0 99.00
52 2020848024 湯佳怡 金融學(xué) 86.600000 83.4 88.32 100.0 101.32
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700000 93.2 86.32 100.0 99.32
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300000 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425000 85.4 71.66 100.0 84.66

4.3.1數(shù)據(jù)概覽分析

利用基礎(chǔ)屬性查看數(shù)據(jù)基本信息

print("索引:",df.index)
索引: RangeIndex(start=0, stop=57, step=1)
print("列名:",df.columns)
列名: Index(['學(xué)號', '姓名', '性別', '專業(yè)', '英語', '數(shù)學(xué)', 'Python', '選修',
       '管理學(xué)'], dtype='object')
print("數(shù)據(jù)元素:",df.values[:10])
數(shù)據(jù)元素: [[2020802045 '魏天' '男' '信息管理與信息系統(tǒng)' 67.11666666666667 90.80000000000001
  93.0 95.0 106.0]
 [2020844001 '郭夏' '男' '國際貿(mào)易' 91.05 83.4 86.0 100.0 99.0]
 [2020844002 '王曉加' '男' nan 54.2 83.4 74.0 nan 90.0]
 [2020844003 '黃婷婷' '女' '國際貿(mào)易' 87.8 91.4 79.66 95.0 92.66]
 [2020844004 '趙小瑜' nan '國際貿(mào)易' 61.15 82.2 84.66 100.0 97.66]
 [2020844005 '辛禧' '男' '國際貿(mào)易' 65.125 88.6 68.0 80.0 81.0]
 [2020844007 '王晨' '男' '國際貿(mào)易' 62.4 80.0 65.0 90.0 78.0]
 [2020844008 '韓天' '男' '國際貿(mào)易' 96.25 91.0 85.0 97.0 98.0]
 [2020844009 '劉玉' '女' '國際貿(mào)易' 89.05 91.4 80.32 100.0 93.32]
 [2020844010 '謝亞鵬' '男' '市場營銷' 70.5 85.2 60.0 90.0 73.0]]
print("數(shù)據(jù)類型:\n",df.dtypes)
數(shù)據(jù)類型:
 學(xué)號        int64
姓名       object
性別       object
專業(yè)       object
英語      float64
數(shù)學(xué)      float64
Python    float64
選修      float64
管理學(xué)    float64
dtype: object

利用基礎(chǔ)屬性查看數(shù)據(jù)規(guī)模

print("元素個數(shù):",df.size)
元素個數(shù): 513
print("維度數(shù):",df.ndim)
維度數(shù): 2
print("形狀:",df.shape)
形狀: (57, 9)
print("行數(shù):",df.index.size)
行數(shù): 57
print("列數(shù)",df.columns.size)
列數(shù) 9

利用常用方法查看樣本數(shù)據(jù)

df.head()
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
df.head(2)
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.0 95.0 106.0
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.0 100.0 99.0
df.tail()
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
52 2020848024 湯佳怡 金融學(xué) 86.600 83.4 88.32 100.0 101.32
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700 93.2 86.32 100.0 99.32
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425 85.4 71.66 100.0 84.66
df.tail(3)
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425 85.4 71.66 100.0 84.66

利用常用方法查看數(shù)據(jù)質(zhì)量

print(df.notnull())#查看數(shù)據(jù)的缺失值情況
    學(xué)號  姓名   性別   專業(yè)  英語  數(shù)學(xué)  Python   選修  管理學(xué)
0   True  True   True   True  True  True    True   True    True
1   True  True   True   True  True  True    True   True    True
2   True  True   True  False  True  True    True  False    True
3   True  True   True   True  True  True    True   True    True
4   True  True  False   True  True  True    True   True    True
5   True  True   True   True  True  True    True   True    True
6   True  True   True   True  True  True    True   True    True
7   True  True   True   True  True  True    True   True    True
8   True  True   True   True  True  True    True   True    True
9   True  True   True   True  True  True    True   True    True
10  True  True   True   True  True  True    True  False    True
11  True  True   True   True  True  True    True   True    True
12  True  True   True   True  True  True    True   True    True
13  True  True   True   True  True  True    True   True    True
14  True  True   True   True  True  True    True   True    True
15  True  True   True   True  True  True    True   True    True
16  True  True   True   True  True  True    True   True    True
17  True  True   True   True  True  True    True   True    True
18  True  True   True   True  True  True    True   True    True
19  True  True   True   True  True  True    True   True    True
20  True  True  False   True  True  True    True   True    True
21  True  True   True   True  True  True    True   True    True
22  True  True   True   True  True  True    True   True    True
23  True  True   True  False  True  True    True   True    True
24  True  True   True   True  True  True    True   True    True
25  True  True   True   True  True  True    True   True    True
26  True  True   True   True  True  True    True  False    True
27  True  True   True   True  True  True    True   True    True
28  True  True   True   True  True  True    True   True    True
29  True  True   True   True  True  True    True   True    True
30  True  True   True   True  True  True    True   True    True
31  True  True   True   True  True  True    True   True    True
32  True  True   True   True  True  True    True   True    True
33  True  True   True   True  True  True    True   True    True
34  True  True   True   True  True  True    True   True    True
35  True  True   True   True  True  True    True   True    True
36  True  True   True   True  True  True    True   True    True
37  True  True   True   True  True  True    True   True    True
38  True  True   True   True  True  True    True   True    True
39  True  True   True   True  True  True    True   True    True
40  True  True   True   True  True  True    True   True    True
41  True  True   True   True  True  True    True   True    True
42  True  True   True  False  True  True    True   True    True
43  True  True   True   True  True  True    True   True    True
44  True  True   True   True  True  True    True  False    True
45  True  True  False   True  True  True    True   True    True
46  True  True   True   True  True  True    True   True    True
47  True  True   True   True  True  True    True   True    True
48  True  True   True   True  True  True    True   True    True
49  True  True   True   True  True  True    True   True    True
50  True  True   True   True  True  True    True   True    True
51  True  True   True   True  True  True    True   True    True
52  True  True   True   True  True  True    True   True    True
53  True  True   True   True  True  True    True   True    True
54  True  True   True   True  True  True    True   True    True
55  True  True   True   True  True  True    True   True    True
56  True  True   True   True  True  True    True   True    True
print(df.isnull())#isna()是isnull()的別名
     學(xué)號   姓名   性別   專業(yè)   英語   數(shù)學(xué)  Python   選修  管理學(xué)
0   False  False  False  False  False  False   False  False   False
1   False  False  False  False  False  False   False  False   False
2   False  False  False   True  False  False   False   True   False
3   False  False  False  False  False  False   False  False   False
4   False  False   True  False  False  False   False  False   False
5   False  False  False  False  False  False   False  False   False
6   False  False  False  False  False  False   False  False   False
7   False  False  False  False  False  False   False  False   False
8   False  False  False  False  False  False   False  False   False
9   False  False  False  False  False  False   False  False   False
10  False  False  False  False  False  False   False   True   False
11  False  False  False  False  False  False   False  False   False
12  False  False  False  False  False  False   False  False   False
13  False  False  False  False  False  False   False  False   False
14  False  False  False  False  False  False   False  False   False
15  False  False  False  False  False  False   False  False   False
16  False  False  False  False  False  False   False  False   False
17  False  False  False  False  False  False   False  False   False
18  False  False  False  False  False  False   False  False   False
19  False  False  False  False  False  False   False  False   False
20  False  False   True  False  False  False   False  False   False
21  False  False  False  False  False  False   False  False   False
22  False  False  False  False  False  False   False  False   False
23  False  False  False   True  False  False   False  False   False
24  False  False  False  False  False  False   False  False   False
25  False  False  False  False  False  False   False  False   False
26  False  False  False  False  False  False   False   True   False
27  False  False  False  False  False  False   False  False   False
28  False  False  False  False  False  False   False  False   False
29  False  False  False  False  False  False   False  False   False
30  False  False  False  False  False  False   False  False   False
31  False  False  False  False  False  False   False  False   False
32  False  False  False  False  False  False   False  False   False
33  False  False  False  False  False  False   False  False   False
34  False  False  False  False  False  False   False  False   False
35  False  False  False  False  False  False   False  False   False
36  False  False  False  False  False  False   False  False   False
37  False  False  False  False  False  False   False  False   False
38  False  False  False  False  False  False   False  False   False
39  False  False  False  False  False  False   False  False   False
40  False  False  False  False  False  False   False  False   False
41  False  False  False  False  False  False   False  False   False
42  False  False  False   True  False  False   False  False   False
43  False  False  False  False  False  False   False  False   False
44  False  False  False  False  False  False   False   True   False
45  False  False   True  False  False  False   False  False   False
46  False  False  False  False  False  False   False  False   False
47  False  False  False  False  False  False   False  False   False
48  False  False  False  False  False  False   False  False   False
49  False  False  False  False  False  False   False  False   False
50  False  False  False  False  False  False   False  False   False
51  False  False  False  False  False  False   False  False   False
52  False  False  False  False  False  False   False  False   False
53  False  False  False  False  False  False   False  False   False
54  False  False  False  False  False  False   False  False   False
55  False  False  False  False  False  False   False  False   False
56  False  False  False  False  False  False   False  False   False
print("df中每個特征的缺失情況:\n",df.isna().sum())
df中每個特征的缺失情況:
 學(xué)號      0
姓名      0
性別      3
專業(yè)      3
英語      0
數(shù)學(xué)      0
Python    0
選修      4
管理學(xué)    0
dtype: int64
#判斷數(shù)據(jù)中是否有重復(fù)的
df.duplicated()
0     False
1     False
2     False
3     False
4     False
5     False
6     False
7     False
8     False
9     False
10    False
11    False
12    False
13    False
14    False
15    False
16    False
17    False
18    False
19    False
20    False
21    False
22    False
23    False
24    False
25    False
26    False
27    False
28    False
29    False
30    False
31     True
32     True
33    False
34    False
35    False
36    False
37    False
38    False
39    False
40    False
41    False
42    False
43    False
44    False
45    False
46    False
47     True
48    False
49    False
50    False
51    False
52    False
53    False
54    False
55    False
56    False
dtype: bool
#判斷指定列中是否有重復(fù)的
df.duplicated("姓名")
0     False
1     False
2     False
3     False
4     False
5     False
6     False
7     False
8     False
9     False
10    False
11    False
12    False
13    False
14    False
15    False
16    False
17    False
18    False
19    False
20    False
21    False
22    False
23    False
24    False
25    False
26    False
27    False
28    False
29    False
30    False
31     True
32     True
33    False
34    False
35    False
36    False
37    False
38    False
39    False
40    False
41    False
42    False
43    False
44    False
45    False
46    False
47     True
48    False
49    False
50    False
51    False
52    False
53    False
54    False
55    False
56    False
dtype: bool
df.info()#給出樣本數(shù)據(jù)的相關(guān)信息概覽 :行數(shù),列數(shù),列索引,列非空值個數(shù),列類型,內(nèi)存占用
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 57 entries, 0 to 56
Data columns (total 9 columns):
學(xué)號        57 non-null int64
姓名        57 non-null object
性別        54 non-null object
專業(yè)        54 non-null object
英語        57 non-null float64
數(shù)學(xué)        57 non-null float64
Python    57 non-null float64
選修        53 non-null float64
管理學(xué)       57 non-null float64
dtypes: float64(5), int64(1), object(3)
memory usage: 4.1+ KB

4.3.2數(shù)據(jù)清洗

import pandas as pd
pd.set_option("display.unicode.east_asian_width",True)#解決數(shù)據(jù)輸出時列名不對齊的問題
df=pd.read_excel("C:\\Users\\wsy\\Desktop\\cj.xlsx")
df
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
20 2020844022 關(guān)帥 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00
21 2020844023 劉嘉雯 會計學(xué) 89.575000 86.0 90.00 100.0 103.00
22 2020844024 劉浩天 會計學(xué) 85.100000 83.2 85.00 100.0 98.00
23 2020844025 劉宇 NaN 75.200000 85.6 76.00 100.0 89.00
24 2020844026 胡童 會計學(xué) 84.050000 86.0 91.00 100.0 119.00
25 2020844027 丁燦 會計學(xué) 88.750000 86.2 66.00 100.0 79.00
26 2020844028 鄭武田 會計學(xué) 89.550000 87.4 91.00 NaN 104.00
27 2020844029 金耀 會計學(xué) 79.450000 87.2 68.00 100.0 81.00
28 2020844030 龐博 會計學(xué) 89.700000 92.0 92.00 100.0 105.00
29 2020848001 王春楊 會計學(xué) 88.100000 89.8 84.00 100.0 97.00
30 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
31 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
32 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
33 2020848003 張淳 會計學(xué) 91.300000 92.2 81.32 100.0 94.32
34 2020848004 王佳琳 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00
35 2020848005 鄭彤 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00
36 2020848006 張鶴同 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00
39 2020848010 閆宇 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32
41 2020848013 曹一一 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32
42 2020848014 賈晶晶 NaN 84.450000 93.0 82.66 100.0 95.66
43 2020848015 賈淏文 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00
45 2020848017 趙迎辰 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00
46 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
47 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.00 100.0 96.00
49 2020848020 孟德坤 金融學(xué) 83.450000 87.4 80.66 100.0 93.66
50 2020848021 王少祖 金融學(xué) 82.950000 91.6 78.00 90.0 91.00
51 2020848023 黃金雨 金融學(xué) 79.950000 89.8 86.00 100.0 99.00
52 2020848024 湯佳怡 金融學(xué) 86.600000 83.4 88.32 100.0 101.32
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700000 93.2 86.32 100.0 99.32
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300000 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425000 85.4 71.66 100.0 84.66

缺失值處理

#存在任一缺失值即刪除
df1=df.dropna()
print("刪出前",df.shape)
print("刪出后",df1.shape)

刪出前 (57, 9)
刪出后 (48, 9)
#所有列均為缺失值即刪除
df1=df.dropna(how="all")
print("刪出前",df.shape)
print("刪出后",df1.shape)
刪出前 (57, 9)
刪出后 (57, 9)
#指定列均為缺失值即刪除
df1=df.dropna(how="all",subset=["專業(yè)","選修"])
print("刪出前",df.shape)
print("刪出后",df1.shape)
刪出前 (57, 9)
刪出后 (56, 9)
#保留某些屬性不存在缺失值的情況
df1=df[df["性別"].notnull()]
print("刪出前",df.shape)
print("刪出后",df1.shape)
df1
刪出前 (57, 9)
刪出后 (54, 9)
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
21 2020844023 劉嘉雯 會計學(xué) 89.575000 86.0 90.00 100.0 103.00
22 2020844024 劉浩天 會計學(xué) 85.100000 83.2 85.00 100.0 98.00
23 2020844025 劉宇 NaN 75.200000 85.6 76.00 100.0 89.00
24 2020844026 胡童 會計學(xué) 84.050000 86.0 91.00 100.0 119.00
25 2020844027 丁燦 會計學(xué) 88.750000 86.2 66.00 100.0 79.00
26 2020844028 鄭武田 會計學(xué) 89.550000 87.4 91.00 NaN 104.00
27 2020844029 金耀 會計學(xué) 79.450000 87.2 68.00 100.0 81.00
28 2020844030 龐博 會計學(xué) 89.700000 92.0 92.00 100.0 105.00
29 2020848001 王春楊 會計學(xué) 88.100000 89.8 84.00 100.0 97.00
30 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
31 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
32 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
33 2020848003 張淳 會計學(xué) 91.300000 92.2 81.32 100.0 94.32
34 2020848004 王佳琳 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00
35 2020848005 鄭彤 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00
36 2020848006 張鶴同 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00
39 2020848010 閆宇 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32
41 2020848013 曹一一 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32
42 2020848014 賈晶晶 NaN 84.450000 93.0 82.66 100.0 95.66
43 2020848015 賈淏文 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00
46 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
47 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.00 100.0 96.00
49 2020848020 孟德坤 金融學(xué) 83.450000 87.4 80.66 100.0 93.66
50 2020848021 王少祖 金融學(xué) 82.950000 91.6 78.00 90.0 91.00
51 2020848023 黃金雨 金融學(xué) 79.950000 89.8 86.00 100.0 99.00
52 2020848024 湯佳怡 金融學(xué) 86.600000 83.4 88.32 100.0 101.32
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700000 93.2 86.32 100.0 99.32
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300000 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425000 85.4 71.66 100.0 84.66
#將缺失值NaN填充為0
df["選修"].fillna(0)
0      95.0
1     100.0
2       0.0
3      95.0
4     100.0
5      80.0
6      90.0
7      97.0
8     100.0
9      90.0
10      0.0
11    100.0
12    100.0
13     80.0
14    100.0
15     95.0
16    100.0
17    100.0
18    100.0
19     87.0
20    100.0
21    100.0
22    100.0
23    100.0
24    100.0
25    100.0
26      0.0
27    100.0
28    100.0
29    100.0
30    100.0
31    100.0
32    100.0
33    100.0
34    100.0
35    100.0
36    100.0
37     68.0
38    100.0
39    100.0
40     77.0
41    100.0
42    100.0
43    100.0
44      0.0
45    100.0
46     90.0
47     90.0
48    100.0
49    100.0
50     90.0
51    100.0
52    100.0
53    100.0
54    100.0
55    100.0
56    100.0
Name: 選修, dtype: float64
#將缺失值NaN填充與后面的值相同
df["選修"].fillna(method="ffill")
0      95.0
1     100.0
2      95.0
3      95.0
4     100.0
5      80.0
6      90.0
7      97.0
8     100.0
9      90.0
10    100.0
11    100.0
12    100.0
13     80.0
14    100.0
15     95.0
16    100.0
17    100.0
18    100.0
19     87.0
20    100.0
21    100.0
22    100.0
23    100.0
24    100.0
25    100.0
26    100.0
27    100.0
28    100.0
29    100.0
30    100.0
31    100.0
32    100.0
33    100.0
34    100.0
35    100.0
36    100.0
37     68.0
38    100.0
39    100.0
40     77.0
41    100.0
42    100.0
43    100.0
44    100.0
45    100.0
46     90.0
47     90.0
48    100.0
49    100.0
50     90.0
51    100.0
52    100.0
53    100.0
54    100.0
55    100.0
56    100.0
Name: 選修, dtype: float64
import numpy as np
#將缺失值NaN填充選修課的平均分
df["選修"].fillna(np.mean(df["選修"]))
0      95.000000
1     100.000000
2      96.679245
3      95.000000
4     100.000000
5      80.000000
6      90.000000
7      97.000000
8     100.000000
9      90.000000
10     96.679245
11    100.000000
12    100.000000
13     80.000000
14    100.000000
15     95.000000
16    100.000000
17    100.000000
18    100.000000
19     87.000000
20    100.000000
21    100.000000
22    100.000000
23    100.000000
24    100.000000
25    100.000000
26     96.679245
27    100.000000
28    100.000000
29    100.000000
30    100.000000
31    100.000000
32    100.000000
33    100.000000
34    100.000000
35    100.000000
36    100.000000
37     68.000000
38    100.000000
39    100.000000
40     77.000000
41    100.000000
42    100.000000
43    100.000000
44     96.679245
45    100.000000
46     90.000000
47     90.000000
48    100.000000
49    100.000000
50     90.000000
51    100.000000
52    100.000000
53    100.000000
54    100.000000
55    100.000000
56    100.000000
Name: 選修, dtype: float64

重復(fù)值處理

#去除全部重復(fù)數(shù)據(jù)
df1=df.drop_duplicates()
print("去重前:",df.shape)
print("去重后:",df1.shape)
去重前: (57, 9)
去重后: (54, 9)
#去除指定列中重復(fù)數(shù)據(jù)
df1=df.drop_duplicates(["專業(yè)"])
print("去重前:",df.shape)
print("去重后:",df1.shape)
df1
去重前: (57, 9)
去重后: (6, 9)
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.0 95.0 106.0
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.0 100.0 99.0
2 2020844002 王曉加 NaN 54.200000 83.4 74.0 NaN 90.0
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.0 90.0 73.0
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.0 87.0 96.0
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.0 100.0 96.0
#去除指定列中重復(fù)數(shù)據(jù),設(shè)置keep參數(shù)
df1=df.drop_duplicates(["專業(yè)"],keep="last")
print("去重前:",df.shape)
print("去重后:",df1.shape)
df1
去重前: (57, 9)
去重后: (6, 9)
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
8 2020844009 劉玉 國際貿(mào)易 89.050 91.4 80.32 100.0 93.32
18 2020844020 張家齊 市場營銷 95.450 91.0 96.00 100.0 109.00
33 2020848003 張淳 會計學(xué) 91.300 92.2 81.32 100.0 94.32
42 2020848014 賈晶晶 NaN 84.450 93.0 82.66 100.0 95.66
47 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500 83.8 73.00 90.0 86.00
56 2020848031 任旭 金融學(xué) 83.425 85.4 71.66 100.0 84.66
#去除指定若干列中重復(fù)數(shù)據(jù)
df1=df.drop_duplicates(["學(xué)號","姓名"])
print("去重前:",df.shape)
print("去重后:",df1.shape)
df1
去重前: (57, 9)
去重后: (54, 9)
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
20 2020844022 關(guān)帥 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00
21 2020844023 劉嘉雯 會計學(xué) 89.575000 86.0 90.00 100.0 103.00
22 2020844024 劉浩天 會計學(xué) 85.100000 83.2 85.00 100.0 98.00
23 2020844025 劉宇 NaN 75.200000 85.6 76.00 100.0 89.00
24 2020844026 胡童 會計學(xué) 84.050000 86.0 91.00 100.0 119.00
25 2020844027 丁燦 會計學(xué) 88.750000 86.2 66.00 100.0 79.00
26 2020844028 鄭武田 會計學(xué) 89.550000 87.4 91.00 NaN 104.00
27 2020844029 金耀 會計學(xué) 79.450000 87.2 68.00 100.0 81.00
28 2020844030 龐博 會計學(xué) 89.700000 92.0 92.00 100.0 105.00
29 2020848001 王春楊 會計學(xué) 88.100000 89.8 84.00 100.0 97.00
30 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
33 2020848003 張淳 會計學(xué) 91.300000 92.2 81.32 100.0 94.32
34 2020848004 王佳琳 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00
35 2020848005 鄭彤 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00
36 2020848006 張鶴同 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00
39 2020848010 閆宇 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32
41 2020848013 曹一一 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32
42 2020848014 賈晶晶 NaN 84.450000 93.0 82.66 100.0 95.66
43 2020848015 賈淏文 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00
45 2020848017 趙迎辰 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00
46 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.00 100.0 96.00
49 2020848020 孟德坤 金融學(xué) 83.450000 87.4 80.66 100.0 93.66
50 2020848021 王少祖 金融學(xué) 82.950000 91.6 78.00 90.0 91.00
51 2020848023 黃金雨 金融學(xué) 79.950000 89.8 86.00 100.0 99.00
52 2020848024 湯佳怡 金融學(xué) 86.600000 83.4 88.32 100.0 101.32
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700000 93.2 86.32 100.0 99.32
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300000 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425000 85.4 71.66 100.0 84.66

4.3.3數(shù)據(jù)的抽取和合并

import pandas as pd
pd.set_option("display.unicode.east_asian_width",True)#解決數(shù)據(jù)輸出時列名不對齊的問題
df=pd.read_excel("C:\\Users\\wsy\\Desktop\\cj.xlsx")

數(shù)據(jù)抽取

1、抽取列
df.學(xué)號
0     2020802045
1     2020844001
2     2020844002
3     2020844003
4     2020844004
5     2020844005
6     2020844007
7     2020844008
8     2020844009
9     2020844010
10    2020844011
11    2020844012
12    2020844013
13    2020844014
14    2020844015
15    2020844017
16    2020844018
17    2020844019
18    2020844020
19    2020844021
20    2020844022
21    2020844023
22    2020844024
23    2020844025
24    2020844026
25    2020844027
26    2020844028
27    2020844029
28    2020844030
29    2020848001
30    2020848002
31    2020848002
32    2020848002
33    2020848003
34    2020848004
35    2020848005
36    2020848006
37    2020848007
38    2020848008
39    2020848010
40    2020848011
41    2020848013
42    2020848014
43    2020848015
44    2020848016
45    2020848017
46    2020848018
47    2020848018
48    2020848019
49    2020848020
50    2020848021
51    2020848023
52    2020848024
53    2020848027
54    2020848028
55    2020848029
56    2020848031
Name: 學(xué)號, dtype: int64
df["學(xué)號"]
type(df["學(xué)號"])
pandas.core.series.Series
df[["學(xué)號"]]
type(df[["學(xué)號"]])
pandas.core.frame.DataFrame
df[["學(xué)號","姓名","專業(yè)"]]
學(xué)號 姓名 專業(yè)
0 2020802045 魏天 信息管理與信息系統(tǒng)
1 2020844001 郭夏 國際貿(mào)易
2 2020844002 王曉加 NaN
3 2020844003 黃婷婷 國際貿(mào)易
4 2020844004 趙小瑜 國際貿(mào)易
5 2020844005 辛禧 國際貿(mào)易
6 2020844007 王晨 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
9 2020844010 謝亞鵬 市場營銷
10 2020844011 婁天楠 市場營銷
11 2020844012 唐喆 市場營銷
12 2020844013 史昀 市場營銷
13 2020844014 劉欣語 市場營銷
14 2020844015 王同 市場營銷
15 2020844017 武天一 市場營銷
16 2020844018 張析 市場營銷
17 2020844019 陳雨涵 市場營銷
18 2020844020 張家齊 市場營銷
19 2020844021 李赫桐 會計學(xué)
20 2020844022 關(guān)帥 會計學(xué)
21 2020844023 劉嘉雯 會計學(xué)
22 2020844024 劉浩天 會計學(xué)
23 2020844025 劉宇 NaN
24 2020844026 胡童 會計學(xué)
25 2020844027 丁燦 會計學(xué)
26 2020844028 鄭武田 會計學(xué)
27 2020844029 金耀 會計學(xué)
28 2020844030 龐博 會計學(xué)
29 2020848001 王春楊 會計學(xué)
30 2020848002 陳小恬 會計學(xué)
31 2020848002 陳小恬 會計學(xué)
32 2020848002 陳小恬 會計學(xué)
33 2020848003 張淳 會計學(xué)
34 2020848004 王佳琳 信息管理與信息系統(tǒng)
35 2020848005 鄭彤 信息管理與信息系統(tǒng)
36 2020848006 張鶴同 信息管理與信息系統(tǒng)
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng)
38 2020848008 方雨桃 信息管理與信息系統(tǒng)
39 2020848010 閆宇 信息管理與信息系統(tǒng)
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng)
41 2020848013 曹一一 信息管理與信息系統(tǒng)
42 2020848014 賈晶晶 NaN
43 2020848015 賈淏文 信息管理與信息系統(tǒng)
44 2020848016 楊帆 信息管理與信息系統(tǒng)
45 2020848017 趙迎辰 信息管理與信息系統(tǒng)
46 2020848018 郭曉舒 信息管理與信息系統(tǒng)
47 2020848018 郭曉舒 信息管理與信息系統(tǒng)
48 2020848019 張雨桐 金融學(xué)
49 2020848020 孟德坤 金融學(xué)
50 2020848021 王少祖 金融學(xué)
51 2020848023 黃金雨 金融學(xué)
52 2020848024 湯佳怡 金融學(xué)
53 2020848027 熱孜耶·買買提 金融學(xué)
54 2020848028 奴熱艾力·雪艾力 金融學(xué)
55 2020848029 林可新 金融學(xué)
56 2020848031 任旭 金融學(xué)
df.loc[:,["學(xué)號"]]
學(xué)號
0 2020802045
1 2020844001
2 2020844002
3 2020844003
4 2020844004
5 2020844005
6 2020844007
7 2020844008
8 2020844009
9 2020844010
10 2020844011
11 2020844012
12 2020844013
13 2020844014
14 2020844015
15 2020844017
16 2020844018
17 2020844019
18 2020844020
19 2020844021
20 2020844022
21 2020844023
22 2020844024
23 2020844025
24 2020844026
25 2020844027
26 2020844028
27 2020844029
28 2020844030
29 2020848001
30 2020848002
31 2020848002
32 2020848002
33 2020848003
34 2020848004
35 2020848005
36 2020848006
37 2020848007
38 2020848008
39 2020848010
40 2020848011
41 2020848013
42 2020848014
43 2020848015
44 2020848016
45 2020848017
46 2020848018
47 2020848018
48 2020848019
49 2020848020
50 2020848021
51 2020848023
52 2020848024
53 2020848027
54 2020848028
55 2020848029
56 2020848031
df.loc[:,["學(xué)號","姓名","專業(yè)"]]
學(xué)號 姓名 專業(yè)
0 2020802045 魏天 信息管理與信息系統(tǒng)
1 2020844001 郭夏 國際貿(mào)易
2 2020844002 王曉加 NaN
3 2020844003 黃婷婷 國際貿(mào)易
4 2020844004 趙小瑜 國際貿(mào)易
5 2020844005 辛禧 國際貿(mào)易
6 2020844007 王晨 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
9 2020844010 謝亞鵬 市場營銷
10 2020844011 婁天楠 市場營銷
11 2020844012 唐喆 市場營銷
12 2020844013 史昀 市場營銷
13 2020844014 劉欣語 市場營銷
14 2020844015 王同 市場營銷
15 2020844017 武天一 市場營銷
16 2020844018 張析 市場營銷
17 2020844019 陳雨涵 市場營銷
18 2020844020 張家齊 市場營銷
19 2020844021 李赫桐 會計學(xué)
20 2020844022 關(guān)帥 會計學(xué)
21 2020844023 劉嘉雯 會計學(xué)
22 2020844024 劉浩天 會計學(xué)
23 2020844025 劉宇 NaN
24 2020844026 胡童 會計學(xué)
25 2020844027 丁燦 會計學(xué)
26 2020844028 鄭武田 會計學(xué)
27 2020844029 金耀 會計學(xué)
28 2020844030 龐博 會計學(xué)
29 2020848001 王春楊 會計學(xué)
30 2020848002 陳小恬 會計學(xué)
31 2020848002 陳小恬 會計學(xué)
32 2020848002 陳小恬 會計學(xué)
33 2020848003 張淳 會計學(xué)
34 2020848004 王佳琳 信息管理與信息系統(tǒng)
35 2020848005 鄭彤 信息管理與信息系統(tǒng)
36 2020848006 張鶴同 信息管理與信息系統(tǒng)
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng)
38 2020848008 方雨桃 信息管理與信息系統(tǒng)
39 2020848010 閆宇 信息管理與信息系統(tǒng)
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng)
41 2020848013 曹一一 信息管理與信息系統(tǒng)
42 2020848014 賈晶晶 NaN
43 2020848015 賈淏文 信息管理與信息系統(tǒng)
44 2020848016 楊帆 信息管理與信息系統(tǒng)
45 2020848017 趙迎辰 信息管理與信息系統(tǒng)
46 2020848018 郭曉舒 信息管理與信息系統(tǒng)
47 2020848018 郭曉舒 信息管理與信息系統(tǒng)
48 2020848019 張雨桐 金融學(xué)
49 2020848020 孟德坤 金融學(xué)
50 2020848021 王少祖 金融學(xué)
51 2020848023 黃金雨 金融學(xué)
52 2020848024 湯佳怡 金融學(xué)
53 2020848027 熱孜耶·買買提 金融學(xué)
54 2020848028 奴熱艾力·雪艾力 金融學(xué)
55 2020848029 林可新 金融學(xué)
56 2020848031 任旭 金融學(xué)
df.iloc[:,[0,1,3]]
學(xué)號 姓名 專業(yè)
0 2020802045 魏天 信息管理與信息系統(tǒng)
1 2020844001 郭夏 國際貿(mào)易
2 2020844002 王曉加 NaN
3 2020844003 黃婷婷 國際貿(mào)易
4 2020844004 趙小瑜 國際貿(mào)易
5 2020844005 辛禧 國際貿(mào)易
6 2020844007 王晨 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
9 2020844010 謝亞鵬 市場營銷
10 2020844011 婁天楠 市場營銷
11 2020844012 唐喆 市場營銷
12 2020844013 史昀 市場營銷
13 2020844014 劉欣語 市場營銷
14 2020844015 王同 市場營銷
15 2020844017 武天一 市場營銷
16 2020844018 張析 市場營銷
17 2020844019 陳雨涵 市場營銷
18 2020844020 張家齊 市場營銷
19 2020844021 李赫桐 會計學(xué)
20 2020844022 關(guān)帥 會計學(xué)
21 2020844023 劉嘉雯 會計學(xué)
22 2020844024 劉浩天 會計學(xué)
23 2020844025 劉宇 NaN
24 2020844026 胡童 會計學(xué)
25 2020844027 丁燦 會計學(xué)
26 2020844028 鄭武田 會計學(xué)
27 2020844029 金耀 會計學(xué)
28 2020844030 龐博 會計學(xué)
29 2020848001 王春楊 會計學(xué)
30 2020848002 陳小恬 會計學(xué)
31 2020848002 陳小恬 會計學(xué)
32 2020848002 陳小恬 會計學(xué)
33 2020848003 張淳 會計學(xué)
34 2020848004 王佳琳 信息管理與信息系統(tǒng)
35 2020848005 鄭彤 信息管理與信息系統(tǒng)
36 2020848006 張鶴同 信息管理與信息系統(tǒng)
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng)
38 2020848008 方雨桃 信息管理與信息系統(tǒng)
39 2020848010 閆宇 信息管理與信息系統(tǒng)
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng)
41 2020848013 曹一一 信息管理與信息系統(tǒng)
42 2020848014 賈晶晶 NaN
43 2020848015 賈淏文 信息管理與信息系統(tǒng)
44 2020848016 楊帆 信息管理與信息系統(tǒng)
45 2020848017 趙迎辰 信息管理與信息系統(tǒng)
46 2020848018 郭曉舒 信息管理與信息系統(tǒng)
47 2020848018 郭曉舒 信息管理與信息系統(tǒng)
48 2020848019 張雨桐 金融學(xué)
49 2020848020 孟德坤 金融學(xué)
50 2020848021 王少祖 金融學(xué)
51 2020848023 黃金雨 金融學(xué)
52 2020848024 湯佳怡 金融學(xué)
53 2020848027 熱孜耶·買買提 金融學(xué)
54 2020848028 奴熱艾力·雪艾力 金融學(xué)
55 2020848029 林可新 金融學(xué)
56 2020848031 任旭 金融學(xué)
2、抽取行
df.loc[1:20,]
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
20 2020844022 關(guān)帥 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00
df.iloc[1:20,]
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
df.loc[[1,2,3,6,7],]
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
1 2020844001 郭夏 國際貿(mào)易 91.05 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.20 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.80 91.4 79.66 95.0 92.66
6 2020844007 王晨 國際貿(mào)易 62.40 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.25 91.0 85.00 97.0 98.00
df.iloc[[1,2,3,16,7],]
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
1 2020844001 郭夏 國際貿(mào)易 91.05 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.20 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.80 91.4 79.66 95.0 92.66
6 2020844007 王晨 國際貿(mào)易 62.40 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.25 91.0 85.00 97.0 98.00
df.loc[df.英語>90,]
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
1 2020844001 郭夏 國際貿(mào)易 91.05 83.4 86.00 100.0 99.00
7 2020844008 韓天 國際貿(mào)易 96.25 91.0 85.00 97.0 98.00
17 2020844019 陳雨涵 市場營銷 95.20 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.45 91.0 96.00 100.0 109.00
33 2020848003 張淳 會計學(xué) 91.30 92.2 81.32 100.0 94.32
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.25 89.2 79.32 68.0 92.32
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.10 86.2 83.00 100.0 96.00
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.20 89.6 96.32 77.0 109.32
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.70 87.6 95.00 NaN 108.00
53 2020848027 熱孜耶·買買提 金融學(xué) 92.70 93.2 86.32 100.0 99.32
4、抽取行列
df[["學(xué)號","姓名","專業(yè)"]][:10]
學(xué)號 姓名 專業(yè)
0 2020802045 魏天 信息管理與信息系統(tǒng)
1 2020844001 郭夏 國際貿(mào)易
2 2020844002 王曉加 NaN
3 2020844003 黃婷婷 國際貿(mào)易
4 2020844004 趙小瑜 國際貿(mào)易
5 2020844005 辛禧 國際貿(mào)易
6 2020844007 王晨 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
9 2020844010 謝亞鵬 市場營銷
df[["學(xué)號","姓名","專業(yè)"]][df.數(shù)學(xué)>90]
學(xué)號 姓名 專業(yè)
0 2020802045 魏天 信息管理與信息系統(tǒng)
3 2020844003 黃婷婷 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
14 2020844015 王同 市場營銷
16 2020844018 張析 市場營銷
17 2020844019 陳雨涵 市場營銷
18 2020844020 張家齊 市場營銷
20 2020844022 關(guān)帥 會計學(xué)
28 2020844030 龐博 會計學(xué)
30 2020848002 陳小恬 會計學(xué)
31 2020848002 陳小恬 會計學(xué)
32 2020848002 陳小恬 會計學(xué)
33 2020848003 張淳 會計學(xué)
34 2020848004 王佳琳 信息管理與信息系統(tǒng)
42 2020848014 賈晶晶 NaN
48 2020848019 張雨桐 金融學(xué)
50 2020848021 王少祖 金融學(xué)
53 2020848027 熱孜耶·買買提 金融學(xué)
df.loc[1:10,["學(xué)號","姓名","專業(yè)"]]
學(xué)號 姓名 專業(yè)
1 2020844001 郭夏 國際貿(mào)易
2 2020844002 王曉加 NaN
3 2020844003 黃婷婷 國際貿(mào)易
4 2020844004 趙小瑜 國際貿(mào)易
5 2020844005 辛禧 國際貿(mào)易
6 2020844007 王晨 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
9 2020844010 謝亞鵬 市場營銷
10 2020844011 婁天楠 市場營銷
df.iloc[1:10,2:5]
性別 專業(yè) 英語
1 國際貿(mào)易 91.050
2 NaN 54.200
3 國際貿(mào)易 87.800
4 NaN 國際貿(mào)易 61.150
5 國際貿(mào)易 65.125
6 國際貿(mào)易 62.400
7 國際貿(mào)易 96.250
8 國際貿(mào)易 89.050
9 市場營銷 70.500

數(shù)據(jù)合并

df1=df[["學(xué)號","姓名","專業(yè)"]][:10]
df2=df[["學(xué)號","Python"]][:10]
df3=df[["數(shù)學(xué)","選修"]][:10]
df4=df.loc[20:25,["學(xué)號","姓名","專業(yè)"]]
df1
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.0 95.0 106.0
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.0 100.0 99.0
2 2020844002 王曉加 NaN 54.200000 83.4 74.0 NaN 90.0
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.0 90.0 73.0
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.0 87.0 96.0
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.0 100.0 96.0
df2
學(xué)號 Python
0 2020802045 93.00
1 2020844001 86.00
2 2020844002 74.00
3 2020844003 79.66
4 2020844004 84.66
5 2020844005 68.00
6 2020844007 65.00
7 2020844008 85.00
8 2020844009 80.32
9 2020844010 60.00
1、按列合并
df1.join(df2)#有同名列,無法區(qū)分,報錯
---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

<ipython-input-237-92ca22d0224c> in <module>()
----> 1 df1.join(df2)#有同名列,無法區(qū)分,報錯


D:\anacoda\anzhuang\lib\site-packages\pandas\core\frame.py in join(self, other, on, how, lsuffix, rsuffix, sort)
   6334         # For SparseDataFrame's benefit
   6335         return self._join_compat(other, on=on, how=how, lsuffix=lsuffix,
-> 6336                                  rsuffix=rsuffix, sort=sort)
   6337 
   6338     def _join_compat(self, other, on=None, how='left', lsuffix='', rsuffix='',


D:\anacoda\anzhuang\lib\site-packages\pandas\core\frame.py in _join_compat(self, other, on, how, lsuffix, rsuffix, sort)
   6349             return merge(self, other, left_on=on, how=how,
   6350                          left_index=on is None, right_index=True,
-> 6351                          suffixes=(lsuffix, rsuffix), sort=sort)
   6352         else:
   6353             if on is not None:


D:\anacoda\anzhuang\lib\site-packages\pandas\core\reshape\merge.py in merge(left, right, how, on, left_on, right_on, left_index, right_index, sort, suffixes, copy, indicator, validate)
     60                          copy=copy, indicator=indicator,
     61                          validate=validate)
---> 62     return op.get_result()
     63 
     64 


D:\anacoda\anzhuang\lib\site-packages\pandas\core\reshape\merge.py in get_result(self)
    572 
    573         llabels, rlabels = items_overlap_with_suffix(ldata.items, lsuf,
--> 574                                                      rdata.items, rsuf)
    575 
    576         lindexers = {1: left_indexer} if left_indexer is not None else {}


D:\anacoda\anzhuang\lib\site-packages\pandas\core\internals.py in items_overlap_with_suffix(left, lsuffix, right, rsuffix)
   5242         if not lsuffix and not rsuffix:
   5243             raise ValueError('columns overlap but no suffix specified: '
-> 5244                              '{rename}'.format(rename=to_rename))
   5245 
   5246         def lrenamer(x):


ValueError: columns overlap but no suffix specified: Index(['學(xué)號', 'Python'], dtype='object')
df1.join(df3)#默認(rèn)以index為連接主鍵,可以不需要同名列
學(xué)號 姓名 專業(yè) 數(shù)學(xué) 選修
0 2020802045 魏天 信息管理與信息系統(tǒng) 90.8 95.0
1 2020844001 郭夏 國際貿(mào)易 83.4 100.0
2 2020844002 王曉加 NaN 83.4 NaN
3 2020844003 黃婷婷 國際貿(mào)易 91.4 95.0
4 2020844004 趙小瑜 國際貿(mào)易 82.2 100.0
5 2020844005 辛禧 國際貿(mào)易 88.6 80.0
6 2020844007 王晨 國際貿(mào)易 80.0 90.0
7 2020844008 韓天 國際貿(mào)易 91.0 97.0
8 2020844009 劉玉 國際貿(mào)易 91.4 100.0
9 2020844010 謝亞鵬 市場營銷 85.2 90.0
df1.join(df2,lsuffix="x")#給同名列起別名
學(xué)號x 姓名 專業(yè) 學(xué)號 Python
0 2020802045 魏天 信息管理與信息系統(tǒng) 2020802045 93.00
1 2020844001 郭夏 國際貿(mào)易 2020844001 86.00
2 2020844002 王曉加 NaN 2020844002 74.00
3 2020844003 黃婷婷 國際貿(mào)易 2020844003 79.66
4 2020844004 趙小瑜 國際貿(mào)易 2020844004 84.66
5 2020844005 辛禧 國際貿(mào)易 2020844005 68.00
6 2020844007 王晨 國際貿(mào)易 2020844007 65.00
7 2020844008 韓天 國際貿(mào)易 2020844008 85.00
8 2020844009 劉玉 國際貿(mào)易 2020844009 80.32
9 2020844010 謝亞鵬 市場營銷 2020844010 60.00
df1.merge(df3)#必須有同名列
---------------------------------------------------------------------------

MergeError                                Traceback (most recent call last)

<ipython-input-242-036768b080a3> in <module>()
----> 1 df1.merge(df3)#必須有同名列


D:\anacoda\anzhuang\lib\site-packages\pandas\core\frame.py in merge(self, right, how, on, left_on, right_on, left_index, right_index, sort, suffixes, copy, indicator, validate)
   6387                      right_on=right_on, left_index=left_index,
   6388                      right_index=right_index, sort=sort, suffixes=suffixes,
-> 6389                      copy=copy, indicator=indicator, validate=validate)
   6390 
   6391     def round(self, decimals=0, *args, **kwargs):


D:\anacoda\anzhuang\lib\site-packages\pandas\core\reshape\merge.py in merge(left, right, how, on, left_on, right_on, left_index, right_index, sort, suffixes, copy, indicator, validate)
     59                          right_index=right_index, sort=sort, suffixes=suffixes,
     60                          copy=copy, indicator=indicator,
---> 61                          validate=validate)
     62     return op.get_result()
     63 


D:\anacoda\anzhuang\lib\site-packages\pandas\core\reshape\merge.py in __init__(self, left, right, how, on, left_on, right_on, axis, left_index, right_index, sort, suffixes, copy, indicator, validate)
    544             warnings.warn(msg, UserWarning)
    545 
--> 546         self._validate_specification()
    547 
    548         # note this function has side effects


D:\anacoda\anzhuang\lib\site-packages\pandas\core\reshape\merge.py in _validate_specification(self)
   1033                         'left_index={lidx}, right_index={ridx}'
   1034                         .format(lon=self.left_on, ron=self.right_on,
-> 1035                                 lidx=self.left_index, ridx=self.right_index))
   1036                 if not common_cols.is_unique:
   1037                     raise MergeError("Data columns not unique: {common!r}"


MergeError: No common columns to perform merge on. Merge options: left_on=None, right_on=None, left_index=False, right_index=False
df1.merge(df2)#可以按照同名列進(jìn)行連接,自動刪除同名列
學(xué)號 姓名 專業(yè) Python
0 2020802045 魏天 信息管理與信息系統(tǒng) 93.00
1 2020844001 郭夏 國際貿(mào)易 86.00
2 2020844002 王曉加 NaN 74.00
3 2020844003 黃婷婷 國際貿(mào)易 79.66
4 2020844004 趙小瑜 國際貿(mào)易 84.66
5 2020844005 辛禧 國際貿(mào)易 68.00
6 2020844007 王晨 國際貿(mào)易 65.00
7 2020844008 韓天 國際貿(mào)易 85.00
8 2020844009 劉玉 國際貿(mào)易 80.32
9 2020844010 謝亞鵬 市場營銷 60.00
ddf=pd.merge(df1,df2)
ddf
學(xué)號 姓名 專業(yè) Python
0 2020802045 魏天 信息管理與信息系統(tǒng) 93.00
1 2020844001 郭夏 國際貿(mào)易 86.00
2 2020844002 王曉加 NaN 74.00
3 2020844003 黃婷婷 國際貿(mào)易 79.66
4 2020844004 趙小瑜 國際貿(mào)易 84.66
5 2020844005 辛禧 國際貿(mào)易 68.00
6 2020844007 王晨 國際貿(mào)易 65.00
7 2020844008 韓天 國際貿(mào)易 85.00
8 2020844009 劉玉 國際貿(mào)易 80.32
9 2020844010 謝亞鵬 市場營銷 60.00
ddf=pd.concat([df1,df2],axis=1)#按行拼接
ddf
學(xué)號 姓名 專業(yè) 學(xué)號 Python
0 2020802045 魏天 信息管理與信息系統(tǒng) 2020802045 93.00
1 2020844001 郭夏 國際貿(mào)易 2020844001 86.00
2 2020844002 王曉加 NaN 2020844002 74.00
3 2020844003 黃婷婷 國際貿(mào)易 2020844003 79.66
4 2020844004 趙小瑜 國際貿(mào)易 2020844004 84.66
5 2020844005 辛禧 國際貿(mào)易 2020844005 68.00
6 2020844007 王晨 國際貿(mào)易 2020844007 65.00
7 2020844008 韓天 國際貿(mào)易 2020844008 85.00
8 2020844009 劉玉 國際貿(mào)易 2020844009 80.32
9 2020844010 謝亞鵬 市場營銷 2020844010 60.00
2、按行合并
df1.append(df4)#有相同列
學(xué)號 姓名 專業(yè)
0 2020802045 魏天 信息管理與信息系統(tǒng)
1 2020844001 郭夏 國際貿(mào)易
2 2020844002 王曉加 NaN
3 2020844003 黃婷婷 國際貿(mào)易
4 2020844004 趙小瑜 國際貿(mào)易
5 2020844005 辛禧 國際貿(mào)易
6 2020844007 王晨 國際貿(mào)易
7 2020844008 韓天 國際貿(mào)易
8 2020844009 劉玉 國際貿(mào)易
9 2020844010 謝亞鵬 市場營銷
20 2020844022 關(guān)帥 會計學(xué)
21 2020844023 劉嘉雯 會計學(xué)
22 2020844024 劉浩天 會計學(xué)
23 2020844025 劉宇 NaN
24 2020844026 胡童 會計學(xué)
25 2020844027 丁燦 會計學(xué)
df1.append(df3) #列不相同,實現(xiàn)并集拼接
D:\anacoda\anzhuang\lib\site-packages\pandas\core\frame.py:6211: FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.

To retain the current behavior and silence the warning, pass 'sort=True'.

  sort=sort)
專業(yè) 姓名 學(xué)號 數(shù)學(xué) 選修
0 信息管理與信息系統(tǒng) 魏天 2.020802e+09 NaN NaN
1 國際貿(mào)易 郭夏 2.020844e+09 NaN NaN
2 NaN 王曉加 2.020844e+09 NaN NaN
3 國際貿(mào)易 黃婷婷 2.020844e+09 NaN NaN
4 國際貿(mào)易 趙小瑜 2.020844e+09 NaN NaN
5 國際貿(mào)易 辛禧 2.020844e+09 NaN NaN
6 國際貿(mào)易 王晨 2.020844e+09 NaN NaN
7 國際貿(mào)易 韓天 2.020844e+09 NaN NaN
8 國際貿(mào)易 劉玉 2.020844e+09 NaN NaN
9 市場營銷 謝亞鵬 2.020844e+09 NaN NaN
0 NaN NaN NaN 90.8 95.0
1 NaN NaN NaN 83.4 100.0
2 NaN NaN NaN 83.4 NaN
3 NaN NaN NaN 91.4 95.0
4 NaN NaN NaN 82.2 100.0
5 NaN NaN NaN 88.6 80.0
6 NaN NaN NaN 80.0 90.0
7 NaN NaN NaN 91.0 97.0
8 NaN NaN NaN 91.4 100.0
9 NaN NaN NaN 85.2 90.0
pd.concat([df1,df2,df3],axis=0,join="outer")#按行拼接   #inner 
D:\anacoda\anzhuang\lib\site-packages\ipykernel_launcher.py:1: FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.

To retain the current behavior and silence the warning, pass 'sort=True'.

  """Entry point for launching an IPython kernel.
Python 專業(yè) 姓名 學(xué)號 數(shù)學(xué) 選修
0 NaN 信息管理與信息系統(tǒng) 魏天 2.020802e+09 NaN NaN
1 NaN 國際貿(mào)易 郭夏 2.020844e+09 NaN NaN
2 NaN NaN 王曉加 2.020844e+09 NaN NaN
3 NaN 國際貿(mào)易 黃婷婷 2.020844e+09 NaN NaN
4 NaN 國際貿(mào)易 趙小瑜 2.020844e+09 NaN NaN
5 NaN 國際貿(mào)易 辛禧 2.020844e+09 NaN NaN
6 NaN 國際貿(mào)易 王晨 2.020844e+09 NaN NaN
7 NaN 國際貿(mào)易 韓天 2.020844e+09 NaN NaN
8 NaN 國際貿(mào)易 劉玉 2.020844e+09 NaN NaN
9 NaN 市場營銷 謝亞鵬 2.020844e+09 NaN NaN
0 93.00 NaN NaN 2.020802e+09 NaN NaN
1 86.00 NaN NaN 2.020844e+09 NaN NaN
2 74.00 NaN NaN 2.020844e+09 NaN NaN
3 79.66 NaN NaN 2.020844e+09 NaN NaN
4 84.66 NaN NaN 2.020844e+09 NaN NaN
5 68.00 NaN NaN 2.020844e+09 NaN NaN
6 65.00 NaN NaN 2.020844e+09 NaN NaN
7 85.00 NaN NaN 2.020844e+09 NaN NaN
8 80.32 NaN NaN 2.020844e+09 NaN NaN
9 60.00 NaN NaN 2.020844e+09 NaN NaN
0 NaN NaN NaN NaN 90.8 95.0
1 NaN NaN NaN NaN 83.4 100.0
2 NaN NaN NaN NaN 83.4 NaN
3 NaN NaN NaN NaN 91.4 95.0
4 NaN NaN NaN NaN 82.2 100.0
5 NaN NaN NaN NaN 88.6 80.0
6 NaN NaN NaN NaN 80.0 90.0
7 NaN NaN NaN NaN 91.0 97.0
8 NaN NaN NaN NaN 91.4 100.0
9 NaN NaN NaN NaN 85.2 90.0

4.3.4數(shù)據(jù)的增刪改

import pandas as pd
pd.set_option("display.unicode.east_asian_width",True)#解決數(shù)據(jù)輸出時列名不對齊的問題
df=pd.read_excel("C:\\Users\\wsy\\Desktop\\cj.xlsx")
df
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué)
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00
20 2020844022 關(guān)帥 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00
21 2020844023 劉嘉雯 會計學(xué) 89.575000 86.0 90.00 100.0 103.00
22 2020844024 劉浩天 會計學(xué) 85.100000 83.2 85.00 100.0 98.00
23 2020844025 劉宇 NaN 75.200000 85.6 76.00 100.0 89.00
24 2020844026 胡童 會計學(xué) 84.050000 86.0 91.00 100.0 119.00
25 2020844027 丁燦 會計學(xué) 88.750000 86.2 66.00 100.0 79.00
26 2020844028 鄭武田 會計學(xué) 89.550000 87.4 91.00 NaN 104.00
27 2020844029 金耀 會計學(xué) 79.450000 87.2 68.00 100.0 81.00
28 2020844030 龐博 會計學(xué) 89.700000 92.0 92.00 100.0 105.00
29 2020848001 王春楊 會計學(xué) 88.100000 89.8 84.00 100.0 97.00
30 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
31 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
32 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00
33 2020848003 張淳 會計學(xué) 91.300000 92.2 81.32 100.0 94.32
34 2020848004 王佳琳 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00
35 2020848005 鄭彤 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00
36 2020848006 張鶴同 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00
39 2020848010 閆宇 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32
41 2020848013 曹一一 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32
42 2020848014 賈晶晶 NaN 84.450000 93.0 82.66 100.0 95.66
43 2020848015 賈淏文 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00
45 2020848017 趙迎辰 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00
46 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
47 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.00 100.0 96.00
49 2020848020 孟德坤 金融學(xué) 83.450000 87.4 80.66 100.0 93.66
50 2020848021 王少祖 金融學(xué) 82.950000 91.6 78.00 90.0 91.00
51 2020848023 黃金雨 金融學(xué) 79.950000 89.8 86.00 100.0 99.00
52 2020848024 湯佳怡 金融學(xué) 86.600000 83.4 88.32 100.0 101.32
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700000 93.2 86.32 100.0 99.32
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000000 75.0 63.32 100.0 76.32
55 2020848029 林可新 金融學(xué) 89.300000 87.4 95.00 100.0 108.00
56 2020848031 任旭 金融學(xué) 83.425000 85.4 71.66 100.0 84.66
數(shù)據(jù)增加
#在最后增加列
df["團(tuán)員否"]=True
df
學(xué)號 姓名 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué) 團(tuán)員否
0 2020802045 魏天 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00 True
1 2020844001 郭夏 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00 True
2 2020844002 王曉加 NaN 54.200000 83.4 74.00 NaN 90.00 True
3 2020844003 黃婷婷 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66 True
4 2020844004 趙小瑜 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66 True
5 2020844005 辛禧 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00 True
6 2020844007 王晨 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00 True
7 2020844008 韓天 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00 True
8 2020844009 劉玉 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32 True
9 2020844010 謝亞鵬 市場營銷 70.500000 85.2 60.00 90.0 73.00 True
10 2020844011 婁天楠 市場營銷 58.800000 84.6 60.00 NaN 73.00 True
11 2020844012 唐喆 市場營銷 80.233333 87.4 64.00 100.0 77.00 True
12 2020844013 史昀 市場營銷 82.733333 82.2 73.32 100.0 86.32 True
13 2020844014 劉欣語 市場營銷 48.718333 83.8 86.00 80.0 99.00 True
14 2020844015 王同 市場營銷 74.200000 92.2 92.00 100.0 115.00 True
15 2020844017 武天一 市場營銷 73.216667 83.2 79.00 95.0 92.00 True
16 2020844018 張析 市場營銷 82.750000 92.0 92.00 100.0 105.00 True
17 2020844019 陳雨涵 市場營銷 95.200000 95.0 88.00 100.0 101.00 True
18 2020844020 張家齊 市場營銷 95.450000 91.0 96.00 100.0 109.00 True
19 2020844021 李赫桐 會計學(xué) 88.276667 86.8 83.00 87.0 96.00 True
20 2020844022 關(guān)帥 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00 True
21 2020844023 劉嘉雯 會計學(xué) 89.575000 86.0 90.00 100.0 103.00 True
22 2020844024 劉浩天 會計學(xué) 85.100000 83.2 85.00 100.0 98.00 True
23 2020844025 劉宇 NaN 75.200000 85.6 76.00 100.0 89.00 True
24 2020844026 胡童 會計學(xué) 84.050000 86.0 91.00 100.0 119.00 True
25 2020844027 丁燦 會計學(xué) 88.750000 86.2 66.00 100.0 79.00 True
26 2020844028 鄭武田 會計學(xué) 89.550000 87.4 91.00 NaN 104.00 True
27 2020844029 金耀 會計學(xué) 79.450000 87.2 68.00 100.0 81.00 True
28 2020844030 龐博 會計學(xué) 89.700000 92.0 92.00 100.0 105.00 True
29 2020848001 王春楊 會計學(xué) 88.100000 89.8 84.00 100.0 97.00 True
30 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
31 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
32 2020848002 陳小恬 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
33 2020848003 張淳 會計學(xué) 91.300000 92.2 81.32 100.0 94.32 True
34 2020848004 王佳琳 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00 True
35 2020848005 鄭彤 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00 True
36 2020848006 張鶴同 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50 True
37 2020848007 蘇遠(yuǎn) 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32 True
38 2020848008 方雨桃 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00 True
39 2020848010 閆宇 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00 True
40 2020848011 張?zhí)锾?/td> 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32 True
41 2020848013 曹一一 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32 True
42 2020848014 賈晶晶 NaN 84.450000 93.0 82.66 100.0 95.66 True
43 2020848015 賈淏文 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00 True
44 2020848016 楊帆 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00 True
45 2020848017 趙迎辰 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00 True
46 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00 True
47 2020848018 郭曉舒 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00 True
48 2020848019 張雨桐 金融學(xué) 79.150000 92.4 83.00 100.0 96.00 True
49 2020848020 孟德坤 金融學(xué) 83.450000 87.4 80.66 100.0 93.66 True
50 2020848021 王少祖 金融學(xué) 82.950000 91.6 78.00 90.0 91.00 True
51 2020848023 黃金雨 金融學(xué) 79.950000 89.8 86.00 100.0 99.00 True
52 2020848024 湯佳怡 金融學(xué) 86.600000 83.4 88.32 100.0 101.32 True
53 2020848027 熱孜耶·買買提 金融學(xué) 92.700000 93.2 86.32 100.0 99.32 True
54 2020848028 奴熱艾力·雪艾力 金融學(xué) 15.000000 75.0 63.32 100.0 76.32 True
55 2020848029 林可新 金融學(xué) 89.300000 87.4 95.00 100.0 108.00 True
56 2020848031 任旭 金融學(xué) 83.425000 85.4 71.66 100.0 84.66 True
#指定位置增加列
df.insert(2,"年齡",18)
df
學(xué)號 姓名 年齡 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué) 團(tuán)員否
0 2020802045 魏天 18 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00 True
1 2020844001 郭夏 18 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00 True
2 2020844002 王曉加 18 NaN 54.200000 83.4 74.00 NaN 90.00 True
3 2020844003 黃婷婷 18 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66 True
4 2020844004 趙小瑜 18 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66 True
5 2020844005 辛禧 18 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00 True
6 2020844007 王晨 18 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00 True
7 2020844008 韓天 18 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00 True
8 2020844009 劉玉 18 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32 True
9 2020844010 謝亞鵬 18 市場營銷 70.500000 85.2 60.00 90.0 73.00 True
10 2020844011 婁天楠 18 市場營銷 58.800000 84.6 60.00 NaN 73.00 True
11 2020844012 唐喆 18 市場營銷 80.233333 87.4 64.00 100.0 77.00 True
12 2020844013 史昀 18 市場營銷 82.733333 82.2 73.32 100.0 86.32 True
13 2020844014 劉欣語 18 市場營銷 48.718333 83.8 86.00 80.0 99.00 True
14 2020844015 王同 18 市場營銷 74.200000 92.2 92.00 100.0 115.00 True
15 2020844017 武天一 18 市場營銷 73.216667 83.2 79.00 95.0 92.00 True
16 2020844018 張析 18 市場營銷 82.750000 92.0 92.00 100.0 105.00 True
17 2020844019 陳雨涵 18 市場營銷 95.200000 95.0 88.00 100.0 101.00 True
18 2020844020 張家齊 18 市場營銷 95.450000 91.0 96.00 100.0 109.00 True
19 2020844021 李赫桐 18 會計學(xué) 88.276667 86.8 83.00 87.0 96.00 True
20 2020844022 關(guān)帥 18 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00 True
21 2020844023 劉嘉雯 18 會計學(xué) 89.575000 86.0 90.00 100.0 103.00 True
22 2020844024 劉浩天 18 會計學(xué) 85.100000 83.2 85.00 100.0 98.00 True
23 2020844025 劉宇 18 NaN 75.200000 85.6 76.00 100.0 89.00 True
24 2020844026 胡童 18 會計學(xué) 84.050000 86.0 91.00 100.0 119.00 True
25 2020844027 丁燦 18 會計學(xué) 88.750000 86.2 66.00 100.0 79.00 True
26 2020844028 鄭武田 18 會計學(xué) 89.550000 87.4 91.00 NaN 104.00 True
27 2020844029 金耀 18 會計學(xué) 79.450000 87.2 68.00 100.0 81.00 True
28 2020844030 龐博 18 會計學(xué) 89.700000 92.0 92.00 100.0 105.00 True
29 2020848001 王春楊 18 會計學(xué) 88.100000 89.8 84.00 100.0 97.00 True
30 2020848002 陳小恬 18 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
31 2020848002 陳小恬 18 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
32 2020848002 陳小恬 18 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
33 2020848003 張淳 18 會計學(xué) 91.300000 92.2 81.32 100.0 94.32 True
34 2020848004 王佳琳 18 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00 True
35 2020848005 鄭彤 18 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00 True
36 2020848006 張鶴同 18 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50 True
37 2020848007 蘇遠(yuǎn) 18 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32 True
38 2020848008 方雨桃 18 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00 True
39 2020848010 閆宇 18 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00 True
40 2020848011 張?zhí)锾?/td> 18 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32 True
41 2020848013 曹一一 18 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32 True
42 2020848014 賈晶晶 18 NaN 84.450000 93.0 82.66 100.0 95.66 True
43 2020848015 賈淏文 18 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00 True
44 2020848016 楊帆 18 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00 True
45 2020848017 趙迎辰 18 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00 True
46 2020848018 郭曉舒 18 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00 True
47 2020848018 郭曉舒 18 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00 True
48 2020848019 張雨桐 18 金融學(xué) 79.150000 92.4 83.00 100.0 96.00 True
49 2020848020 孟德坤 18 金融學(xué) 83.450000 87.4 80.66 100.0 93.66 True
50 2020848021 王少祖 18 金融學(xué) 82.950000 91.6 78.00 90.0 91.00 True
51 2020848023 黃金雨 18 金融學(xué) 79.950000 89.8 86.00 100.0 99.00 True
52 2020848024 湯佳怡 18 金融學(xué) 86.600000 83.4 88.32 100.0 101.32 True
53 2020848027 熱孜耶·買買提 18 金融學(xué) 92.700000 93.2 86.32 100.0 99.32 True
54 2020848028 奴熱艾力·雪艾力 18 金融學(xué) 15.000000 75.0 63.32 100.0 76.32 True
55 2020848029 林可新 18 金融學(xué) 89.300000 87.4 95.00 100.0 108.00 True
56 2020848031 任旭 18 金融學(xué) 83.425000 85.4 71.66 100.0 84.66 True
#增加一行
df.loc[57]=["20200848045","王芳",10,"女","金融學(xué)",55,66,77,90,67,True]
df
學(xué)號 姓名 年齡 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué) 團(tuán)員否
0 2020802045 魏天 18 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00 True
1 2020844001 郭夏 18 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00 True
2 2020844002 王曉加 18 NaN 54.200000 83.4 74.00 NaN 90.00 True
3 2020844003 黃婷婷 18 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66 True
4 2020844004 趙小瑜 18 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66 True
5 2020844005 辛禧 18 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00 True
6 2020844007 王晨 18 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00 True
7 2020844008 韓天 18 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00 True
8 2020844009 劉玉 18 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32 True
9 2020844010 謝亞鵬 18 市場營銷 70.500000 85.2 60.00 90.0 73.00 True
10 2020844011 婁天楠 18 市場營銷 58.800000 84.6 60.00 NaN 73.00 True
11 2020844012 唐喆 18 市場營銷 80.233333 87.4 64.00 100.0 77.00 True
12 2020844013 史昀 18 市場營銷 82.733333 82.2 73.32 100.0 86.32 True
13 2020844014 劉欣語 18 市場營銷 48.718333 83.8 86.00 80.0 99.00 True
14 2020844015 王同 18 市場營銷 74.200000 92.2 92.00 100.0 115.00 True
15 2020844017 武天一 18 市場營銷 73.216667 83.2 79.00 95.0 92.00 True
16 2020844018 張析 18 市場營銷 82.750000 92.0 92.00 100.0 105.00 True
17 2020844019 陳雨涵 18 市場營銷 95.200000 95.0 88.00 100.0 101.00 True
18 2020844020 張家齊 18 市場營銷 95.450000 91.0 96.00 100.0 109.00 True
19 2020844021 李赫桐 18 會計學(xué) 88.276667 86.8 83.00 87.0 96.00 True
20 2020844022 關(guān)帥 18 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00 True
21 2020844023 劉嘉雯 18 會計學(xué) 89.575000 86.0 90.00 100.0 103.00 True
22 2020844024 劉浩天 18 會計學(xué) 85.100000 83.2 85.00 100.0 98.00 True
23 2020844025 劉宇 18 NaN 75.200000 85.6 76.00 100.0 89.00 True
24 2020844026 胡童 18 會計學(xué) 84.050000 86.0 91.00 100.0 119.00 True
25 2020844027 丁燦 18 會計學(xué) 88.750000 86.2 66.00 100.0 79.00 True
26 2020844028 鄭武田 18 會計學(xué) 89.550000 87.4 91.00 NaN 104.00 True
27 2020844029 金耀 18 會計學(xué) 79.450000 87.2 68.00 100.0 81.00 True
28 2020844030 龐博 18 會計學(xué) 89.700000 92.0 92.00 100.0 105.00 True
29 2020848001 王春楊 18 會計學(xué) 88.100000 89.8 84.00 100.0 97.00 True
30 2020848002 陳小恬 18 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
31 2020848002 陳小恬 18 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
32 2020848002 陳小恬 18 會計學(xué) 83.750000 94.8 89.00 100.0 102.00 True
33 2020848003 張淳 18 會計學(xué) 91.300000 92.2 81.32 100.0 94.32 True
34 2020848004 王佳琳 18 信息管理與信息系統(tǒng) 75.625000 91.0 93.00 100.0 106.00 True
35 2020848005 鄭彤 18 信息管理與信息系統(tǒng) 88.900000 90.0 78.00 100.0 91.00 True
36 2020848006 張鶴同 18 信息管理與信息系統(tǒng) 89.750000 88.8 82.50 100.0 95.50 True
37 2020848007 蘇遠(yuǎn) 18 信息管理與信息系統(tǒng) 90.250000 89.2 79.32 68.0 92.32 True
38 2020848008 方雨桃 18 信息管理與信息系統(tǒng) 93.100000 86.2 83.00 100.0 96.00 True
39 2020848010 閆宇 18 信息管理與信息系統(tǒng) 86.033333 85.4 85.00 100.0 98.00 True
40 2020848011 張?zhí)锾?/td> 18 信息管理與信息系統(tǒng) 91.200000 89.6 96.32 77.0 109.32 True
41 2020848013 曹一一 18 信息管理與信息系統(tǒng) 74.426667 86.8 83.32 100.0 96.32 True
42 2020848014 賈晶晶 18 NaN 84.450000 93.0 82.66 100.0 95.66 True
43 2020848015 賈淏文 18 信息管理與信息系統(tǒng) 46.675000 80.8 87.00 100.0 100.00 True
44 2020848016 楊帆 18 信息管理與信息系統(tǒng) 98.700000 87.6 95.00 NaN 108.00 True
45 2020848017 趙迎辰 18 NaN 信息管理與信息系統(tǒng) 82.250000 87.4 74.00 100.0 87.00 True
46 2020848018 郭曉舒 18 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00 True
47 2020848018 郭曉舒 18 信息管理與信息系統(tǒng) 82.500000 83.8 73.00 90.0 86.00 True
48 2020848019 張雨桐 18 金融學(xué) 79.150000 92.4 83.00 100.0 96.00 True
49 2020848020 孟德坤 18 金融學(xué) 83.450000 87.4 80.66 100.0 93.66 True
50 2020848021 王少祖 18 金融學(xué) 82.950000 91.6 78.00 90.0 91.00 True
51 2020848023 黃金雨 18 金融學(xué) 79.950000 89.8 86.00 100.0 99.00 True
52 2020848024 湯佳怡 18 金融學(xué) 86.600000 83.4 88.32 100.0 101.32 True
53 2020848027 熱孜耶·買買提 18 金融學(xué) 92.700000 93.2 86.32 100.0 99.32 True
54 2020848028 奴熱艾力·雪艾力 18 金融學(xué) 15.000000 75.0 63.32 100.0 76.32 True
55 2020848029 林可新 18 金融學(xué) 89.300000 87.4 95.00 100.0 108.00 True
56 2020848031 任旭 18 金融學(xué) 83.425000 85.4 71.66 100.0 84.66 True
57 20200848045 王芳 10 金融學(xué) 55.000000 66.0 77.00 90.0 67.00 True
#增加多行
df1=df[["學(xué)號","姓名","專業(yè)"]][:10]
df.append(df1.iloc[:10,])
D:\anacoda\anzhuang\lib\site-packages\pandas\core\frame.py:6211: FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.

To retain the current behavior and silence the warning, pass 'sort=True'.

  sort=sort)
Python 專業(yè) 團(tuán)員否 姓名 學(xué)號 年齡 性別 數(shù)學(xué) 管理學(xué) 英語 選修
0 93.00 信息管理與信息系統(tǒng) True 魏天 2020802045 18.0 90.8 106.00 67.116667 95.0
1 86.00 國際貿(mào)易 True 郭夏 2020844001 18.0 83.4 99.00 91.050000 100.0
2 74.00 NaN True 王曉加 2020844002 18.0 83.4 90.00 54.200000 NaN
3 79.66 國際貿(mào)易 True 黃婷婷 2020844003 18.0 91.4 92.66 87.800000 95.0
4 84.66 國際貿(mào)易 True 趙小瑜 2020844004 18.0 NaN 82.2 97.66 61.150000 100.0
5 68.00 國際貿(mào)易 True 辛禧 2020844005 18.0 88.6 81.00 65.125000 80.0
6 65.00 國際貿(mào)易 True 王晨 2020844007 18.0 80.0 78.00 62.400000 90.0
7 85.00 國際貿(mào)易 True 韓天 2020844008 18.0 91.0 98.00 96.250000 97.0
8 80.32 國際貿(mào)易 True 劉玉 2020844009 18.0 91.4 93.32 89.050000 100.0
9 60.00 市場營銷 True 謝亞鵬 2020844010 18.0 85.2 73.00 70.500000 90.0
10 60.00 市場營銷 True 婁天楠 2020844011 18.0 84.6 73.00 58.800000 NaN
11 64.00 市場營銷 True 唐喆 2020844012 18.0 87.4 77.00 80.233333 100.0
12 73.32 市場營銷 True 史昀 2020844013 18.0 82.2 86.32 82.733333 100.0
13 86.00 市場營銷 True 劉欣語 2020844014 18.0 83.8 99.00 48.718333 80.0
14 92.00 市場營銷 True 王同 2020844015 18.0 92.2 115.00 74.200000 100.0
15 79.00 市場營銷 True 武天一 2020844017 18.0 83.2 92.00 73.216667 95.0
16 92.00 市場營銷 True 張析 2020844018 18.0 92.0 105.00 82.750000 100.0
17 88.00 市場營銷 True 陳雨涵 2020844019 18.0 95.0 101.00 95.200000 100.0
18 96.00 市場營銷 True 張家齊 2020844020 18.0 91.0 109.00 95.450000 100.0
19 83.00 會計學(xué) True 李赫桐 2020844021 18.0 86.8 96.00 88.276667 87.0
20 75.00 會計學(xué) True 關(guān)帥 2020844022 18.0 NaN 92.6 88.00 90.000000 100.0
21 90.00 會計學(xué) True 劉嘉雯 2020844023 18.0 86.0 103.00 89.575000 100.0
22 85.00 會計學(xué) True 劉浩天 2020844024 18.0 83.2 98.00 85.100000 100.0
23 76.00 NaN True 劉宇 2020844025 18.0 85.6 89.00 75.200000 100.0
24 91.00 會計學(xué) True 胡童 2020844026 18.0 86.0 119.00 84.050000 100.0
25 66.00 會計學(xué) True 丁燦 2020844027 18.0 86.2 79.00 88.750000 100.0
26 91.00 會計學(xué) True 鄭武田 2020844028 18.0 87.4 104.00 89.550000 NaN
27 68.00 會計學(xué) True 金耀 2020844029 18.0 87.2 81.00 79.450000 100.0
28 92.00 會計學(xué) True 龐博 2020844030 18.0 92.0 105.00 89.700000 100.0
29 84.00 會計學(xué) True 王春楊 2020848001 18.0 89.8 97.00 88.100000 100.0
... ... ... ... ... ... ... ... ... ... ... ...
38 83.00 信息管理與信息系統(tǒng) True 方雨桃 2020848008 18.0 86.2 96.00 93.100000 100.0
39 85.00 信息管理與信息系統(tǒng) True 閆宇 2020848010 18.0 85.4 98.00 86.033333 100.0
40 96.32 信息管理與信息系統(tǒng) True 張?zhí)锾?/td> 2020848011 18.0 89.6 109.32 91.200000 77.0
41 83.32 信息管理與信息系統(tǒng) True 曹一一 2020848013 18.0 86.8 96.32 74.426667 100.0
42 82.66 NaN True 賈晶晶 2020848014 18.0 93.0 95.66 84.450000 100.0
43 87.00 信息管理與信息系統(tǒng) True 賈淏文 2020848015 18.0 80.8 100.00 46.675000 100.0
44 95.00 信息管理與信息系統(tǒng) True 楊帆 2020848016 18.0 87.6 108.00 98.700000 NaN
45 74.00 信息管理與信息系統(tǒng) True 趙迎辰 2020848017 18.0 NaN 87.4 87.00 82.250000 100.0
46 73.00 信息管理與信息系統(tǒng) True 郭曉舒 2020848018 18.0 83.8 86.00 82.500000 90.0
47 73.00 信息管理與信息系統(tǒng) True 郭曉舒 2020848018 18.0 83.8 86.00 82.500000 90.0
48 83.00 金融學(xué) True 張雨桐 2020848019 18.0 92.4 96.00 79.150000 100.0
49 80.66 金融學(xué) True 孟德坤 2020848020 18.0 87.4 93.66 83.450000 100.0
50 78.00 金融學(xué) True 王少祖 2020848021 18.0 91.6 91.00 82.950000 90.0
51 86.00 金融學(xué) True 黃金雨 2020848023 18.0 89.8 99.00 79.950000 100.0
52 88.32 金融學(xué) True 湯佳怡 2020848024 18.0 83.4 101.32 86.600000 100.0
53 86.32 金融學(xué) True 熱孜耶·買買提 2020848027 18.0 93.2 99.32 92.700000 100.0
54 63.32 金融學(xué) True 奴熱艾力·雪艾力 2020848028 18.0 75.0 76.32 15.000000 100.0
55 95.00 金融學(xué) True 林可新 2020848029 18.0 87.4 108.00 89.300000 100.0
56 71.66 金融學(xué) True 任旭 2020848031 18.0 85.4 84.66 83.425000 100.0
57 77.00 金融學(xué) True 王芳 20200848045 10.0 66.0 67.00 55.000000 90.0
0 NaN 信息管理與信息系統(tǒng) NaN 魏天 2020802045 NaN NaN NaN NaN NaN NaN
1 NaN 國際貿(mào)易 NaN 郭夏 2020844001 NaN NaN NaN NaN NaN NaN
2 NaN NaN NaN 王曉加 2020844002 NaN NaN NaN NaN NaN NaN
3 NaN 國際貿(mào)易 NaN 黃婷婷 2020844003 NaN NaN NaN NaN NaN NaN
4 NaN 國際貿(mào)易 NaN 趙小瑜 2020844004 NaN NaN NaN NaN NaN NaN
5 NaN 國際貿(mào)易 NaN 辛禧 2020844005 NaN NaN NaN NaN NaN NaN
6 NaN 國際貿(mào)易 NaN 王晨 2020844007 NaN NaN NaN NaN NaN NaN
7 NaN 國際貿(mào)易 NaN 韓天 2020844008 NaN NaN NaN NaN NaN NaN
8 NaN 國際貿(mào)易 NaN 劉玉 2020844009 NaN NaN NaN NaN NaN NaN
9 NaN 市場營銷 NaN 謝亞鵬 2020844010 NaN NaN NaN NaN NaN NaN

68 rows × 11 columns文章來源地址http://www.zghlxwxcb.cn/news/detail-422347.html

數(shù)據(jù)修改
#修改列
df["年齡"]=25
df
學(xué)號 姓名 年齡 性別 專業(yè) 英語 數(shù)學(xué) Python 選修 管理學(xué) 團(tuán)員否
0 2020802045 魏天 25 信息管理與信息系統(tǒng) 67.116667 90.8 93.00 95.0 106.00 True
1 2020844001 郭夏 25 國際貿(mào)易 91.050000 83.4 86.00 100.0 99.00 True
2 2020844002 王曉加 25 NaN 54.200000 83.4 74.00 NaN 90.00 True
3 2020844003 黃婷婷 25 國際貿(mào)易 87.800000 91.4 79.66 95.0 92.66 True
4 2020844004 趙小瑜 25 NaN 國際貿(mào)易 61.150000 82.2 84.66 100.0 97.66 True
5 2020844005 辛禧 25 國際貿(mào)易 65.125000 88.6 68.00 80.0 81.00 True
6 2020844007 王晨 25 國際貿(mào)易 62.400000 80.0 65.00 90.0 78.00 True
7 2020844008 韓天 25 國際貿(mào)易 96.250000 91.0 85.00 97.0 98.00 True
8 2020844009 劉玉 25 國際貿(mào)易 89.050000 91.4 80.32 100.0 93.32 True
9 2020844010 謝亞鵬 25 市場營銷 70.500000 85.2 60.00 90.0 73.00 True
10 2020844011 婁天楠 25 市場營銷 58.800000 84.6 60.00 NaN 73.00 True
11 2020844012 唐喆 25 市場營銷 80.233333 87.4 64.00 100.0 77.00 True
12 2020844013 史昀 25 市場營銷 82.733333 82.2 73.32 100.0 86.32 True
13 2020844014 劉欣語 25 市場營銷 48.718333 83.8 86.00 80.0 99.00 True
14 2020844015 王同 25 市場營銷 74.200000 92.2 92.00 100.0 115.00 True
15 2020844017 武天一 25 市場營銷 73.216667 83.2 79.00 95.0 92.00 True
16 2020844018 張析 25 市場營銷 82.750000 92.0 92.00 100.0 105.00 True
17 2020844019 陳雨涵 25 市場營銷 95.200000 95.0 88.00 100.0 101.00 True
18 2020844020 張家齊 25 市場營銷 95.450000 91.0 96.00 100.0 109.00 True
19 2020844021 李赫桐 25 會計學(xué) 88.276667 86.8 83.00 87.0 96.00 True
20 2020844022 關(guān)帥 25 NaN 會計學(xué) 90.000000 92.6 75.00 100.0 88.00 True
21 2020844023 劉嘉雯 25 會計學(xué) 89.575000 86.0 90.00 100.0 103.00 True
22 2020844024 劉浩天 25 會計學(xué) 85.100000 83.2 85.00 100.0 98.00 True
23 2020844025 劉宇 25

到了這里,關(guān)于python-數(shù)據(jù)分析-pandas的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Python數(shù)據(jù)分析-Pandas

    個人筆跡,建議不看 Series類型 DataFrame類型 是一個二維結(jié)構(gòu),類似于一張excel表 DateFrame只要求每列的數(shù)據(jù)類型相同就可以了 查看數(shù)據(jù) 讀取數(shù)據(jù)及數(shù)據(jù)操作 行操作 條件選擇 缺失值及異常值處理 判斷缺失值: 填充缺失值: 刪除缺失值 age count 2.000000 mean 1.500000 std 0.707107 min 1

    2024年02月10日
    瀏覽(33)
  • python-數(shù)據(jù)分析-pandas

    第一種:通過標(biāo)量創(chuàng)建Series 第二種:通過列表創(chuàng)建Series 第三種:通過字典創(chuàng)建Series 第四種:通過ndarray創(chuàng)建Series values和index 索引和切片 第一種:通過一維列表構(gòu)成的字典創(chuàng)建DataFrame 姓名 數(shù)學(xué) 語文 計算機(jī) 0 張三 87 54 34 1 李四 45 76 56 2 王五 34 55 77 3 趙六 98 90 87 姓名 數(shù)學(xué) 語文

    2023年04月23日
    瀏覽(26)
  • 【Python練習(xí)】數(shù)據(jù)分析庫Pandas

    1. 了解Serie

    2024年02月09日
    瀏覽(39)
  • 實戰(zhàn)演練Python數(shù)據(jù)分析[pandas]

    實戰(zhàn)演練Python數(shù)據(jù)分析[pandas]

    本篇文章出自于《利用Python進(jìn)行數(shù)據(jù)分析》示例數(shù)據(jù) 請結(jié)合提供的示例數(shù)據(jù),分析代碼的功能,并進(jìn)行數(shù)據(jù)分析與可視化拓展。本篇文章通過四個例子,通過MoviesLens數(shù)據(jù)集、美國1880-2010年的嬰兒名字、美國農(nóng)業(yè)部視頻數(shù)據(jù)庫、2012年聯(lián)邦選舉委員會數(shù)據(jù)庫來進(jìn)行著重講解。

    2024年02月15日
    瀏覽(26)
  • 【頭歌】——數(shù)據(jù)分析與實踐-python-Pandas 初體驗-Pandas數(shù)據(jù)取值與選擇-Pandas進(jìn)階

    第1關(guān) 了解數(shù)據(jù)處理對象–Series 第2關(guān) 了解數(shù)據(jù)處理對象-DataFrame 第3關(guān) 讀取 CSV 格式數(shù)據(jù) 第4關(guān) 數(shù)據(jù)的基本操作——排序 第5關(guān) 數(shù)據(jù)的基本操作——刪除 第6關(guān) 數(shù)據(jù)的基本操作——算術(shù)運算 第7關(guān) 數(shù)據(jù)的基本操作——去重 第8關(guān) 數(shù)據(jù)重塑 第1關(guān) Series數(shù)據(jù)選擇 第2關(guān) DataFrame數(shù)據(jù)

    2024年01月22日
    瀏覽(155)
  • python數(shù)據(jù)分析之Pandas庫(一)

    python數(shù)據(jù)分析之Pandas庫(一)

    Pandas有兩種常用的數(shù)據(jù)結(jié)構(gòu): Series (一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù))。 Series 是一種類似于 一維數(shù)組 的對象,能保存不同數(shù)據(jù)類型。 DataFrame 是一個 二維的表格型 的數(shù)據(jù)結(jié)構(gòu)。 1、初始化 使用一位列表初始化Series 2、索引[數(shù)據(jù)的行標(biāo)簽]、切片 1、初始化 2、查看數(shù)據(jù) 1、

    2024年02月09日
    瀏覽(23)
  • 【Python】數(shù)據(jù)分析+數(shù)據(jù)挖掘——探索Pandas中的數(shù)據(jù)篩選

    【Python】數(shù)據(jù)分析+數(shù)據(jù)挖掘——探索Pandas中的數(shù)據(jù)篩選

    當(dāng)涉及數(shù)據(jù)處理和分析時,Pandas是Python編程語言中最強(qiáng)大、靈活且廣泛使用的工具之一。Pandas提供了豐富的功能和方法,使得數(shù)據(jù)的選擇、篩選和處理變得簡單而高效。在本博客中,我們將重點介紹Pandas中數(shù)據(jù)篩選的關(guān)鍵知識點,包括條件索引、邏輯操作符、 query() 方法以及

    2024年02月15日
    瀏覽(22)
  • Python數(shù)據(jù)分析之Pandas核心使用進(jìn)階

    在Pandas中,有兩種常見的方法可以進(jìn)行DataFrame的行級遍歷:使用 iterrows() 和使用 iteritems() 。 使用 iterrows() 方法: iterrows() 方法返回一個迭代器,可以按行遍歷DataFrame。每次迭代返回一個包含行索引和該行數(shù)據(jù)的元組。 輸出結(jié)果為: 在上面的例子中,我們使用 iterrows() 方法遍

    2024年02月11日
    瀏覽(20)
  • 【Python】數(shù)據(jù)分析+數(shù)據(jù)挖掘——探索Pandas中的索引與數(shù)據(jù)組織

    【Python】數(shù)據(jù)分析+數(shù)據(jù)挖掘——探索Pandas中的索引與數(shù)據(jù)組織

    在數(shù)據(jù)科學(xué)和數(shù)據(jù)分析領(lǐng)域,Pandas是一個備受喜愛的Python庫。它提供了豐富的數(shù)據(jù)結(jié)構(gòu)和靈活的工具,幫助我們高效地處理和分析數(shù)據(jù)。其中,索引在Pandas中扮演著關(guān)鍵角色,它是一種強(qiáng)大的數(shù)據(jù)組織和訪問機(jī)制,使我們能夠更好地理解和操作數(shù)據(jù)。 本博客將探討Pandas中與索

    2024年02月15日
    瀏覽(44)
  • Python 數(shù)據(jù)處理與分析之 Pandas 庫

    Pandas(Python Data Analysis Library)是一個流行的 Python 第三方庫,是數(shù)據(jù)處理和數(shù)據(jù)分析中不可或缺的工具之一,用于數(shù)據(jù)處理和數(shù)據(jù)分析。 它提供了高效的數(shù)據(jù)分析方法和靈活且高效的數(shù)據(jù)結(jié)構(gòu)。相比于其他的數(shù)據(jù)處理庫,pandas更適用于處理具有關(guān)系型數(shù)據(jù)或者帶標(biāo)簽數(shù)據(jù)的情

    2024年02月05日
    瀏覽(54)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包