最近接觸到數(shù)據(jù)科學,需要對一些數(shù)據(jù)表進行分析,觀察到代碼中一會出現(xiàn)loc一會又出現(xiàn)iloc,下面對兩者的用法給出我的一些理解。
1.聯(lián)系
(1)操作對象相同:loc和iloc都是對DataFrame類型進行操作;
(2)完成目的相同:二者都是用于選取DataFrame中對應行或列中的元素。
2.區(qū)別
loc和iloc索引的行列標簽類型不同。
iloc使用順序數(shù)字來索引數(shù)據(jù),而不能使用字符型的標簽來索引數(shù)據(jù);注意:這里的順序數(shù)字是指從0開始計數(shù)!
loc使用實際設置的索引來索引數(shù)據(jù)。但行列名為數(shù)字時,loc也可以索引數(shù)字,但這里的數(shù)字不一定從0開始編號,是對應具體行列名的數(shù)字!
3.用法
下面用代碼來講解兩者的用法。
3.1行列全為從0開始順序編號
import pandas as pd
import numpy as np
a = np.arange(12).reshape(3,4)
#將a轉化為DataFrame類型
df = pd.DataFrame(a)
#展示df
df
由于未給df的行列命名,默認從0開始編號,所以這個時候使用loc和iloc結果是一樣的。
索引為一個數(shù),默認輸出行
print(df.loc[0])#輸出第0行元素
print(df.iloc[0])#輸出第0行元素
?兩者輸出結果都為:
0 0 1 1 2 2 3 3 Name: 0, dtype: int32
輸出結果為df第0行元素,結果中第一列表示列名,第二列表示具體的值。如果只需要輸出某一列,輸入df.loc[:,0]表示輸出第0列。
如果需要輸出第0到2列的數(shù)據(jù)。
#方式1
df.loc[:,0:2]#可把loc理解為遍歷字符串類型,0:2則表示標簽為0,1,2三列
#方式2
df.iloc[:,0:3]#iloc遍歷的數(shù)數(shù)字,python中0:3對應0,1,和2
輸出結果均為:
??3.2有一行或列不是從0順序編號
#把行標簽換成其他數(shù)字編號
df.index=[2,5,7]
df.loc[2]
此時df變?yōu)椋?/p>
?輸出結果為:
0 0 1 1 2 2 3 3 Name: 2, dtype: int32
輸出結果對應的是列標簽為“2”所在的行。
我們繼續(xù)用df.iloc[2]輸出結果:
0 8 1 9 2 10 3 11 Name: 7, dtype: int32
可見輸出的是第2行的數(shù)據(jù)。
在這里我們能大概對loc和iloc的用法有了一定的了解。
3.3行或者列為非數(shù)字標簽
#把行標簽轉化為非數(shù)字類型
df.index=['a','b','c']
#輸出第a、b行,第0到2列的數(shù)據(jù)
#方式1
df.loc[['a','b'],0:2]#可把loc理解為遍歷字符串類型,0:2則表示標簽為0,1,2三列
#方式2
df.iloc[0:2,0:3]#iloc遍歷的是數(shù)字,0:2表示的是0和1,0:3表示0,1,2。
兩者輸出結果均為:
?3.4 其他用法
一般情況下,表的行為從0編號的數(shù)字類型,列為具體的字符串類型。行的數(shù)字容易確定,列的列名容易確定。
#將行換成0 1 2編號
df.index=[0,1,2]
#列標簽換成A B C D
df.columns=['A','B','C','D']
df.iloc[1]['A']#實現(xiàn)輸出第1行第A列的數(shù)據(jù)
輸出結果為4。
如果要輸出第1行,第AB列,使用df.iloc[1][['A','B']],這里一定要注意'A','B'是作為一個列表輸入的,右側一共有兩個中括號。
輸出結果:文章來源:http://www.zghlxwxcb.cn/news/detail-404126.html
A 4 B 5 Name: 1, dtype: int32
df.iloc[1][['A','B']]等價于df.iloc[1,0:2],但是很多情況下我們不知道具體列名對應的數(shù)字,所以采用第一種方法可以提高編程效率。文章來源地址http://www.zghlxwxcb.cn/news/detail-404126.html
到了這里,關于Python學習.iloc和.loc區(qū)別、聯(lián)系與用法的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!