Pandas——ix vs loc vs iloc區別

重點:loc一般是索引標籤,iloc只能索引數字,而ix可以索引兩種類型:標籤和數字。

1. loc——通過行標籤索引行數據(loc會把:的最後一位也算進去)

1.1 loc[1]表示索引的是第1行(index 是整數)

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = [0,1]  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc[1]  
  7. ''''' 
  8. a    4 
  9. b    5 
  10. c    6 
  11. '''  

1.2 loc[‘d’]表示索引的是第’d’行(index 是字符)

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc['d']  
  7. ''''' 
  8. a    1 
  9. b    2 
  10. c    3 
  11. '''  

1.3 如果想索引列數據,像這樣做會報錯

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc['a']  
  7. ''''' 
  8. KeyError: 'the label [a] is not in the [index]' 
  9. '''  

1.4 loc可以獲取多行數據

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc['d':]  
  7. ''''' 
  8.    a  b  c 
  9. d  1  2  3 
  10. e  4  5  6 
  11. '''  

1.5 loc擴展——索引某行某列

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc['d',['b','c']]  
  7. ''''' 
  8. b    2 
  9. c    3 
  10. '''  

1,6 loc擴展——索引某列

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc[:,['c']]  
  7. ''''' 
  8.    c 
  9. d  3 
  10. e  6 
  11. '''  

當然獲取某列數據最直接的方式是df.[列標籤],但是當列標籤未知時可以通過這種方式獲取列數據。

需要注意的是,dataframe的索引[1:3]是包含1,2,3的,與平時的不同。

2. iloc——通過行號獲取行數據

2.1 想要獲取哪一行就輸入該行數字

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.loc[1]  
  7. ''''' 
  8. a    4 
  9. b    5 
  10. c    6 
  11. '''  

2.2 通過行標籤索引會報錯

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.iloc['a']  
  7. ''''' 
  8. TypeError: cannot do label indexing on <class 'pandas.core.index.Index'> with these indexers [a] of <type 'str'> 
  9. '''  

2.3 同樣通過行號可以索引多行

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.iloc[0:]  
  7. ''''' 
  8.    a  b  c 
  9. d  1  2  3 
  10. e  4  5  6 
  11. '''  

2.4 iloc索引列數據

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.iloc[:,[1]]  
  7. ''''' 
  8.    b 
  9. d  2 
  10. e  5 
  11. '''  

3. ix——結合前兩種的混合索引

3.1 通過行號索引

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.ix[1]  
  7. ''''' 
  8. a    4 
  9. b    5 
  10. c    6 
  11. '''  

3.2 通過行標籤索引

[python] view plain copy
 print?
  1. import pandas as pd  
  2. data = [[1,2,3],[4,5,6]]  
  3. index = ['d','e']  
  4. columns=['a','b','c']  
  5. df = pd.DataFrame(data=data, index=index, columns=columns)  
  6. print df.ix['e']  
  7. ''''' 
  8. a    4 
  9. b    5 
  10. c    6 
  11. '''  
發佈了12 篇原創文章 · 獲贊 14 · 訪問量 8萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章