Pandas庫中的read_table、loc、iloc函數

python的pandas庫中read_table的參數

datingTest = pd.read_table('datingTestSet.txt',header=None)

pandas的read_table返回一個DataFrame,是二維的,列表形式。

filepath_or_buffer 第一個參數,把文件地址傳入即可;

engine='python' 默認是c引擎解析,如果使用python引擎,可以解析更豐富的內容;

header='infer' 默認會自動推斷數據文件頭,如果設置爲None則無文件頭,爲1則第一行是文件頭;

sep='\t' 默認是由tab分割的數據,如果是其他可以另改,比如','

Pandas中loc和iloc函數用法詳解

loc函數:通過行索引 "Index" 中的具體值來取行數據(如取"Index"爲"A"的行)(名稱,行列名)
iloc函數:通過行號來取行數據(如取第二行的數據)(數字,第幾行,第幾列)
​
import numpy as np
import pandas as pd
#創建一個Dataframe
data=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('ABCD'))
​
In[1]: data
Out[1]: 
    A   B   C   D
a   0   1   2   3
b   4   5   6   7
c   8   9  10  11
​
​
In[6]:data.loc[['a','b'],['A','B']] #提取index爲'a','b',列名爲'A','B'中的數據
Out[6]: 
   A  B
a  0  1
b  4  5
 
In[7]:data.iloc[[0,1],[0,1]] #提取第0、1行,第0、1列中的數據
Out[7]: 
   A  B
a  0  1
​

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章