python的pandas庫中read_table的參數
datingTest = pd.read_table('datingTestSet.txt',header=None)
pandas的read_table返回一個DataFrame,是二維的,列表形式。
filepath_or_buffer 第一個參數,把文件地址傳入即可;
engine='python' 默認是c引擎解析,如果使用python引擎,可以解析更豐富的內容;
header='infer' 默認會自動推斷數據文件頭,如果設置爲None則無文件頭,爲1則第一行是文件頭;
sep='\t' 默認是由tab分割的數據,如果是其他可以另改,比如','
Pandas中loc和iloc函數用法詳解
loc函數:通過行索引 "Index" 中的具體值來取行數據(如取"Index"爲"A"的行)(名稱,行列名)
iloc函數:通過行號來取行數據(如取第二行的數據)(數字,第幾行,第幾列)
import numpy as np
import pandas as pd
#創建一個Dataframe
data=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('ABCD'))
In[1]: data
Out[1]:
A B C D
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
In[6]:data.loc[['a','b'],['A','B']] #提取index爲'a','b',列名爲'A','B'中的數據
Out[6]:
A B
a 0 1
b 4 5
In[7]:data.iloc[[0,1],[0,1]] #提取第0、1行,第0、1列中的數據
Out[7]:
A B
a 0 1