pandas:
pandas包含高級的數據結構和精巧的工具,使得python在處理數據非常快速和簡單
DataFrame:
一個Datarame表示一個表格,類似電子表格的數據結構,包含一個經過排序的列表集,它們沒一個都可以有不同的類型值(數字,字符串,布爾等等)。Datarame有行和列的索引;它可以被看作是一個Series的字典(每個Series共享一個索引)。與其它你以前使用過的(如 R 的 data.frame )類似Datarame的結構相比,在DataFrame裏的面向行和麪向列的操作大致是對稱的。在底層,數據是作爲一個或多個二維數組存儲的,而不是列表,字典,或其它一維的數組集合。
有很多方法來構建一個DataFrame,但最常用的一個是用一個相等長度列表的字典或NumPy數組:
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002],
'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = DataFrame(data)
In [38]: frame
Out[38]:
pop state year
0 1.5 Ohio 2000
1 1.7 Ohio 2001
2 3.6 Ohio 2002
3 2.4 Nevada 2001
4 2.9 Nevada 2002
假如你在其中設置了一個序列:DataFrame(data, columns=['year', 'state', 'pop'])
他會根據你設置的序列進行排序: year state pop
0 2000 Ohio 1.5
1 2001 Ohio 1.7
2 2002 Ohio 3.6
3 2001 Nevada 2.4
4 2002 Nevada 2.9
在Dataframe中可以給他設置參數,改變你的得到的結果:
(data=None, index=None, columns=None, dtype=None,copy=False)