python 中的pandas。

pandas

pandas包含高級的數據結構和精巧的工具,使得python在處理數據非常快速和簡單

DataFrame:

    一個Datarame表示一個表格,類似電子表格的數據結構,包含一個經過排序的列表集,它們沒一個都可以有不同的類型值(數字,字符串,布爾等等)。Datarame有行和列的索引;它可以被看作是一個Series的字典(每個Series共享一個索引)。與其它你以前使用過的(如 R 的 data.frame )類似Datarame的結構相比,在DataFrame裏的面向行和麪向列的操作大致是對稱的。在底層,數據是作爲一個或多個二維數組存儲的,而不是列表,字典,或其它一維的數組集合。
有很多方法來構建一個DataFrame,但最常用的一個是用一個相等長度列表的字典或NumPy數組:
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2001, 2002],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = DataFrame(data)

In [38]: frame
Out[38]:
  pop    state year
0 1.5     Ohio 2000
1 1.7     Ohio 2001
2 3.6     Ohio 2002
3 2.4   Nevada 2001
4 2.9   Nevada 2002

假如你在其中設置了一個序列:DataFrame(data, columns=['year', 'state', 'pop'])

他會根據你設置的序列進行排序:  year state pop
                            0 2000  Ohio 1.5
                            1 2001  Ohio 1.7
                            2 2002  Ohio 3.6
                            3 2001 Nevada 2.4
                            4 2002 Nevada 2.9
    在Dataframe中可以給他設置參數,改變你的得到的結果:
    (data=None, index=None, columns=None, dtype=None,copy=False
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章