關於DataFrame執行groupby的介紹

關於DataFrame執行groupby的介紹

pandas提供了一個靈活高效的groupby功能,它使你能以一種自然的方式對數據集進行切片、切塊、摘要等操作。這裏我們主要關注DataFrame執行groupby聚合操作後,如何繼續保持DataFrame對象,讓其不變成Series對象。

如一下實例:
我們輸出的一個DateFrame數據集 df,

  key  value
0   a      1
1   b      2
2   b      3
3   c      4
4   a      5
5   a      6
6   b      7
7   a      8
8   c      9

接下來我們要對key列重複的數據進行合併,一般語句爲:

df1 = df.groupby(('key')).sum()

則有結果如下第一部分,此時不再是DataFrame對象,而變成Series對象,如下第二部分:

df1 = df.groupby(('key')).sum()

     value
key       
a       20
b       12
c       13

df['value']

[('value', key
a    20
b    12
c    13
Name: value, dtype: int64)]

如何繼續保持DataFrame對象,讓其不變成Series對象: 添加as_index=False,指定分組的列不作爲index即可。

 df.groupby(('key'),as_index=False).sum()

  key  value
0   a     20
1   b     12
2   c     13
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章