關於DataFrame執行groupby的介紹
pandas提供了一個靈活高效的groupby功能,它使你能以一種自然的方式對數據集進行切片、切塊、摘要等操作。這裏我們主要關注DataFrame執行groupby聚合操作後,如何繼續保持DataFrame對象,讓其不變成Series對象。
如一下實例:
我們輸出的一個DateFrame數據集 df,
key value
0 a 1
1 b 2
2 b 3
3 c 4
4 a 5
5 a 6
6 b 7
7 a 8
8 c 9
接下來我們要對key列重複的數據進行合併,一般語句爲:
df1 = df.groupby(('key')).sum()
則有結果如下第一部分,此時不再是DataFrame對象,而變成Series對象,如下第二部分:
df1 = df.groupby(('key')).sum()
value
key
a 20
b 12
c 13
df['value']
[('value', key
a 20
b 12
c 13
Name: value, dtype: int64)]
如何繼續保持DataFrame對象,讓其不變成Series對象: 添加as_index=False,指定分組的列不作爲index即可。
df.groupby(('key'),as_index=False).sum()
key value
0 a 20
1 b 12
2 c 13