Python pandas dataframe 分組聚合時,分組組名併入列的方法

 

轉載,侵刪,感謝原作者

利用pandas做分組聚合時,分組組名默認是變化成index,如圖

grouped = tdf.groupby('uid')
mean=grouped.mean();
forwardmeandf=pd.DataFrame(mean)
代碼中tdf是一個dataframe 當以uid分組,並求每組的平均值後在轉化爲dataframe ,組名併入到index

這樣非常不方便我們通過index獲取值,因爲uid太長了。這個問題苦惱了我很久,終於在官方文檔中看到解決方法,只要在分組的時候指定as_index=false便可。

 

grouped = tdf.groupby('uid',as_index=False)
mean=grouped.mean();
forwardmeandf=pd.DataFrame(mean)

這樣不但方便我們利用index做選取,而且使利用uid與沒有分組的表做join也成爲可能。

另外。。。國內關於pandas的資料太少了,建議還是看官方文檔。

————————————————
版權聲明:本文爲CSDN博主「liujia_rik」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/u011199646/article/details/48109839

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章