轉載,侵刪,感謝原作者
利用pandas做分組聚合時,分組組名默認是變化成index,如圖
grouped = tdf.groupby('uid')
mean=grouped.mean();
forwardmeandf=pd.DataFrame(mean)
代碼中tdf是一個dataframe 當以uid分組,並求每組的平均值後在轉化爲dataframe ,組名併入到index
這樣非常不方便我們通過index獲取值,因爲uid太長了。這個問題苦惱了我很久,終於在官方文檔中看到解決方法,只要在分組的時候指定as_index=false便可。
grouped = tdf.groupby('uid',as_index=False)
mean=grouped.mean();
forwardmeandf=pd.DataFrame(mean)
這樣不但方便我們利用index做選取,而且使利用uid與沒有分組的表做join也成爲可能。
另外。。。國內關於pandas的資料太少了,建議還是看官方文檔。
————————————————
版權聲明:本文爲CSDN博主「liujia_rik」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/u011199646/article/details/48109839