想分組聚合各省的條數、總額,及其平均數或者佔比的話,Python方便還是slq方便?

大家好,我是Python進階者。

一、前言

前幾天在Python最強王者交流羣【斌】問了一個數據處理的問題。問題如下:

求教大佬:我有全國的明細5000條,其中一個字段是省(直轄市), 如果我想分組聚合各省的條數、總額,及其平均數或者佔比的話,Python方便還是sql方便?

二、實現過程

這裏【吳超建】提出Excel透視表就可以解決了,【DIY】和【黑科技·鼓包】也給出了自己的看法。

圖片
後來粉絲自己使用數據透視表搞定了。

圖片

就是佔比還需要自己寫個公式,不過這裏【吳超建】指出其實並不需要,具體做法如下所示。

圖片

後來【瑜亮老師】也給出了一個Python方法,python中用透視表也是一行代碼。主要是參數aggfunc可以接受列表,以便於對某列數進行多種統計,如求和、求平均值等,同時還可以接受字典,分別對多列進行一種或多種統計。

圖片

上面這個是妥妥的乾貨分享,確實非常不錯!

順利地解決了粉絲的問題。

如果你也有類似這種Python相關的小問題,歡迎隨時來交流羣學習交流哦,有問必答!

三、總結

大家好,我是Python進階者。這篇文章主要盤點了一個Excel數據透視表需求使用Python處理的問題,文中針對該問題,給出了具體的解析和代碼實現,幫助粉絲順利解決了問題。

最後感謝粉絲【斌】提出的問題,感謝【吳超建】、【瑜亮老師】、【DIY】和【黑科技·鼓包】給出的思路,感謝【冷喵】等人蔘與學習交流。

【提問補充】溫馨提示,大家在羣裏提問的時候。可以注意下面幾點:如果涉及到大文件數據,可以數據脫敏後,發點demo數據來(小文件的意思),然後貼點代碼(可以複製的那種),記得發報錯截圖(截全)。代碼不多的話,直接發代碼文字即可,代碼超過50行這樣的話,發個.py文件就行。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章