上一篇文件用VBA介紹瞭如何實現一鍵按列分類彙總並保存單獨文件,代碼有幾十行,而且一旦數據量多了,效果可能不盡如人意。
文章可以參見這裏:
vba實例(27)-一鍵按列分類彙總並保存單獨文件
今天就來給大家說說如何用python來實現這個效果,先給大家看看效果:
代碼只有十幾行,效果要提升好多倍,這也是使用python的優勢所在。
思路與代碼詳解
核心思路基本和VBA的一致:讀取excel數據 - 獲取“歸屬事業部”列中事業部種類數 - 按每個事業部進行整行提取 - 保存xlsx文件。
1、這裏使用的是python中的pandas數據處理庫,這個是在數據處理界非常牛逼的一個工具庫,使用之前需要導入庫。
import pandas as pd
2、讀取excel的數據。讀取"拆分實例.xlsx"這個excel中,sheet名字爲"全國客戶明細"的數據,將讀取的內容賦值給df。
df = pd.read_excel("拆分實例.xlsx",sheet_name="全國客戶明細")
3、獲取“歸屬事業部”列的種類數,使用pandas庫的unique方法,將所有事業部的名字賦值給變量group_names。
group_names=df["歸屬事業部"].unique()
4、將某個事業部的數據整行提取出來保存成xlsx文件,並按事業部的名字進行命名。
df_group=df.groupby(by=['歸屬事業部']).get_group(group_name).reset_index(drop=True)
df_group.to_excel(".\拆分結果\\"+group_name+".xlsx")
5、遍歷每一個事業部,進行同樣的操作。
for group_name in group_names:
完整代碼如下:
import pandas as pd
import time
start = time.time()
df = pd.read_excel("拆分實例.xlsx",sheet_name="全國客戶明細")
group_names=df["歸屬事業部"].unique()
for group_name in group_names:
df_group=df.groupby(by=['歸屬事業部']).get_group(group_name).reset_index(drop=True)
df_group.to_excel(".\拆分結果\\"+group_name+".xlsx")
elapsed = (time.time() - start)
print("完成,共花費時間爲:",elapsed)
優化
上面這個代碼生成的excel,數據是沒有任何問題,但是單元格格式比較簡陋,甚至可以說“醜”。
如果需要如下圖像生成VBA的比較美觀的樣式,要怎麼弄呢?需要做一些格式上的處理。
可以新建一個“模板”文件,
然後調用openpyxl庫將分類的數據dataframe寫入到模板文件中,設置邊框等格式,另存爲xlsx文件即可。
效果如下:
如果你對上面的內容感興趣,可以在公號內回覆「python處理」自取試用,儘快吧!
歡迎交流!