Python 實現批量分類彙總並保存xlsx文件

上一篇文件用VBA介紹瞭如何實現一鍵按列分類彙總並保存單獨文件，代碼有幾十行，而且一旦數據量多了，效果可能不盡如人意。

文章可以參見這裏：

vba實例（27）-一鍵按列分類彙總並保存單獨文件

今天就來給大家說說如何用python來實現這個效果，先給大家看看效果：

代碼只有十幾行，效果要提升好多倍，這也是使用python的優勢所在。

思路與代碼詳解

核心思路基本和VBA的一致：讀取excel數據 - 獲取“歸屬事業部”列中事業部種類數 - 按每個事業部進行整行提取 - 保存xlsx文件。

1、這裏使用的是python中的pandas數據處理庫，這個是在數據處理界非常牛逼的一個工具庫，使用之前需要導入庫。

import pandas as pd

2、讀取excel的數據。讀取"拆分實例.xlsx"這個excel中,sheet名字爲"全國客戶明細"的數據，將讀取的內容賦值給df。

df = pd.read_excel("拆分實例.xlsx",sheet_name="全國客戶明細")

3、獲取“歸屬事業部”列的種類數，使用pandas庫的unique方法，將所有事業部的名字賦值給變量group_names。

group_names=df["歸屬事業部"].unique()

4、將某個事業部的數據整行提取出來保存成xlsx文件，並按事業部的名字進行命名。

df_group=df.groupby(by=['歸屬事業部']).get_group(group_name).reset_index(drop=True)
df_group.to_excel(".\拆分結果\\"+group_name+".xlsx")

5、遍歷每一個事業部，進行同樣的操作。

for group_name in group_names:

完整代碼如下：

import pandas as pd
import time

start = time.time()

df = pd.read_excel("拆分實例.xlsx",sheet_name="全國客戶明細")
group_names=df["歸屬事業部"].unique()
for group_name in group_names:
    df_group=df.groupby(by=['歸屬事業部']).get_group(group_name).reset_index(drop=True)
    df_group.to_excel(".\拆分結果\\"+group_name+".xlsx")

elapsed = (time.time() - start)

print("完成，共花費時間爲：",elapsed)