利用Python對Excel按列值篩選並拆分表格到多個文件

 

 

場景:集團中心下發本省數據時,並未按地市、業務拆分,現需要按地市、業務拆分並分發到地市。

本文利用Python的pandas包實現了以上場景。注:本示例代碼只實現按單列拆分,如果需要多列篩選拆分,請修改本示例中的filter_column_name與city_name_to_list,並多套一層循環。

now, show u the code:

 

# -*- coding: utf-8 -*-
"""
Created on Fri Nov  1 09:53:30 2019

@author: lanxuxml

應用場景:

	包含多個sheet的Excel 需要按列篩選出來另存爲其它文件

"""

import pandas as pd

split_excel_name_head = 'name_head_'
split_excel_name_tail = '_name_tail.xlsx'

xlsx_name = 'x:\xxxx\xxxxxxxx.xls'

#用來篩選的列名
filter_column_name = 'column_name'

#將該列去重後保存爲list
df = pd.read_excel(xlsx_name)
city_names = df[filter_column_name].unique().tolist()

#獲取所有sheet名
df = pd.ExcelFile(xlsx_name)
sheet_names = df.sheet_names

#不需要篩選的sheet名
sheet_not_filter_names = sheet_names[9:2]

for city_name in city_names:
    
    city_excel_name = split_excel_name_head + str(city_name) + split_excel_name_tail
    writer = pd.ExcelWriter(city_excel_name)
    #將city_name轉爲list
    #如果是兩列篩選,在此處多套上一層循環
    #如果是多列篩選,請修改代碼使用多維list進行循環遍歷
    city_name_to_list = []
    city_name_to_list.append(city_name)
    
    for sheet_name in sheet_names:
        tmp_df = pd.read_excel(xlsx_name, sheet_name=sheet_name)
        if sheet_name not in sheet_not_filter_names:
            #如果是兩列篩選,在此處添加一行代碼
        	tmp_sheet = tmp_df[tmp_df[filter_column_name].isin(city_name_to_list)]
        else:
        	tmp_sheet = tmp_df
        tmp_sheet.to_excel(excel_writer=writer, sheet_name=sheet_name, encoding="utf-8", index=False)
      
    writer.save()
    writer.close()


 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章