Python實現自動處理表格,讓你擁有更多的自由時間!

相信有不少朋友日常工作會用到 Excel 處理各式表格文件,更有甚者可能要花大把時間來做繁瑣耗時的表格整理工作。最近有朋友問可否編程來減輕表格整理工作量,今兒我們就通過實例來實現 Python 對錶格的自動化整理。

首先我們有這麼一份數據表 source.csv:

我們要做的是從上表中提取數據,來生成一份符合以下要求的表格:

  1. 按照以下分組名單 group.xls 來整理數據表中的數據:

  2. 最終要展現的數據項:

  3. 其中“K數據/60”爲數據表中的“數據K”/60後保留的2位小數

我們先看手工 Excel 如何處理以上需求:要在 source.csv 數據表中讀取讀取每條數據,放入 group.xls 匹配的分組成員中,最後篩選需要的數據項,再對特定的 “數據K”進行運算處理。

那麼 Python 又將如何操作呢?這裏我們要用到功能強大的 pandas 庫。

pandas 是基於NumPy 的一種工具,該工具是爲了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。pandas提供了大量能使我們快速便捷地處理數據的函數和方法。你很快就會發現,它是使Python成爲強大而高效的數據分析環境的重要因素之一。

pandas 百度百科

首先導入 pandas 庫,通過相關的函數讀取 csv 和 xls 表格內容:

import pandas as pd
# 讀取 group.xls 分組信息
group = pd.read_excel("group.xls",header=None)
group.columns=["分組","角色"]
print(group)
# 讀取 source.csv 獲取所有成員數據
source = pd.read_csv("source.csv")
print(source)

我們可以首先對 source.csv 中的數據項進行篩選,需要的數據項有“角色”、“編號”、“數據B”、“數據C”、“數據D”和“數據K”:

# 通過 iloc[:,[列座標]] 來定位需要的各列數據
filter_merge = source.iloc[:,[0,2,4,5,6,13]]
print(filter_merge)

接下來是根據分組角色來匹配角色數據,注意到 group.xls 和 source.csv 共有“角色”一項,我們可以通過此項將兩個表格融合從而形成匹配填充的效果。

combine = pd.merge(group,filter_merge,on="角色")

接下來我們在第二列插入運算後的“數據K/60”:

combine.insert(1,"數據K/60",round(filter_merge["數據K"]/60,2))

最終,我們將生成的數據格式寫入新的 xlsx 表格中:

combine.to_excel(excel_writer="result.xlsx",index=False)

最終自動生成的表格如下:

以上便是 Excel 表格整理的 Python 代碼簡單實現,在操作過程中也遇到幾個問題貼在這裏供大家參考:

  1. 導入 pandas 時可能會報錯:

    解決:根據報錯信息安裝需要的相關模塊

  2. 要進行表格整理的電腦爲公司電腦、無法連接外網下載 Python

    解決:

    https://blog.csdn.net/sundan93/article/details/62888068

    參照以上鍊接,先在外網電腦下載 Python 安裝文件以及相關的模塊安裝文件,拷貝到無網絡電腦進行安裝

  3. 以上表格整理的實例在現實工作有參考意義麼:

    回答:文中表格的原型是一份員工工作記錄,根據人員分組進行相關的數據統計。類似的分組統計成員數據都可以根據此簡單 Python 模版來實現。

源代碼:https://pan.baidu.com/s/1ro4lUaRtRb86Lf49LSjRBA (權當一個參考和提示,自行搜索嘗試實現才能真正掌握哈,有問題歡迎留言反饋~)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章