相信有不少朋友日常工作會用到 Excel 處理各式表格文件,更有甚者可能要花大把時間來做繁瑣耗時的表格整理工作。最近有朋友問可否編程來減輕表格整理工作量,今兒我們就通過實例來實現 Python 對錶格的自動化整理。 首先我們有這麼一份數據表 source.csv: 我們要做的是從上表中提取數據,來生 ...
相信有不少朋友日常工作會用到 Excel 處理各式表格文件,更有甚者可能要花大把時間來做繁瑣耗時的表格整理工作。最近有朋友問可否編程來減輕表格整理工作量,今兒我們就通過實例來實現 Python 對錶格的自動化整理。
首先我們有這麼一份數據表 source.csv:
我們要做的是從上表中提取數據,來生成一份符合以下要求的表格:
-
按照以下分組名單 group.xls 來整理數據表中的數據:
-
最終要展現的數據項:
-
其中“K數據/60”為數據表中的“數據K”/60後保留的2位小數
我們先看手工 Excel 如何處理以上需求:要在 source.csv 數據表中讀取讀取每條數據,放入 group.xls 匹配的分組成員中,最後篩選需要的數據項,再對特定的 “數據K”進行運算處理。
那麼 Python 又將如何操作呢?這裡我們要用到功能強大的 pandas 庫。
pandas 是基於NumPy 的一種工具,該工具是為瞭解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。pandas提供了大量能使我們快速便捷地處理數據的函數和方法。你很快就會發現,它是使Python成為強大而高效的數據分析環境的重要因素之一。
pandas 百度百科
首先導入 pandas 庫,通過相關的函數讀取 csv 和 xls 表格內容:
import pandas as pd
# 讀取 group.xls 分組信息
group = pd.read_excel("group.xls",header=None)
group.columns=["分組","角色"]
print(group)
# 讀取 source.csv 獲取所有成員數據
source = pd.read_csv("source.csv")
print(source)
我們可以首先對 source.csv 中的數據項進行篩選,需要的數據項有“角色”、“編號”、“數據B”、“數據C”、“數據D”和“數據K”:
# 通過 iloc[:,[列坐標]] 來定位需要的各列數據
filter_merge = source.iloc[:,[0,2,4,5,6,13]]
print(filter_merge)
接下來是根據分組角色來匹配角色數據,註意到 group.xls 和 source.csv 共有“角色”一項,我們可以通過此項將兩個表格融合從而形成匹配填充的效果。
combine = pd.merge(group,filter_merge,on="角色")
接下來我們在第二列插入運算後的“數據K/60”:
combine.insert(1,"數據K/60",round(filter_merge["數據K"]/60,2))
最終,我們將生成的數據格式寫入新的 xlsx 表格中:
combine.to_excel(excel_writer="result.xlsx",index=False)
最終自動生成的表格如下:
以上便是 Excel 表格整理的 Python 代碼簡單實現,在操作過程中也遇到幾個問題貼在這裡供大家參考:
-
導入 pandas 時可能會報錯:
解決:根據報錯信息安裝需要的相關模塊
-
要進行表格整理的電腦為公司電腦、無法連接外網下載 Python
解決:
https://blog.csdn.net/sundan93/article/details/62888068
參照以上鏈接,先在外網電腦下載 Python 安裝文件以及相關的模塊安裝文件,拷貝到無網路電腦進行安裝
-
以上表格整理的實例在現實工作有參考意義麽:
回答:文中表格的原型是一份員工工作記錄,根據人員分組進行相關的數據統計。類似的分組統計成員數據都可以根據此簡單 Python 模版來實現。
源代碼:https://pan.baidu.com/s/1ro4lUaRtRb86Lf49LSjRBA (權當一個參考和提示,自行搜索嘗試實現才能真正掌握哈,有問題歡迎留言反饋~)