Python 自动整理 Excel 表格

Python爱好者社区 2022-05-13

The following article is from TEDxPY Author TED

作者：TED

来源：TEDxPY

相信有不少朋友日常工作会用到 Excel 处理各式表格文件，更有甚者可能要花大把时间来做繁琐耗时的表格整理工作。最近有朋友问可否编程来减轻表格整理工作量，今儿我们就通过实例来实现 Python 对表格的自动化整理。

首先我们有这么一份数据表 source.csv：

我们要做的是从上表中提取数据，来生成一份符合以下要求的表格：

按照以下分组名单 group.xls 来整理数据表中的数据：
最终要展现的数据项：
其中“K数据/60”为数据表中的“数据K”/60后保留的2位小数

我们先看手工 Excel 如何处理以上需求：要在 source.csv 数据表中读取读取每条数据，放入 group.xls 匹配的分组成员中，最后筛选需要的数据项，再对特定的 “数据K”进行运算处理。

那么 Python 又将如何操作呢？这里我们要用到功能强大的 pandas 库。

pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。
pandas 百度百科

首先导入 pandas 库，通过相关的函数读取 csv 和 xls 表格内容：

import pandas as pd# 读取 group.xls 分组信息group = pd.read_excel("group.xls",header=None)group.columns=["分组","角色"]print(group)# 读取 source.csv 获取所有成员数据source = pd.read_csv("source.csv")print(source)

我们可以首先对 source.csv 中的数据项进行筛选，需要的数据项有“角色”、“编号”、“数据B”、“数据C”、“数据D”和“数据K”：

# 通过 iloc[:,[列坐标]] 来定位需要的各列数据filter_merge = source.iloc[:,[0,2,4,5,6,13]]print(filter_merge)

接下来是根据分组角色来匹配角色数据，注意到 group.xls 和 source.csv 共有“角色”一项，我们可以通过此项将两个表格融合从而形成匹配填充的效果。

combine = pd.merge(group,filter_merge,on="角色")

接下来我们在第二列插入运算后的“数据K/60”：

combine.insert(1,"数据K/60",round(filter_merge["数据K"]/60,2))

最终，我们将生成的数据格式写入新的 xlsx 表格中：

combine.to_excel(excel_writer="result.xlsx",index=False)

最终自动生成的表格如下：

以上便是 Excel 表格整理的 Python 代码简单实现，在操作过程中也遇到几个问题贴在这里供大家参考：

导入 pandas 时可能会报错：
解决：根据报错信息安装需要的相关模块
要进行表格整理的电脑为公司电脑、无法连接外网下载 Python
解决：
https://blog.csdn.net/sundan93/article/details/62888068

参照以上链接，先在外网电脑下载 Python 安装文件以及相关的模块安装文件，拷贝到无网络电脑进行安装
以上表格整理的实例在现实工作有参考意义么：
回答：文中表格的原型是一份员工工作记录，根据人员分组进行相关的数据统计。类似的分组统计成员数据都可以根据此简单 Python 模版来实现。

后台回复表格可获取代码下载链接，权当一个参考和提示，自行搜索尝试实现才能真正掌握哈，有问题欢迎留言反馈～

感谢阅读

推荐阅读：

1：真实的上海IT圈：张江男vs漕河泾男

2：真实的北京IT圈：后厂村姑 vs 后厂村花？

3：为什么你的提问没人解答？

4：Python爱好者社区历史文章合集（作者篇）

5：Python爱好者社区历史文章合集（类型篇）

好看请点这里~