大学生,巧用Python自动化办公,火了!
人生苦短,快学Python!
今天分享一个真实的Python自动化办公实战案例。近几年开始,大学里的团支书便多了一项任务——催收青年大学习截图。一天天的太卑微了,班级几十个人,一个个收集整理起来超麻烦,收集完截图后还需要改名字,填充到Excel中提交给老师。真的繁琐又心累…
对于这种重复性任务,能不能用Python帮帮忙呢?
如下图所示,左侧是存在本地文件夹中的班级每个同学的青年大学习截图,但是没有标注名字。右侧是班级同学的名单,后续需要将对应的同学截图插入到Excel表格的B列中。
其实解决这个问题的方法很简单,几个小步骤其实在我的书《快学Python:自动化办公轻松实战》中都能找到答案,比如在2.3.2章节通过图解的方式讲解Python文件重命名,在4.4.7章节中用案例来演示使用Python向Excel中批量插入图片。
├──书籍《快学Python:自动化办公轻松实战》
│ ├── 2.3.2 文件 / 文件夹的自动重命名
│ ├── 4.4.7 案例 :插入图片与图形绘制
│ ├── 11.3 实战项目 :利用 Python 批量识别财务发票信息
至于一开始的文字orr识别,则可以参考11.3章节的实战项目,两者有异曲同工之妙。
接下来我们开始详细学习如何解决这个Python自动化办公需求。首先调用百度API需要安装一个库,如下所示。
pip install baidu_aip
接着使用百度API搭建自定义函数,实现对任一截图进行文字OCR识别。
在交互式环境中输入如下命令:
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def get_words_result(filePath):
image = open(filePath, 'rb')
text_list = client.general(image.read())
texts = ""
for i in range(16):
texts += text_list['words_result'][i]['words']
image.close()
return texts
Python调用自定义的get_words_result()
函数,文字识别青年大学习截图,执行效果如下图所示。
截图中的文字都识别出来了,但怎么确定这个截图属于哪位同学呢?观察上图左侧,原截图中其实有两个字段是唯一的:姓名、用户编号。
还记得有一张“学生名单”的用户表嘛,所以我们可以遍历表格中的姓名列,判断该姓名是否存在于刚刚识别出来的文字字符串中。若存在,则证明该截图属于A同学,接着使用os.rename()
方法将截图重命名为A同学.png
,最后再将截图插入到Excel表格中对应的A同学后面。
这一步插入图片使用的是,openpyxl模块中的sheet.add_image()
方法
在交互式环境中输入如下命令:
wb = load_workbook("学生名单.xlsx")
sheet = wb.active
filenames = os.listdir("./截图")
for i in filenames:
time.sleep(1)
texts = get_words_result(f"./截图/{i}")
for row in sheet:
student_name = row[0].value
row_name = row[0].row
if student_name in texts:
os.rename(f"./截图/{i}", f"./截图/{student_name}.png")
sheet.row_dimensions[row_name].height = 54
img = Image(f"./截图/{student_name}.png")
width, height = img_resize(img.width, img.height)
img.width, img.height = width, height
sheet.add_image(img, f'B{row_name}')
在上述代码中,在add_image()
插入图片前还有4行Python代码。这是为了保证截图插入表格中与单元格相贴合,所以既设置了单元格的行高,也重置了截图的长宽。
具体输出结果所下图所示:
所上图所示,班级每个同学的青年大学习截图,都重新标注了名字,而且也对应的插入到Excel表格的B列中。
人生苦短,快学Python!
推荐阅读
新书上市
《SPSS统计分析大全》
SPSS统计思维与实践:全书通过60多个各行业经典应用案例+10种统计分析方法,全面讲解SPSS统计分析的所有常见思想、技术与应用,涉及自然科学、工程科学、社会科学等各个领域,涵盖统计绘图、主题地图、大数据等方面。
▼点击查看作者新书《快学Python》的5折优惠!