查看原文
其他

解放双手,利用 PyAutoGUI 快速构建自动化操作脚本

Linux爱好者 2021-09-08

The following article is from 早起Python Author 大奎

一、背景

我们经常遇到需要进行大量重复操作的时候,比如网页上填表,对 web 版本 OA 进行操作,自动化测试或者给新系统首次添加数据等。这些操作的特点往往是:数据同构,大多是已经有了的结构化数据;操作比较呆板,都是同一个流程的点击、输入;数据量大,极大消耗操作人精力。

那么能不能自动化呢?

二、自动化的方案

如果你在 web 上进行操作, Python 的 Selenium 可以满足要求。如果需要对 GUI 界面进行操作,你恐怕得试验下“按键精灵”能不能满足要求。对新系统添加初始数据,SQL 导出导入是最高效的方式,不过可能需要进行一些较复杂的处理。

曾经多次遇到要求一条条手动输入旧数据的系统升级活动。

但以上都存在一些问题, Selenium 比较复杂,按键精灵功能上不太完善, SQL 需要一定的知识基础。那么这里推荐一个更好的解决方案:PyAutoGUI

其实 PyAutoGUI 最主要好处就是比较简单,应急使用的话可以很快构建一个可用的自动化操作脚本。毕竟,数据处理任务本来就比较急迫,没有时间使用复杂知识,来构建一个完善的脚本。

三、思路和知识点

现在哈来说一下基本思路与相关知识点

  • PyAutoGUI 就是模拟键盘、鼠标在界面上进行操作。
  • 这里只使用它的 click 功能来模拟鼠标点击。
  • 为了获取需要点击的位置,设计了一个鼠标坐标获取的程序。
  • ASCII 码的输入比较简单。再解决汉字输入问题,就使得系统基本可用了。

本文以在 web 界面批量新增数据记录为例,讲解如何自动化操作。这个例子只是演示之用,非常简单,大家自行理解、迁移。

四、操作步骤

4.1 初识 PyAutoGUI

简单地说, PyAutoGUI 就是模拟键盘、鼠标在界面上进行操作的包。安装时直接使用如下语句:pip install pyautogui即可。

编写一个简单的测试程序:

import pyautogui as pag

pag.PAUSE = 1.5
pag.click(63,191

以上程序导入库,定义了每步骤的暂停时间 1.5 秒(用来留给操作时间),然后在屏幕左起 63 像素,上起 191 像素这个点上点击了鼠标。

4.2 坐标系

PyAutoGUI 默认的坐标系从屏幕左上角开始,x 轴向右增大,y 轴向下增大。所以显示器上每个点都有自己的位置。

引申一下,当知道界面上每个按钮的位置时,点击这些点,就是执行相应的操作了。

当然,这一切的前提是界面不变。大多数应用的界面、按钮位置不会变来变去。如果你有这方面需求,可以参考下 locateOnScreen() 函数。这个函数根据你提供的图片,在屏幕上找到像素匹配的地方。这样就不怕按钮动来动去了。

为了获取屏幕的坐标系,写了一个简单的程序,用来获取鼠标在屏幕上的坐标。大家可以自行下载运行。

import pyautogui as pag 
import os 

try:
    while True:
        os.system('cls')
        a = '%4d,%4d'%pag.position()
        print(a)
except Exception as e:
    print(e) 

运行以上程序,移动鼠标到各个按钮上,就可以看到相应的坐标。

4.3 点击

PyAutoGUI 的点击很简单:

pyautogui.click(x=None, y=None, clicks=1, interval=0.0, button='left', duration=0.0)

其中xy是坐标,clicks 是点击次数,interval 是点击间隔,button 指代三个鼠标按钮的哪一个,duiation 是点击之间的间隔。

写如下程序,来进行任务、时间和新建按钮之间的跳转。

pag.click(63,191)
pag.click(328,191)
pag.click(384,461)
pag.click(374,191)

4.4 输入

输入 ASCII 字符和键盘击键、热键分别如下:

  • 输入 ASCII 字符串是typewrite(message='test message.',interval=0.5)
  • 击键是press('esc')
  • 按下是KeyDown('ctrl')
  • 松开是KeyUp('ctrl')
  • 组合键是hotkey('ctrl','v')。

至于汉字,稍微复杂点。

4.5 汉字输入

涉及汉字,无法用 ASCII 方案解决,需要导入包 pyperclip ,这个包封装了系统剪贴板,大家知道怎么回事了吧。

import pyperclip 

#以下读入内容,就是把内容存入剪贴板。
pyperclip.copy('需要输入的汉字')
#以下输出内容,就是粘贴。
pag.hotkey('ctrl','v')

其实就是用 pyperclip 模拟拷贝,用热键 Ctrl+v 粘贴,实现了非 ASCII 字符的输入。

4.6 集成起来

下面,把整个程序集成起来看:

import pyautogui as pag
import pyperclip

pag.PAUSE = 1.5
pag.FAILSAFE = True

to = ['测试任务1','测试任务2','测试任务3','测试任务4','测试任务5',\
      '测试任务6','测试任务7','测试任务8','测试任务9','测试任务10']

for t in to:
    pag.click(63,191)
    pyperclip.copy(t)
    pag.hotkey('ctrl','v')
    pag.click(328,191)
    pag.click(384,461)
    pag.click(374,191)

以上程序,根据 to 列表内容,把操作分解为点击和粘贴,实现了自动化操作的目的。大部分编码都很好理解,能跟鼠标操作一一对应起来。可能存在难度的是数据源的问题,总不能把所有数据都写入程序吧?

五、数据源

相较于复杂的现实数据源,最好的方式就是把数据转成 csv 文件。这样许多 Excel 都可以另存成这个文件,其本身又是基于文本的,可读可写,比较方便。其他诸如 SQL 数据库、 XML 数据也可以导出转换为 csv 文件。

假设现在有了 csv 格式数据源 data.csv ,需要这样操作。

to = []

with open('data.csv')as f:
    lines = f.readlines()

for line in lines:
    to.append(tuple(line.split(',')))

以上代码比较简单,把 csv 中存成的数据存储到 to 这个数组里,每行数据都是一个元组,调用的时候,如4.6部分代码所示,使用 for 循环加上元组下标即可。

六、总结

本文使用 PyAutoGUI 包,对各种鼠标点击、输入之类的机械重复操作进行自动执行,可大幅提高工作效率。这里只使用了 click 功能和 pyperclip 包的 copy 功能。主要是为了简化编程,让大家在紧张和繁琐的操作中,快速编写一个自动化执行的小脚本。


- EOF -

推荐阅读  点击标题可跳转

1、Python 之父:Python 4.0 可能不会来了

2、Python 里最具代表性的符号,竟如此强大

3、写好 Python 代码的几条重要技巧


看完本文有收获?请分享给更多人

推荐关注「Linux 爱好者」,提升Linux技能

点赞和在看就是最大的支持❤️

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存