查看原文
其他

【RPA课堂】UiPath Web Automation 数据提取方式

RPA中国 RPA全球生态 2022-08-02


企业和初创公司都将自己的应用程序设置在广泛结构化的基于Web的系统上。这些基于Web的系统中存在的信息非常复杂,需要进行大量处理才能阅读、理解和分析。为了实现这一点,我们需要机器人流程自动化。在UiPath Web Automation的帮助下,我们可以自动执行各种任务,如表单填写、屏幕抓取、数据提取网站测试等。


·    什么是Web Automation?

·    Web Automation的用法

·    实践操作:Google联系人的Web抓取

·    实践操作:从电子商务网站提取数据并存储在电子邮件中



什么是 Web Automation?

Web Automation是一个自动化过程,通过它可以根据Web元素的属性识别它们并相应地对其进行操作。这种自动化可以适用于任何网站,也可以远程部署在网络中的各种机器上。UiPath提供了一个内置的记录器,可以通过直观的图形工作流编辑器读取和制定基于Web的活动。

视频了解UiPath自动化Web数据提取方式


 Web Automation的用法



当今行业中Web自动化的主要用途是:

数据提取(Data Extraction)可以提取大量数据并将其存储到各种网站的文件和数据库中。

记录(Recording)在网站上执行的操作可以被记录下来,以便将来进一步执行。

网站测试(Website Testing)网站功能和特性可以根据用户的需求进行测试。

报告生成(Report Generation)通过提取所有数据然后根据各种参数对其进行分析来生成报告。

应用程序转移(Application Transfer)根据使用要求,可以将应用程序从一个域转移到另一个域。


Web抓取可用于各种类型的Web格式,例如JSON,HTML。了解了什么是Web自动化,接下来让我们看看使用UiPath执行Web Automation的实用方法。我们将在本文中看到两个实践。

1、从Google通讯录中抓取数据

2、从电子商务网站抓取数据并存储在电子邮件中

实践:Google联系人的网页搜寻

任务

从Google通讯录中提取数据并将其存储在文件中。

自动化步骤

·    使用Data Scraping工具提取数据。

·    相应地提取相关值。

·    使用“Write CSV”组件将数据存储在CSV文件中。


解决方案:


步骤1: 打开Google通讯录页面以提取数据。

步骤2: 打开UiPathStudio并创建一个Black项目。



步骤3:从功能区中选择DataScraping选项并选择要选择的元素。按下下面对话框中的Next。  




步骤3.1: 将鼠标悬停在数据源字段上,然后单击数据源字段。 在这里我们选择名称。



步骤3.2: 之后将看到另一个对话框,它要求选择第二个元素来创建模式。



步骤4:  选择第二个元素创建模式后,将获得一个配置列的选项。在打开的对话框中,还可以重命名列名并提取URL。之后单击Next。参考下图:



步骤5: 现在要从网站中提取其他数据源,请单击“提取关联数据”  选项并重复上述步骤。在这里我们将提取联系人的电子邮件ID。你会看到以下输出:



步骤6: 完成提取所有必需数据后,单击  Finish 此操作将打开一个对话框,询问是否希望数据跨多个页面。参考下图:



步骤7: 要跨越多个页面,请选择“是”并将鼠标停在重定向到下一页的区域上。然后,你将被重定向到UiPath仪表盘。

步骤8: 现在将所有提取的数据存储到.CSV文件中,将Write CSV组件拖到Data Scraping Do 部分  。

步骤9: 在“File Path”部分中,提到要存储提取数据的.csv文件路径然后在DataTable部分中提到 ExtractDataTable变量参考下图:


注意:ExtractDataTable变量是从Data Scraping Wizard自动生成的输出变量。你可以在提取结构化数据中找到此变量。


步骤10: 单击 Run 按钮执行此序列。你会看到数据存储在.csv文件中。

现在知道如何从网站获取数据,接下来让我们进入关于UiPath Web自动化的第二个实践。

实践:从电子商务网站提取数据

任务

在这个实践中,我们的任务是设计自动化,读取电子邮件的主题并执行自定义搜索。例如,如果我的标题栏写的是LG电视,那么设计的自动化系统必须在Flipkart中搜索LG电视并提取名称、URL和价格。

自动化的步骤

·    拖动“Get IMAP邮件”组件并配置该组件。

·    拖动For Each组件以执行一组操作。

·    拖动“打开浏览器”组件并输入URL。

·    使用Data Scraping工具并提取数据。

·    相应地提取相关值。

·    拖动Write CSV组件并输入文件路径。

·    使用“发送SMTP邮件”发送电子邮件。


解决方案


第1步:创建一个空白项目

第2步:我们的第一个任务是获取包含主题的电子邮件。在这里我们希望主题是苹果手机。要执行此操作,请拖动“ Get IMAP邮件”组件。

2.1转到此活动的“属性”窗格,并输入以下内容:

·    端口号:993

·    服务器名称:“imap.gmail.com”

·    电子邮件:输入你的电子邮件ID

·    密码:输入你的密码

(这只会读到你收件箱中的第一封邮件)

·    选中“只读未读邮件”框(这只会读取未读消息。

参考下图:


2.2现在要存储来自电子邮件的数据,我们需要创建一个变量。创建变量请转到变量窗格并输入变量的名称和类型。在这里,我们将输入名称为MailMessages,并将类型命名为List <T>

2.3在<T>中,必须输入邮件消息为此,请在变量部分中浏览类型并搜索System.Net.Mail。 在此必须选择MailMessage。参考下图:

 


2.4“获取IMAP邮件消息”的“输出”部分中输入变量MailMessages

第3步:要为“n”个电子邮件启用信息,必须将每个组件的“for”拖放到“ Get IMAP邮件”消息的下面。

3.1:接下来在项目部分输入邮件,并在expression部分输入MailMessages变量。这将能够为每个邮件执行“正文”部分中提到的一组操作。此外,在此活动的“属性”部分中,将Type Argument提及为System.Net.MailMessage。参考下图:


第4步:现在打开Flipkart网站。必须在每个活动主体部分中拖动“打开浏览器”组件,并在双引号中输入URL。在这里我们将搜索Fossil手表和URL。

注意:搜索的内容无关紧要,因为我们将在下一步中更改URL。


第5步:由于我们的任务是阅读主题行,然后搜索主题行中提到的项目,所以必须修改OpenBrowser组件中提到的URL

如果你的网址如下:

https://www.flipkart.com/searchq=fossil%20watches&otracker=search&otracker1=search&marketplace=FLIPKART&as-show=on&as=off,然后更改了搜索参数下的项目,在引号中包含 + mail.Subject +。因此你的新网址应如下所示:

https://www.flipkart.com/search?q="+mail.Subject+"&otracker=search&otracker1=search&marketplace=FLIPKART&as-show=on&as=off

参考下图:


现在已设计了自动阅读电子邮件的标题行,然后在Flipkart网站中执行自定义搜索。因此如果主题行有苹果手机,那么设计的自动化将读取主题行并在Flipkart中搜索苹果手机。

现在,我们的下一个任务是执行数据抓取。

第6步:要执行数据搜集可以参考我们之前的实际操作并执行1-7中的步骤。

第7步:现在一旦抓取数据并被重定向到UiPath仪表盘,必须删除Attach Browser组件,并将ExtractDataTable部分保留在For Each组件的Body部分中。

第8步: 之后将所有提取的数据存储到.csv文件中,将Write CSV组件拖到  For Each Activity 的 Do 部分。

第9步: 接下来,在“FilePath”部分中,输入要存储提取数据的.csv文件路径,然后在DataTable部分中输入 ExtractDataTable变量参考下图:


第10步:要获取包含所有数据的电子邮件,必须按序列拖动“ Send SMTP邮件”组件。

10.1在此操作中,必须输入以下内容:

·       电邮地址:“abc@gmail.com”

·       主题:“附件”

·       主体:“PFA”


此步骤将设计任务,将包含已删除数据的电子邮件发送到输入的主题行附件和正文为PFA的电子邮件地址。参考下图:



10.2由于我们尚未附加文件,因此要附加文件请单击此活动中的“附加文件”选项,并在打开的对话框中输入该文件的路径。然后单击确定。参考下图:



10.3现在必须进入到SMTP活动属性窗格并输入以下内容:

·    端口号 - > 465

·    服务器名称:“smtp.gmail.com”

·    电子邮件:输入FROM电子邮件地址

·    密码:输入FROM电子邮件地址的密码

·    发件人:输入FROM电子邮件地址



第11步:现在,给自己写一封主题为apple%20phones(%20用于标识UiPath中的空间)的邮件。收到邮件后,返回UiPath仪表盘并单击“ 运行”以执行自动化。你将看到一封邮件,其中包含所抓取数据的附件。参考下图:




【RPA课堂】栏目主要介绍与RPA相关的学习内容,其中包括RPA基础知识、(UiPath、Blue Prism、AuTomation)工具操作练习、顶级RPA项目实践等干货内容,形式不限于文字、图片,还包括直观的视频呈现,希望能够对大家了解、学习RPA有些许帮助,该栏目我们将固定更新,请大家持续关注。

 


News

往期精彩内容推荐

 




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存