Skip to content

RPA 元素的概念和基本使用

目录

  1. 什么是 RPA 元素
  2. 元素在 RPA 中的作用
  3. 元素的类型和应用场景
  4. 如何拾取元素
  5. 不同应用程序的拾取方式
  6. 元素的基本使用
  7. 使用案例
  8. 相关文章

什么是 RPA 元素

在 RPA(机器人流程自动化)中,元素(Element) 是用户界面中的可操作对象。简单来说,元素就是你在电脑屏幕上看到的、可以与之交互的各种界面组件。

元素的核心特征

每个元素都具备以下特征:

  1. 位置信息:元素在屏幕上的具体位置和大小
  2. 类型标识:元素是什么类型(按钮、输入框等)
  3. 唯一路径:用于准确找到这个元素的路径信息

元素在 RPA 中的作用

元素是 RPA 自动化流程的基础,所有的自动化操作都是通过操作元素来实现的。

主要作用

  1. 定位目标:帮助 RPA 系统准确找到需要操作的界面组件
  2. 执行操作:通过元素可以执行点击、输入、读取等操作
  3. 获取信息:可以从元素中读取文本、值等信息
  4. 流程控制:通过判断元素是否存在来控制流程走向

元素的类型和应用场景

根据不同的应用程序类型,系统会使用不同的方式来识别元素。

大类子类适用场景特点示例应用
桌面元素UIAWindows 系统自带的应用程序
使用 .NET、WPF 等技术开发的桌面软件
大多数 Windows 原生应用
识别精度高
支持完整的控件信息获取
适用于大多数 Windows 应用
记事本、计算器
Office 软件(Word、Excel 等)
各种桌面应用程序
MSAA一些老旧的 Windows 应用
特殊类型的应用程序
使用 MSAA(Microsoft Active Accessibility)接口
兼容性好,但功能相对有限
老旧 Windows 应用
特殊类型应用程序
JABJava Swing、AWT 开发的应用程序
企业级 Java 应用
通过 Java Access Bridge 访问
适用于 Java 桌面应用
Java 桌面应用
企业级 Java 系统
SAPSAP GUI 应用程序
SAP 系统操作
针对 SAP 系统特殊优化
支持 SAP 特有的控件类型
SAP GUI
SAP 系统
Web 元素IEInternet Explorer 浏览器
一些老旧的网页系统
专门针对 IE 浏览器优化
通过 JavaScript 注入获取元素信息
Internet Explorer
老旧网页系统
ChromeChrome 浏览器
网页中的各种元素(按钮、输入框、链接等)
支持现代 Web 标准
可以识别网页中的 DOM 元素
支持动态内容和 iframe
网页表单填写
网页数据抓取
在线系统操作
EdgeEdge 浏览器
网页中的各种元素
支持现代 Web 标准
可以识别网页中的 DOM 元素
支持动态内容和 iframe
网页表单填写
网页数据抓取
在线系统操作
360360 浏览器
网页中的各种元素
支持现代 Web 标准
可以识别网页中的 DOM 元素
支持动态内容和 iframe
网页表单填写
网页数据抓取
在线系统操作
CV 元素CV无法通过其他方式识别的元素
需要基于图像识别的场景
基于计算机视觉技术
通过图像匹配和特征识别定位元素
适用于复杂或特殊界面
游戏界面
特殊软件界面
无法通过标准接口访问的应用

如何拾取元素

image1image2image3


不同应用程序的拾取方式

系统会根据应用程序的类型,自动选择最合适的拾取方式。

比如发现是浏览器就会自动调用浏览器的拾取,如果发现是桌面就会调用桌面拾取


元素的基本使用

image4


使用案例

举一个例子:到百度上搜索今天天气怎么样

image5

image6

  • 第一步:打开浏览器进入百度首页
  • 第二部:填写输入框,这个输入框就是一个元素
  • 第三步:点击百度一下按钮,这个按钮也是一个元素

相关文章