Appearance
提取PDF文档文本
指令说明
获取指定文件路径下 PDF 文档文本。
功能描述
本指令用于获取指定路径下 PDF 文档的文本内容。
参数说明
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
| PDF文件路径 | String | 是 | 输入 PDF 文件的完整路径。 |
| PDF文件密码 | String | 否 | 提供加密PDF文件的解锁密码。高级参数中的可选项,通常在处理受保护PDF时使用,帮助系统绕过密码验证以读取或操作文件内容。如果PDF文件未加密,则无需提供此参数。 |
| 选择范围 | SelectRangeType | 是 | 选择提取范围,可选“所有页面”或“指定页面”。 |
| 指定页面范围 | String | 否 | 当选择“指定页面”时生效,输入页面范围,格式如 1-3,5,7-9,11,表示从1到3页、5页、7到9页、11页。 |
| 是否保存为文件 | TextSaveType | 是 | 是否将提取的文本保存为文件,可选“不保存”、“Word文件”、“文本文件”、“Word文件和文本文件”。 |
| 保存文件路径 | String | 是 | 保存文件的文件夹路径,当选择保存文件时生效。 |
| 保存文件名 | String | 否 | 输入保存文件名,不输入则使用默认文件名。 |
| 存在同名文件处理方式 | FileExistenceType | 是 | 当存在同名文件时的处理方式,高级参数中的可选项,可选“覆盖原有文件”、“创建文件副本”、“取消保存操作”。 |
返回值
返回存储PDF文档文本内容的列表变量。
使用示例

流程执行逻辑:使用【提取PDF文档内容】原子能力获取指定路径下的 PDF 文档内容,并将用原子能力【日志打印】输出文档内容。