Skip to content

提取PDF文档文本

指令说明

获取指定文件路径下 PDF 文档文本。

功能描述

本指令用于获取指定路径下 PDF 文档的文本内容。

参数说明

参数名类型必填说明
PDF文件路径String输入 PDF 文件的完整路径。
PDF文件密码String提供加密PDF文件的解锁密码。高级参数中的可选项,通常在处理受保护PDF时使用,帮助系统绕过密码验证以读取或操作文件内容。如果PDF文件未加密,则无需提供此参数。
选择范围SelectRangeType选择提取范围,可选“所有页面”或“指定页面”。
指定页面范围String当选择“指定页面”时生效,输入页面范围,格式如 1-3,5,7-9,11,表示从1到3页、5页、7到9页、11页。
是否保存为文件TextSaveType是否将提取的文本保存为文件,可选“不保存”、“Word文件”、“文本文件”、“Word文件和文本文件”。
保存文件路径String保存文件的文件夹路径,当选择保存文件时生效。
保存文件名String输入保存文件名,不输入则使用默认文件名。
存在同名文件处理方式FileExistenceType当存在同名文件时的处理方式,高级参数中的可选项,可选“覆盖原有文件”、“创建文件副本”、“取消保存操作”。

返回值

返回存储PDF文档文本内容的列表变量。

使用示例

业务流

流程执行逻辑:使用【提取PDF文档内容】原子能力获取指定路径下的 PDF 文档内容,并将用原子能力【日志打印】输出文档内容。

注意事项

常见问题

相关指令