提取PDF文档文本

指令说明

获取指定文件路径下 PDF 文档文本。

功能描述

本指令用于获取指定路径下 PDF 文档的文本内容。

参数说明

参数名	类型	必填	说明
PDF文件路径	String	是	输入 PDF 文件的完整路径。
PDF文件密码	String	否	提供加密PDF文件的解锁密码。高级参数中的可选项，通常在处理受保护PDF时使用，帮助系统绕过密码验证以读取或操作文件内容。如果PDF文件未加密，则无需提供此参数。
选择范围	SelectRangeType	是	选择提取范围，可选“所有页面”或“指定页面”。
指定页面范围	String	否	当选择“指定页面”时生效，输入页面范围，格式如 `1-3,5,7-9,11`，表示从1到3页、5页、7到9页、11页。
是否保存为文件	TextSaveType	是	是否将提取的文本保存为文件，可选“不保存”、“Word文件”、“文本文件”、“Word文件和文本文件”。
保存文件路径	String	是	保存文件的文件夹路径，当选择保存文件时生效。
保存文件名	String	否	输入保存文件名，不输入则使用默认文件名。
存在同名文件处理方式	FileExistenceType	是	当存在同名文件时的处理方式，高级参数中的可选项，可选“覆盖原有文件”、“创建文件副本”、“取消保存操作”。

返回值

返回存储PDF文档文本内容的列表变量。

使用示例

业务流

流程执行逻辑：使用【提取PDF文档内容】原子能力获取指定路径下的 PDF 文档内容，并将用原子能力【日志打印】输出文档内容。

注意事项

常见问题

相关指令