Skip to content

提取PDF表格到Excel

指令说明

从指定路径的 PDF 文档中提取表格,并将其保存为目标文件夹中的 Excel 文件。

功能描述

本指令用于从PDF文件中提取表格数据,将每个表格转换为数据流,然后保存为Excel文件。

参数说明

参数名类型必填说明
PDF文件路径String选择需要提取表格的 PDF 文件路径。
PDF文件密码String高级参数,如果 PDF 文件需要密码,请输入密码,否则留空。
选择范围SelectRangeType选择需要提取表格的页面范围,可选“所有页面”或“指定页面”。可选值:所有页面(默认)、指定页面。
指定页面范围String输入需要提取表格的具体页面范围,格式示例:1-3,5,7-9,11,表示第 1 至 3 页、第 5 页、第 7 至 9 页和第 11 页。仅当“选择范围”为“指定页面”时显示。
是否需要合并多个表格Boolean当出现跨页表格时,可选择是否合并成一个表格,建议表头相同时选择合并。可选值:是(默认)、否。
保存文件路径String选择保存提取表格文件的文件夹路径。
表格文件名String输入提取后生成的表格文件名,不输入则使用默认文件名。
存在同名文件处理方式FileExistenceType高级参数,当保存目录中存在同名文件时的处理方式。可选值:覆盖原有文件、创建文件副本(默认)、取消保存操作。

返回值

返回表示提取后的 Excel 文件路径的变量。

使用示例

业务流

流程执行逻辑:使用【提取PDF表格到Excel】原子能力提取指定路径的PDF文档中的表格,并将提取后的Excel文件路径输出至结果变量。

注意事项

  • 密码保护PDF:输入文件有密码时合并失败(无解锁参数)。
  • 路径验证:检查文件夹存在性;
  • 输出命名:未指定合并文件名时会进行默认命名,建议显式提供,避免冲突。
  • 性能:大 PDF 文件提取可能耗时,建议分页处理

常见问题

相关指令