PDFBox 处理附件

2025年3月17日 | 阅读 3 分钟

PDF 文档可以通过文件系统或远程位置的 URL 引用外部文件。也可以将二进制文件嵌入到 PDF 文档中。

Apache PDFBox 提供了以下可用于引用文件的


PDFBox Working with Attachments
Class描述
PDSimpleFileSpecification它是一个指向文件的简单字符串引用。 PDSimpleFileSpecification 类不允许设置任何参数。
PDComplexFileSpecification它是一个功能更丰富的类,允许对文件引用进行高级设置。

在 PDFBox 中,也可以将文件直接嵌入到 PDF 文档中。这可以通过使用 EmbeddedFile 属性而不是设置 PDComplexFileSpecification 类的文件属性来执行。

将文件嵌入到 PDF 文档中

PDF 文档可以包含文件附件。 可以从 文档 -> 文件附件 菜单访问文件附件。 PDFBox 允许我们在 PDF 文档中添加附件,并从 PDF 文档中提取这些附件。 在 PDFBox 中,附件是附加到文档目录的命名树的一部分。

以下是将附件添加到 PDF 文件的逐步过程。

加载现有文档

我们可以使用静态 load () 方法加载现有的 PDF 文档。 此方法接受一个 文件对象作为 参数。 我们也可以使用 PDFBox 的类名 PDDocument 调用它。

实例化 PDDocumentNameDictionary

在此,附件作为文档目录中“名称”字典的一部分存储。

检索现有附件并添加新附件

创建文件规范,该规范保存嵌入的文件

示例-

输出


PDFBox Working with Attachments