PDFBox 拆分 PDF 文档

17 Mar 2025 | 阅读 2 分钟

我们可以将给定的 PDF 文档拆分为多个 PDF 文件。Splitter 类可以将每个 PDF 文件拆分为单独的文件。此类用于将给定的 PDF 文档拆分为多个其他独立文档。

拆分现有的 PDF 文件,请执行以下操作:

加载现有文档

我们可以使用静态 load() 方法加载现有的 PDF 文档。此方法接受一个 文件对象 作为 参数。我们也可以使用 PDFBox 的类名 PDDocument 来调用它。

创建 Splitter 对象

splitter 类用于拆分现有的 PDF 文档。我们可以按如下方式实例化 splitter 类。

拆分 PDF 文档

我们可以使用 splitter 类的 split() 方法拆分现有的 PDF 文档。split() 方法接受 PDDocument 类的对象作为参数。

创建迭代器对象

可以使用 listIterator() 方法来获取迭代器对象。此迭代器对象用于遍历我们需要的文件列表。以下代码创建迭代器对象。

关闭文档

完成任务后,我们需要使用 close() 方法关闭 PDDocument class object

示例-

这是一个包含五个页面的 PDF 文档。前两页包含图像。我们将通过 Java 程序将包含图像的这两页拆分为单独的文件。


PDFBox Splitting PDF Document

Java 程序

输出

成功执行上述程序后,我们可以看到以下输出。


PDFBox Splitting PDF Document

现在进行验证,单独打开 PDF 文件,如下所示 -


PDFBox Splitting PDF Document
PDFBox Splitting PDF Document