PDFBox 提取图片

17 Mar 2025 | 阅读 2 分钟

在本节中，我们将学习如何从现有的 PDF 文档中提取图像。PDFBox 库提供了一个 PDFRender 类，该类将 PDF 文档渲染为 AWT BufferedImage。

请按照以下步骤从现有 PDF 文档中提取图像：

加载现有 PDF 文档

我们可以使用静态 load () 方法加载现有的 PDF 文档。此方法接受一个 文件对象作为参数。我们也可以使用 PDFBox 的类名 PDDocument 调用它。

File file = new File("Path of Document"); 
PDDocument doc = PDDocument.load(file); 

实例化 PDFRender 类

PDFRenderer 类将 PDF 文档渲染为 AWT BufferedImage。此类的实例需要一个文档对象作为其参数。这可以在以下代码中显示。

渲染图像

Renderer 类的 renderImage() 方法可用于渲染特定页面中的图像。此方法需要传递页面索引，我们要在该页面中渲染图像。

将图像写入文件

我们可以使用 write () 方法将渲染的图像写入文件。在此方法中，我们需要传递三个参数 -

渲染的图像对象。
表示图像类型的字符串（jpg 或 png）。
我们需要将提取的图像保存到的文件对象。

这可以在以下代码中显示

关闭文档

完成任务后，我们需要使用 close () 方法关闭 PDDocument 类对象。

示例-

这是一个 PDF 文档，我们将使用 Java 程序的 PDFBox 库将其页面提取为图像。

Java 程序

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;

public class ExtractImage {
	
public static void main(String[] args)throws IOException {
				
		//Loading an existing document 
	      File file = new File("/eclipse-workspace/blank.pdf");
	      PDDocument doc = PDDocument.load(file);
	
	//Instantiating the PDFRenderer class
	      PDFRenderer renderer = new PDFRenderer(doc);

	//Rendering an image from the PDF document
	      BufferedImage image = renderer.renderImage(2);

	//Writing the image to a file
     ImageIO.write(image, "JPEG", new File("/eclipse-workspace/my_image.jpeg"));
	
	      System.out.println("Image created successfully.");
	
	//Closing the document
	doc.close();
	}
}

输出

成功执行后，上面的程序显示以下输出。

现在进行验证，打开图像，如下所示 -

下一个主题PDFBox 获取位置和图像大小

← 上一个下一个 →

PDFBox 提取图片

加载现有 PDF 文档

实例化 PDFRender 类

渲染图像

将图像写入文件

关闭文档

示例-

Java 程序

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

PDFBox 教程

PDFBox 提取图片

加载现有 PDF 文档

实例化 PDFRender 类

渲染图像

将图像写入文件

关闭文档

示例-

Java 程序

相关帖子

PDFBox 环境设置

PDFBox 添加矩形

合并 PDF 文档

创建第一个 PDF 文档

PDFBox 添加文本

获取位置和图片大小

PDFBox 删除页面

使用字体

提取电话号码

PDFBox 插入图片

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器