Apache POI Microsoft Word

2024年8月29日 | 1 分钟阅读

Apache POI 提供了纯 Java API 用于处理 Microsoft Office Word。我们可以从 Java 程序创建新的 word 文档,写入和读取数据。

HWPF (Horrible Word Processor Format) 用于读取和写入 MS-Word 的 .doc 扩展文件。

XWPF (XML Word Processor Format) 用于读取和写入 MS-Word 的 .docx 扩展文件。

我们可以使用以上两者来创建新文档,获取段落、图片、表格、章节、页眉等。

以下是 Microsoft Office word 常用类。

Class描述
HWPFDocument它用于处理 .doc 扩展文件。
XWPFDocument它用于创建具有 .docx 文件格式的 MS-Word 文档,并位于 org.apache.poi.xwpf.usermodel 包中。
XWPFParagraph它用于在 word 文档中创建段落,并位于 org.apache.poi.xwpf.usermodel 包中。
XWPFRun它用于向段落添加文本区域,并位于 org.apache.poi.xwpf.usermodel 包中。
XWPFStyle它用于向 word 文档中的对象元素添加不同的样式,并位于 org.apache.poi.xwpf.usermodel 包中。
XWPFTable它用于向 word 文档中添加表格,并位于 org.apache.poi.xwpf.usermodel 包中。
XWPFWordExtractor它是一个基本解析器类,用于从 Word 文档中提取简单文本。