Apache Tika 安装

17 Mar 2025 | 阅读 2 分钟

要安装 Tika,我们可以根据需求使用几种方法。下面给出了一些常见的安装选项。

  1. 源代码发布
  2. Maven 依赖项
  3. 命令行实用程序

注意:Tika 1.18 需要 Java 7 或更高版本才能实现。

1. 源代码发布

首先访问 Apache Tike 的官方网站,从那里下载最新版本。下载后,我们可以使用它的库在我们的应用程序中实现。

Tika 构建包含以下组件。

组件描述
tika-core/target/tika-core-*.jar它是包含核心类和接口的核心库。
tika-parsers/target/tika-parsers-*.jar这是一个 Tika 解析器库。它包含基于外部库实现 Tika 解析器接口的类。
tika-app/target/tika-app-*.jar一个 Tika 应用程序,它是一个可运行的 jar 文件,具有图形用户界面和命令行界面。
tika-server/target/tika-server-*.jar它包含 Tika JAX-RS REST 应用程序。
tika-bundle/target/tika-bundle-*.jar它是一个 OSGI 捆绑包,其中包含带有非 OSGified 解析器库的 tika-parsers。这使它们易于在 OSGI 环境中部署。
tika-eval/target/tika-eval-*.jar它提供了一个命令行工具来评估 Tika 的输出。

2. 要在 Maven 项目中实现 Tika,我们可以在 pom.xml 文件中使用以下依赖项。

3. 命令行实用程序

除了源代码,我们还可以从官方网站下载 jar 文件。该文件是可运行的,可以通过使用以下命令运行。

此命令将打开一个 GUI 窗口,如下所示


Tika Installation
下一主题Tika 组件堆栈