Tika Class 文件提取

2024 年 8 月 29 日 | 阅读 2 分钟

为了提取 .class 文件,Tika 提供了 ClassParser 类。该类用于从 .class 文件中提取内容和元数据。它位于 org.apache.tika.parser.asm 包中,包含如下表所示的各种构造函数和方法。

Tika ClassParser 构造函数

构造函数描述
public ClassParser()它用于创建类的实例。

Tika ClassParser 方法

方法描述
public Set<MediaType> getSupportedTypes(ParseContext context)返回此解析器支持的媒体类型集。
public void parse(InputStream stream, ContentHandler handler, Metadata metadata, ParseContext context) throws IOException, SAXException, TikaException将文档流解析为 XHTML SAX 事件序列。

Tika ClassParser 示例

在此示例中,我们将从 .class 文件中提取内容和元数据。请看示例。

我们有一个类 First.class,其中包含以下代码。

输出:(提取 First.class 文件后)

public synchronized class First {
    void First();
    public static void main(String[]);
}
Document Metadata:
dc:title:   First
resourceName:   First.class
title:   First

下一个主题Tika 提取 Jar 文件