HTML 转 Markdown Python

2025年3月17日 | 阅读 3 分钟

引言

Markdown 是一种轻量级标记语言,它允许人们编写在网络上看起来结构化且易于阅读和理解的文本。另一方面,网络内容必须使用 HTML 进行标记和显示。将 HTML 文本转换为 Markdown 会很有帮助,例如,如果您想组织内容或使其更具可读性。

在 Python 中将 HTML 转换为 Markdown 的一种方法是使用 markdownify 模块。通过此软件,可以快速可靠地将文本从 Markdown 转换为 HTML。请务必先将 markdownify 包下载并安装到您的 python 中,然后才能开始转换。如果安装了该包,就可以导入它并使用其功能将 HTML 文本转换为 Markdown。

安装

您需要单独安装它,因为它不是 Python 包默认附带的。以下命令是模块安装命令。它应该输入到终端中。

使用 Python 将 HTML 文本转换为 Markdown 的过程涉及多个步骤,如下所示。

  • 导入模块
    第一步,必须在 Python 脚本中包含 markdownify 模块。此模块包含多种实用程序,包括将 HTML 转换为 Markdown。
  • 创建 HTML 文本
    在这里,您将生成要转换为 Markdown 文本的 HTML 文本。您有两种选择:手动编写内容,或使用 Python 库(例如文件中的 requests 或从网页中)下载内容。
  • 使用 markdownify() 函数并将文本发送给它
    获得 HTML 文本后,您可以使用 markdown 模块提供的 markdownify() 方法将其转换为 Markdown。此方法接受 HTML 文本作为输入,并输出相应的 Markdown 内容。
  • 显示 Markdown 文本
    最后,可以通过使用内置的 Python 例程在控制台中查看 Markdown 文本或将其保存到文件中。

基本过程是引入必要的模块,然后输入 HTML 文本,最后通过 markdownify() 函数执行它,从而生成 Markdown 版本。当您打算将 HTML 信息转换为 Markdown 以使其更易于阅读和格式化时,这种特定技术会很有用。

示例 1:将 HTML 转换为 Markdown

现在让我们关注将用于将纯 HTML 转换为 Markdown 的代码。

检查下面显示的代码。在此代码中,markdownify 模块是模块的首次导入。之后,我们制作一些将自动转换为 MarkdownHTML 内容。突出显示的部分是早期的 HTML 标题和段落。

接下来,我们使用 markdownify() 函数将 HTML 文本转换为 Markdown 格式。此函数接收 HTML 内容作为输入,并立即生成所需的 Markdown 文本。

示例

最后,我们将其与 print 函数一起显示转换后的 Markdown。结果是针对初始 HTML 输入的转换后的 Markdown。

Main.py

输出

HTML to Markdown Python

示例 2

让我们看另一个相当复杂的 HTML 代码示例。查看下面显示的代码。

Main.py

输出

HTML to Markdown Python

结论

总之,使用 PythonHTML 转换为 Markdown 是一种用于在网络上格式化和显示文本的有用方法。此过程可以通过使用 markdownify 模块来完成,该模块有助于快速将 html 文本转换为 markdown 格式。


下一主题#