解析 tsv Python

2024 年 8 月 29 日 | 4 分钟阅读

引言:在本文中,我们将讨论 Python 解析 tsv。文件存储可读写的信息。在 Python 中对文档进行的操作包括读取、写入、打开、关闭、重命名和删除。Python 具有两种主要类型的文件:二进制文件和文本文件。

二进制文件有很多种。例如 .png、.gif、.jpg 等图像文件,或 .pdf、.xls、.doc 等文档。文本文件可以是源代码、Web 标准、电子表格数据等。本文将介绍处理文本文件(.tsv 文件)中的此类表格数据的方法。我们可以看到一种在 Python 中读取 tsv 文档的方法。

什么是 tsv 文档?

TSV 文档代表 Tab Separated Values(制表符分隔值)文档。一种以表格形式存储数据的文本报告。

TSV 文档格式通常用于通过数据库表或电子表格信息在数据库之间交换事实。每个文档由一个制表符 ( \t ) 分隔。它作为 .csv 格式的替代格式。

.tsv 和 .csv 格式之间的区别在于,.csv 格式使用逗号分隔数据列,而 .tsv 格式使用制表符分隔列。

如何研究 TSV?

对于解析 CSV/TSV 文件,我们已经完成了以下工作,如下所述 -

  1. 点击逗号(CSV)以逗号分隔列。
  2. 点击制表符(TSV)以制表符分隔列。
  3. 点击空格以空格分隔列。
  4. 点击自定义字符以输入用于分隔列的字符。注意:使用反斜杠 (\) 转义特殊字符。

如何在 Python 中读取 .TSV 文件?

在 Python 中使用可用功能读取 TSV 文档

您可以使用 open() 函数在 Python 中读取 tsv 文件。您可以使用 open() 函数研究特定文档。读取后返回相同的文档项。Open() 允许您对文档执行一些文件处理操作,例如读取、写入、追加和创建文件。

打开文件后,使用 CSV 中的 reader() 将文件对象转换为 CSV.reader 对象。要使用 reader,请先导入 CSV。然后,编写 open() 函数。我们将使用一个名为“product.tsv”的 tsv 文件,其中包含三个产品在 12 个月的销售数据。将 tsv 文件作为参数传递给 open() 函数。“file”是一个文件对象。然后使用 csv.reader 将文件对象转换为 csv.reader 对象。将分隔符传递给 CSV,设置为“\t”。

方法 1

使用 pandas -

我使用 pandas 的 read_csv() 从 TSV 文件中读取数据。在 tsv 文件中,制表符分隔每个字段,因此将制表符分隔符“\t”与 tsv 文件一起传递。

语法:使用 pandas 的语法如下所示 -

示例:这里,我们提供一个在 Python 中使用 pandas 的示例。示例如下 -

输出:现在我们编译上述程序,并在成功编译后运行该程序。然后结果如下 -

Date	Topic Name	Word Count
1st December,2022	Parse error python	727
2nd December,2022	Pass function as parameter python	734
3rd December,2022	Parsing data in python	764

方法 2

使用 csv -

使用 csv.reader() 将 tsv 文件对象转换为 csv.reader 对象,并将分隔符“\t”传递给 csv.reader。分隔符用于指定分隔每个字段的字符。

语法:使用 csv 的语法如下所示 -

示例:这里,我们提供一个在 Python 中使用 pandas 的示例。示例如下 -

方法 3

使用 split - 在 Python 中读取 TSV 文件数据的非常简单的方法是使用 split()。您可以读取特定的 TSV 文件并将其数据保存在列表中。

语法:使用

的语法如下所示 -

示例:这里,我们提供一个在 Python 中使用 pandas 的示例。示例如下 -

本文简要讨论了在 Python 中解析 tsv 的方法,并提供了一些合适的示例。