使用Python将XLSX转换为CSV

2025年1月5日 | 阅读 4 分钟

在本文中,我们将管理 Excel (.xlsx) 文档到 .csv 的转换。Excel 中主要使用两种格式:

  • (*.xlsx):Excel Microsoft Office Open XML 格式电子表格文档。
  • (*.xls):Excel 电子表格(Excel 97-2003 文件)。

让我们考虑一个购物商店的数据集,其中包含有关客户连续号码、客户姓名、客户 ID 和存储在 Excel 文件中的商品成本的信息。

代码

程序说明

在给定的 Python 代码中,pandas 库被导入为 'pd',并且名为 "Test.xlsx" 的 Excel 文件被使用 pd.read_excel() 函数读取。该代码基本上将 Excel 文件中的数据加载到一个结构化的 DataFrame 对象中,从而可以使用 pandas 的功能更轻松地进行分析和处理。最后一行 'df' 用于在结果中显示 DataFrame 中的项目。

输出

Convert XLSX to CSV using Python

现在,让我们看看将 Excel 文件转换为 CSV 文件的不同方法。

方法 1:使用 Pandas 库将 Excel 文件转换为 CSV 文件

Pandas 是一个开源编程库,用于 Python 编程语言的数据处理和分析。它提供了数据结构和操作方面的各种功能,用于处理表格数据和时间序列。它可以读取、过滤和重新组织大小数据集,并以多种格式输出,包括 Excel、JSON 和 CSV。

要读取 Excel 文件,请使用 read_excel() 方法,并将数据框架转换为 CSV 文件,请使用 pandas 的 to_csv() 方法。

代码

程序说明

在此 Python 代码中,导入了 pandas 库,并使用 pd.read_excel() 读取了一个名为 "Test.xlsx" 的 Excel 文件。然后使用 to_csv() 函数将数据写入名为 "Test.csv" 的 CSV 文件。随后,使用 pd.read_csv() 将 CSV 文件读回 pandas DataFrame,并将生成的 DataFrame 存储在变量 'df' 中。该代码有效地将数据从 Excel 文件转换为 CSV 文件,然后将其读入 DataFrame 以进行进一步分析。最后一行 'df' 用于在输出中显示 DataFrame 的内容。

输出

Convert XLSX to CSV using Python
Convert XLSX to CSV using Python

方法 2:使用 XLRD 和 CSV 库将 Excel 文件转换为 CSV 文件

xlrd 是一个主要用于读取 Excel 文件的库。

csv 是一个主要用于读取和写入 CSV 文件的库。

代码

程序说明

在此 Python 程序中,使用 xlrd 库打开一个 Excel 工作簿 ("Test.xlsx"),并通过索引访问其第一个工作表。然后使用 csv 模块将工作表中每一行的数据写入一个 CSV 文件 ("T.csv")。之后,将数据从 CSV 文件读入 pandas DataFrame ('df')。该代码基本上将 Excel 文件中的数据转换为 CSV 文件,然后将其读入 pandas DataFrame 进行分析。

输出

Convert XLSX to CSV using Python
Convert XLSX to CSV using Python

方法 3:使用 Openpyxl 和 CSV 库将 Excel 文件转换为 CSV 文件

openpyxl 是一个用于读取/写入 Excel 2010 xlsx/xlsm/xltx/xltm 文件的库。它是为了填补 Python 原生读取/写入 Office Open XML 格式的库的空白而诞生的。

代码

程序说明

在此 Python 代码中,使用 openpyxl 库加载了一个 Excel 工作簿 ("Test.xlsx")。选择工作簿的活动工作表,然后使用 csv 模块将其数据写入一个 CSV 文件 ("tt.csv")。最后,将 CSV 文件中的数据读入 pandas DataFrame ('df'),并在输出中显示 DataFrame。该代码基本上将 Excel 文件中的数据转换为 CSV 文件,然后将其读入 pandas DataFrame 进行分析。

输出

Convert XLSX to CSV using Python
Convert XLSX to CSV using Python