使用Python将XLSX转换为CSV2025年1月5日 | 阅读 4 分钟 在本文中,我们将管理 Excel (.xlsx) 文档到 .csv 的转换。Excel 中主要使用两种格式:
让我们考虑一个购物商店的数据集,其中包含有关客户连续号码、客户姓名、客户 ID 和存储在 Excel 文件中的商品成本的信息。 代码 程序说明 在给定的 Python 代码中,pandas 库被导入为 'pd',并且名为 "Test.xlsx" 的 Excel 文件被使用 pd.read_excel() 函数读取。该代码基本上将 Excel 文件中的数据加载到一个结构化的 DataFrame 对象中,从而可以使用 pandas 的功能更轻松地进行分析和处理。最后一行 'df' 用于在结果中显示 DataFrame 中的项目。 输出 ![]() 现在,让我们看看将 Excel 文件转换为 CSV 文件的不同方法。 方法 1:使用 Pandas 库将 Excel 文件转换为 CSV 文件Pandas 是一个开源编程库,用于 Python 编程语言的数据处理和分析。它提供了数据结构和操作方面的各种功能,用于处理表格数据和时间序列。它可以读取、过滤和重新组织大小数据集,并以多种格式输出,包括 Excel、JSON 和 CSV。 要读取 Excel 文件,请使用 read_excel() 方法,并将数据框架转换为 CSV 文件,请使用 pandas 的 to_csv() 方法。 代码 程序说明 在此 Python 代码中,导入了 pandas 库,并使用 pd.read_excel() 读取了一个名为 "Test.xlsx" 的 Excel 文件。然后使用 to_csv() 函数将数据写入名为 "Test.csv" 的 CSV 文件。随后,使用 pd.read_csv() 将 CSV 文件读回 pandas DataFrame,并将生成的 DataFrame 存储在变量 'df' 中。该代码有效地将数据从 Excel 文件转换为 CSV 文件,然后将其读入 DataFrame 以进行进一步分析。最后一行 'df' 用于在输出中显示 DataFrame 的内容。 输出 ![]() ![]() 方法 2:使用 XLRD 和 CSV 库将 Excel 文件转换为 CSV 文件xlrd 是一个主要用于读取 Excel 文件的库。 csv 是一个主要用于读取和写入 CSV 文件的库。 代码 程序说明 在此 Python 程序中,使用 xlrd 库打开一个 Excel 工作簿 ("Test.xlsx"),并通过索引访问其第一个工作表。然后使用 csv 模块将工作表中每一行的数据写入一个 CSV 文件 ("T.csv")。之后,将数据从 CSV 文件读入 pandas DataFrame ('df')。该代码基本上将 Excel 文件中的数据转换为 CSV 文件,然后将其读入 pandas DataFrame 进行分析。 输出 ![]() ![]() 方法 3:使用 Openpyxl 和 CSV 库将 Excel 文件转换为 CSV 文件openpyxl 是一个用于读取/写入 Excel 2010 xlsx/xlsm/xltx/xltm 文件的库。它是为了填补 Python 原生读取/写入 Office Open XML 格式的库的空白而诞生的。 代码 程序说明 在此 Python 代码中,使用 openpyxl 库加载了一个 Excel 工作簿 ("Test.xlsx")。选择工作簿的活动工作表,然后使用 csv 模块将其数据写入一个 CSV 文件 ("tt.csv")。最后,将 CSV 文件中的数据读入 pandas DataFrame ('df'),并在输出中显示 DataFrame。该代码基本上将 Excel 文件中的数据转换为 CSV 文件,然后将其读入 pandas DataFrame 进行分析。 输出 ![]() ![]() 下一个主题使用 Python 进行数据分析和可视化 |
简介 Python json 模块中的 json.load() 和 json.loads() 函数都用于将 JSON 数据解析为 Python 对象。它们之间的区别在于输入源。json.load() 在处理包含在文件中的 JSON 数据时非常有用,因为它能够读取……
阅读 6 分钟
模式问题在编程中非常普遍。这些问题有助于熟悉程序的流程,还有助于理解如何编写程序以获得期望的输出。模式是使用循环打印的。我们通常使用嵌套循环来打印...
阅读 22 分钟
简介 调试是软件行业的重要组成部分。作为一名 Python 开发人员,编写正确无误的代码意味着精通调试的艺术。这是一份详尽的指南,将向我们展示多种调试方法、Python 工具和技巧...
阅读 4 分钟
Python 中的 sys 包是一个内置模块,它提供了对系统唯一参数和函数的访问。它充当解释器和底层运行系统的接口,允许 Python 包与众多操作系统和设置进行交互。以下是简要评估……
阅读 4 分钟
? Excel 文件是由 Excel 或其他电子表格程序创建的电子表格。文件的类型是 Excel 二进制文件格式。Excel 文件的格式是 xlsx,存储在 Excel 文件中的数据是...
阅读 17 分钟
缺失数据在现实世界数据集中很常见,有效处理缺失数据对于数据分析和机器学习任务至关重要。在 Python 中,Pandas 库提供了强大的工具来处理缺失数据,允许您清理、操作和分析包含缺失数据的数据集...
阅读 3 分钟
5个比“Print”更好的Python调试工具 当涉及Python调试时,许多程序员依赖于打印语句来识别代码中的问题。虽然这种方法对于基本问题可能有用,但它在面对更复杂的问题时常常力不从心。幸运的是...
阅读 12 分钟
? Python简介 Python在处理海量信息和自动化重复性活动方面的适应性和速度使其成为会计师的宝贵工具。Python的模块,如Pandas和NumPy,使金融建模、数据分析和报告等工作变得更容易。它为会计师节省了手动任务的时间,例如……
阅读 13 分钟
您是否曾因CodeChef恶毒的编译器而绝望地大喊,然后将额头砸在键盘上,喃喃地说:“EOF错误?”朋友,快过来加入俱乐部吧!但是,亲爱的读者,不要害怕!本文是您的EOF杀手锏和备忘单……
5 分钟阅读
哈希表简介 有许多不同的数据类型可用于访问数据。其中之一就是哈希表。哈希表是编程中的一个基本信息结构,它允许基于键值对来存储和检索数据。在...
阅读 6 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India