Python Pandas 读取文件

2024 年 8 月 29 日 | 阅读 3 分钟

从 CSV 文件读取

CSV 代表逗号分隔值,它被定义为一种简单的文件格式,使用特定的结构来排列表格数据。它将表格数据(例如电子表格或数据库)存储为纯文本,并且具有用于数据交换的通用格式。CSV 文件被打开到 excel 文件中,行和列数据定义了标准格式。

将 csv 文件读入 pandas DataFrame 快速而直接。我们不需要编写多行代码来打开、分析和读取 pandas 中的 csv 文件。相反,我们可以在一行中执行这些操作,它将数据存储在 DataFrame 中。

为了读取 Pandas 文件,首先我们必须从文件格式将数据加载到 DataFrame 中。您只需要一行代码即可在代码中加载您的数据。

df = pd.read_csv('a.csv')

编码

在上面,这三行代码足以读取文件,其中只有一行代码正在执行实际工作,即 pandas.read_csv()。

输出

        Name                   Hire Date      Salary            Leaves Remaining
0     John Idle                08/15/14       50000.0                    10
1     Smith Gilliam            04/07/15       65000.0                     8
2     Parker Chapman           02/21/14       45000.0                    10
3     Jones Palin              10/14/13       70000.0                     3
4     Terry Gilliam            07/22/14       48000.0                     7
5     Michael Palin            06/28/13       66000.0                     8

但是,pandas 也在 DataFrame 中使用基于零的整数索引;我们没有告诉它我们的索引应该是什么。

从 JSON 读取

如果您有任何 JSON 文件,Pandas 可以通过一行代码轻松读取它。

它允许索引通过嵌套工作。

Pandas 将列表的列表转换为 DataFrame,并单独定义列名。 JSON 解析器负责将 JSON 文本转换为另一种表示形式,该表示形式必须根据 JSON 语法接受所有文本。它也可以接受非 JSON 形式或扩展。

在读取之前,我们必须导入 JSON 文件。

输出

        Name                   Hire Date        Salary            Leaves Remaining
0     John Idle                08/15/14         50000.0                     10
1     Smith Gilliam            06/01/15         65000.0                     6
2     Parker Chapman           05/12/14         45000.0                     7
3     Jones Palin              11/01/13         70000.0                     3	
4     Terry Gilliam            08/12/14         48000.0                     9
5     Michael Palin            05/23/13         66000.0                     8

从 SQL 数据库读取

为了从 SQL 读取文件,首先,您需要使用 Python 库建立连接,然后将查询传递给 pandas。在这里,我们使用 SQLite 进行演示。

首先,我们必须安装 pysqlite3 并在终端中运行 此命令

sqlite3 用于建立与数据库的连接,然后我们可以使用它通过 SELECT 查询生成 DataFrame。

用于建立与 SQLite 数据库文件的连接

SQLite 数据库中存在一个名为 information 的表,列名为“index”的索引。我们可以通过传递 SELECT 查询和 coninformation 表中读取数据。

输出

Index         E_id         Designation              
0              46              M.Com
1              47              B.Com
2              48              B.Com

下一主题Pandas 连接