Python Pandas DataFrame2025年03月17日 | 阅读 9 分钟 Pandas DataFrame 是一个广泛使用的数据结构,它处理带有已标记轴(行和列)的二维数组。DataFrame 被定义为一种存储具有两个不同索引(即行索引和列索引)的数据的标准方式。它包含以下属性:
参数 & 描述data: 它包含多种形式,如 ndarray、series、map、constants、lists、array。 index: 如果未传递索引,则默认使用 np.arrange(n) 索引作为行标签。 columns: 如果未传递索引,则列标签的默认语法为 np.arrange(n)。它仅显示 true。 dtype: 它指的是每列的数据类型。 copy(): 用于复制数据。 ![]() 创建 DataFrame我们可以通过以下方式创建 DataFrame:
创建一个空的 DataFrame 下面的代码展示了如何在 Pandas 中创建一个空的 DataFrame: 输出 Empty DataFrame Columns: [] Index: [] 解释:在上面的代码中,首先,我们使用别名pd导入了 pandas 库,然后定义了一个名为df的变量,该变量包含一个空的 DataFrame。最后,我们通过将df传递到print函数来打印它。 使用列表创建 DataFrame我们可以轻松地在 Pandas 中使用列表创建 DataFrame。 输出 0 0 Python 1 Pandas 解释:在上面的代码中,我们定义了一个名为“x”的变量,它包含字符串值。DataFrame 构造函数被调用以列表形式打印这些值。 从 ndarrays/ Lists 的字典创建 DataFrame输出 ID Department 0 101 B.Sc 1 102 B.Tech 2 103 M.Tech 解释:在上面的代码中,我们定义了一个名为“info”的字典,它包含ID和Department的列表。要打印值,我们需要通过一个名为df的变量调用 info 字典,并将其作为参数传递给print()。 从 Series 的字典创建 DataFrame输出 one two a 1.0 1 b 2.0 2 c 3.0 3 d 4.0 4 e 5.0 5 f 6.0 6 g NaN 7 h NaN 8 解释:在上面的代码中,一个名为“info”的字典包含两个Series及其各自的索引。要打印值,我们需要通过一个名为d1的变量调用info字典,并将其作为参数传递给print()。 列选择我们可以从 DataFrame 中选择任何列。下面的代码演示了如何从 DataFrame 中选择一列: 输出 a 1.0 b 2.0 c 3.0 d 4.0 e 5.0 f 6.0 g NaN h NaN Name: one, dtype: float64 解释:在上面的代码中,一个名为“info”的字典包含两个Series及其各自的索引。稍后,我们通过一个名为d1的变量调用了info字典,并通过将“one” Series 传递给print()来从 DataFrame 中选择它。 列添加我们也可以向现有 DataFrame 添加新列。下面的代码演示了如何向现有 DataFrame 添加新列: 输出 Add new column by passing series one two three a 1.0 1 20.0 b 2.0 2 40.0 c 3.0 3 60.0 d 4.0 4 NaN e 5.0 5 NaN f NaN 6 NaN Add new column using existing DataFrame columns one two three four a 1.0 1 20.0 21.0 b 2.0 2 40.0 42.0 c 3.0 3 60.0 63.0 d 4.0 4 NaN NaN e 5.0 5 NaN NaN f NaN 6 NaN NaN 解释:在上面的代码中,一个名为f的字典包含两个Series及其各自的索引。稍后,我们通过一个名为df的变量调用了info字典。 要向现有的 DataFrame 对象添加新列,我们传递了一个包含与其索引相关的某些值的新 Series,并通过print()打印了其结果。 我们可以使用现有的 DataFrame 添加新列。“four”列已被添加,它存储了两个列(即one和three)相加的结果。 列删除我们也可以从现有 DataFrame 中删除任何列。此代码有助于演示如何从现有 DataFrame 中删除列: 输出 The DataFrame: one two a 1.0 1 b 2.0 2 c NaN 3 Delete the first column: two a 1 b 2 c 3 Delete the another column: Empty DataFrame Columns: [] Index: [a, b, c] 说明 在上面的代码中,df变量负责调用info字典并打印字典的全部值。我们可以使用delete或pop函数从 DataFrame 中删除列。 在第一种情况下,我们使用delete函数从 DataFrame 中删除了“one”列;而在第二种情况下,我们使用pop函数从 DataFrame 中删除了“two”列。 行选择、添加和删除行选择我们可以随时轻松地选择、添加或删除任何行。首先,我们将理解行选择。让我们看看如何通过以下几种方式选择一行: 按标签选择 我们可以通过将行标签传递给loc函数来选择任何行。 输出 one 2.0 two 2.0 Name: b, dtype: float64 解释:在上面的代码中,一个名为info的字典包含两个Series及其各自的索引。 为了选择一行,我们将行标签传递给了loc函数。 按整数位置选择 也可以通过将整数位置传递给iloc函数来选择行。 输出 one 4.0 two 4.0 Name: d, dtype: float64 解释:解释:在上面的代码中,我们定义了一个名为info的字典,它包含两个Series及其各自的索引。 为了选择一行,我们将整数位置传递给了iloc函数。 切片行 这是使用':'运算符选择多行的另一种方法。 输出 one two c 3.0 3 d 4.0 4 e 5.0 5 解释:在上面的代码中,我们定义了从 2:5 的范围用于行选择,然后将其值打印到控制台。 添加行 我们可以使用append函数轻松地向 DataFrame 添加新行。它会在末尾添加新行。 输出 x y 0 7 8 1 9 10 0 11 12 1 13 14 解释:在上面的代码中,我们定义了两个单独的列表,其中包含一些行和列。这些列已通过append函数添加,然后将结果显示在控制台上。 删除行 我们可以使用index标签从 DataFrame 中删除或丢弃任何行。如果标签重复,则会删除多行。 输出 x y 1 6 7 1 10 11 解释:在上面的代码中,我们定义了两个单独的列表,其中包含一些行和列。 在这里,我们定义了需要从列表中删除的行的索引标签。 DataFrame 函数DataFrame 中有很多函数,它们如下: |
我们请求您订阅我们的新闻通讯以获取最新更新。