Pandas DataFrame.dropna()

2024 年 8 月 29 日 | 阅读 2 分钟

如果您的数据集包含空值,我们可以使用 dropna() 函数来分析和删除数据集中的行/列。

语法

参数

  • axis : {0 或 'index', 1 或 'columns'}, 默认值为 0
    它接受用于行/列的 intstring 值。 输入可以是整数的 0 和 1,字符串的 indexcolumns
    • 0, 或 'index': 删除包含缺失值的行。
    • 1, 或 'columns': 删除包含缺失值的列。
  • how
    确定当至少有一个 NA 或所有 NA 时,是否从 DataFrame 中删除行或列。
    它只接受两种字符串值 ('any' 或 'all')。
    • any: 如果任何值为空,则删除行/列。
    • all: 仅当所有值都为空时才删除。
  • thresh
    它采用整数值,该值定义了要删除的 NA 值的最小数量。
  • subset
    它是一个数组,通过列表将删除过程限制为传递的行/列。
  • inplace
    它返回一个布尔值,如果为 True,则会在数据框本身中进行更改。

返回值

它返回从中删除 NA 条目的 DataFrame。

为了演示,首先,我们采用一个 csv 文件,该文件将从数据集中删除任何列。

输出

Name Hire Date Salary Leaves Remaining
0 John Idle 03/15/14 50000.0 10
1 Smith Gilliam 06/01/15 65000.0 8
2 Parker Chapman 05/12/14 45000.0 10
3 Jones Palin 11/01/13 70000.0 3
4 Terry Gilliam 08/12/14 48000.0 7
5 Michael Palin 05/23/13 66000.0 8

代码

输出

['	Name	Hire Date	Salary	Leaves Remaining'] 
 ['	Name	Hire Date	Salary	Leaves Remaining'
 'Null Column']

Column number before dropping Null column
 1 2

Column number after dropping Null column
 1 1

上面的代码从数据集中删除了空列并返回了一个新的 DataFrame。


下一个主题DataFrame.fillna()