Pandas DataFrame.dropna()2024 年 8 月 29 日 | 阅读 2 分钟 如果您的数据集包含空值,我们可以使用 dropna() 函数来分析和删除数据集中的行/列。 语法参数- axis : {0 或 'index', 1 或 'columns'}, 默认值为 0
它接受用于行/列的 int 或 string 值。 输入可以是整数的 0 和 1,字符串的 index 或 columns 。- 0, 或 'index': 删除包含缺失值的行。
- 1, 或 'columns': 删除包含缺失值的列。
- how
确定当至少有一个 NA 或所有 NA 时,是否从 DataFrame 中删除行或列。 它只接受两种字符串值 ('any' 或 'all')。- any: 如果任何值为空,则删除行/列。
- all: 仅当所有值都为空时才删除。
- thresh
它采用整数值,该值定义了要删除的 NA 值的最小数量。 - subset
它是一个数组,通过列表将删除过程限制为传递的行/列。 - inplace
它返回一个布尔值,如果为 True,则会在数据框本身中进行更改。
返回值它返回从中删除 NA 条目的 DataFrame。 为了演示,首先,我们采用一个 csv 文件,该文件将从数据集中删除任何列。 输出
Name |
Hire Date |
Salary |
Leaves Remaining |
0 John Idle 03/15/14 |
50000.0 |
10 |
1 Smith Gilliam |
06/01/15 |
65000.0 |
8 |
2 Parker Chapman |
05/12/14 |
45000.0 |
10 |
3 Jones Palin |
11/01/13 |
70000.0 |
3 |
4 Terry Gilliam |
08/12/14 |
48000.0 |
7 |
5 Michael Palin |
05/23/13 |
66000.0 |
8 |
代码输出 [' Name Hire Date Salary Leaves Remaining']
[' Name Hire Date Salary Leaves Remaining'
'Null Column']
Column number before dropping Null column
1 2
Column number after dropping Null column
1 1
上面的代码从数据集中删除了空列并返回了一个新的 DataFrame。
|