Pandas DataFrame.drop_duplicates()

2024年8月29日 | 1 分钟阅读

drop_duplicates() 函数执行常见的数据清理任务，处理 DataFrame 中的重复值。此方法有助于从 DataFrame 中删除重复值。

语法

参数

subset: 它接受一个列或列标签列表。它仅考虑某些列来识别重复项。默认值None。
keep: 它用于控制如何考虑重复值。它有三个不同的值，如下所示
- first: 它删除重复值，除了第一次出现。
- last: 它删除重复值，除了最后一次出现。
- False: 它删除所有重复项。
inplace: 返回布尔值。默认值为 False。

如果为真，它会删除具有重复值的行。

根据传递的参数，它返回删除了重复行的 DataFrame。

示例

import pandas as pd
emp = {"Name": ["Parker", "Smith", "William", "Parker"],
"Age": [21, 32, 29, 21]}
info = pd.DataFrame(emp)
print(info)

输出

        Name     Age
0     Parker     21
1     Smith      32
2     William    29
3     Parker     21

import pandas as pd
emp = {"Name": ["Parker", "Smith", "William", "Parker"],
"Age": [21, 32, 29, 21]}
info = pd.DataFrame(emp)
info = info.drop_duplicates()
print(info)

输出

       Name    Age
0    Parker    21
1    Smith     32
2    William   29

下一个主题DataFrame.groupby()

← 上一个下一个 →

Pandas DataFrame.drop_duplicates()

语法

参数

返回

示例

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

Pandas 教程

Pandas Series

Pandas DataFrame

Pandas 操作

数据操作

Pandas 速查表

Pandas 索引

Pandas NumPy

Pandas 时间序列

Pandas 绘图

杂项。

面试题

Pandas DataFrame.drop_duplicates()

语法

参数

返回

示例

相关帖子

DataFrame.join()

DataFrame.sample()

DataFrame.sum()

DataFrame.to_excel()

Pandas DataFrame

DataFrame.assign()

DataFrame.describe()

DataFrame.count()

DataFrame.shift()

DataFrame.transpose()

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器