如何在 Pandas 中检查 NaN 值2024 年 8 月 29 日 | 5 分钟阅读 在 Pandas 的原始文档中,空值被描述为缺失值。正如大多数程序员所做的那样,我们可以将 Pandas 中的空值或缺失数据指定为 NaN。 NaN,意思是“非数字”(Not A Number),是表示数据集中值缺失的常用方法之一。它是一种特殊的浮点数对象,只能转换为浮点数数据类型。 NaN 值是数据处理中的主要问题之一。如果你想实现你的目标,处理 NaN 是至关重要的。 程序员可以使用 NaN 或 None Python 关键字来显示 DataFrame 中的空条目。Pandas 将 NaN 和 None 同等处理是其最吸引人的特性。如果单元格包含 NaN 或 None,pandas.notnull 将返回 False 来确定组件是否缺失。我们也可以使用 .isnull(),它与 .notnull 函数相反;因此,如果值是空值或 NaN,它将返回 True。 因此,在本教程中,我们将研究几种技术,以确定特定单元格、系列或整个 DataFrame 是否包含空值(NaN 或 None)。 我们将讨论的几种方法包括:
使用 .isnull 函数我们可以使用此函数检查哪些单元格包含空值。下面是一个示例。 代码 输出 numbers 0 False 1 False 2 False 3 False 4 False 5 False 6 True 7 False 8 False 9 True 10 False 11 False 12 False 13 True 此外,使用 isnull.values.any(),我们可以检查数据帧的系列是否包含任何空值。它将为我们提供布尔结果。 代码 输出 True 使用相同的 isnull() 函数,我们还可以获得数据帧系列中存在的空值的总数。 代码 输出 The sum of NaN entries present in a series: 3 您可以使用以下代码计算整个 DataFrame 中的 NaN 值。 代码 输出 The sum of Nan values in the data frame: 8 使用 isnan() 方法在上一个示例中,我们使用 pandas.isnull 函数验证了 NaN 条目。我们现在将采用一种称为 isnan 的不同技术。此函数是 numpy 库的内置函数。下面的代码展示了如何检查特定单元格中的 NaN 值。 代码 输出 The particular value of the data frame is nan: True 在前面的示例中,我们查找了 DataFrame 单元格中的 NaN 对象。此外,我们可以确定 Pandas 系列中的单元格值是否为 NaN。让我们看看如何将其付诸实践。 代码 输出 The value at series[3] is NaN: False 使用 Pandas 的 .isna 函数我们将展示如何使用 Pandas 的 .isna 函数。 代码 输出 checking for NaN value in the series numbers2 at the 6th index True 使用 .notnull 方法notnull 函数是确定单元格是否为 NaN 或 DataFrame 是否包含空值的另一种方法。根据下面的程序,如果给定的单元格值是 NaN 或空值,此函数将返回布尔结果 False。 代码 输出 The cell does not has a null value: False The series does has not null value: True Number of no null value in the series of the dataframe: numbers1 12 numbers2 10 dtype: int64 |
在本教程中,我们将学习如何使用 Numpy 库创建向量。我们还将探索向量的基本操作,例如执行两个向量的加法、两个向量的减法、两个向量的除法、两个向量的乘法、向量点积和...
5 分钟阅读
本教程将向您展示如何使用 Python 的 tkinter 制作一个简单的注册表单。在开始之前,我们需要对 tkinter 有一些了解。因此,我们将首先检查此 tkinter 模块,然后再制作一个基本注册表单。介绍 Tkinter:虽然还有其他...
阅读 6 分钟
? 先决条件:Python 中的跳转语句 - break、continue 语句 Pass 语句是 Python 中四种跳转语句之一。为了解释此语句的功能,想象一下这样一个场景:你时间有限,正在尝试理解和分析如何编写一个庞大的……
5 分钟阅读
Python 获得了极大的普及,并已成为行业中需求量很大的编程语言。开发人员对这种编程语言情有独钟的原因有很多,例如通用性、丰富的库、友好的语法、易学性等等。另一个有趣的原因...
5 分钟阅读
障碍对象允许一组线程在继续执行之前相互等待。它对于需要按特定顺序执行的任务,或需要同步以避免竞争条件的任务非常有用。它们用于...
阅读 3 分钟
在当今的机器学习和数据科学领域,接触到各种独特的 Python 工具出奇地容易。这些包包括 scikit-learn、NumPy 或 Pandas,它们在内存使用或处理时间方面无法很好地随着数据量扩展。这是可以预期的...
阅读9分钟
?字典是 Python 中键值对的集合。字典的键可用于访问其值。但是,有时您希望提取键值对并将其分配给变量。这就是字典解包的作用。要解包一个...
阅读 2 分钟
Python seek() 方法用于更改文件句柄的当前位置。文件句柄就像一个光标,用于定义文件中要读取或写入数据的位置。语法:fi.seek(offset, from_where),其中 fi 是...
阅读 2 分钟
在本教程中,我们将学习如何在 Python 中获取亲和数。首先,我们将了解亲和数是什么以及如何使用它们。亲和数是两个不同的数字,它们之间存在如此的关系,即每个数字的真因子之和都等于...
阅读 3 分钟
您想在重命名文件夹中的多个文件时使用特定的命名模式。手动过程可能耗时且容易出错。您正在考虑使用 Python 创建自定义批量文件重命名解决方案以自动化文件重命名过程。本教程适合您...
18 分钟阅读
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India