Pandas:获取和设置显示、数据行为的选项2024年8月29日 | 阅读 7 分钟 Pandas 库是一个开源(允许使用)的库,它建立在另一个非常有用的 Python 库 NumPy 之上。Pandas 是一个开源的软件包(或库),为我们提供了高度优化的数据结构和数据分析工具。Pandas 库在数据科学、机器学习和数据分析领域得到了广泛应用,因为它简化了数据导入和数据分析的过程。 Pandas Python 包为我们提供了各种各样的数据结构和操作,有助于轻松处理(添加、更新、删除)数值数据以及时间序列数据。Pandas 包之所以流行的主要原因是它易于导入和易于进行数据分析的功能。Pandas 模块速度非常快,而且由于其高性能和效率,非常实用。现在,一个问题浮现在脑海:Pandas 中有哪些选项和设置?好吧,Pandas 中的选项和设置用于控制 DataFrame 中的数据。让我们通过一个场景来更详细地理解 Pandas 中选项和设置的必要性。 在某些情况下,加载到 DataFrame 中的数据可能有很多截断值,或者某些列被替换为省略号,或者存在一些难以读取的浮点精度。因此,为了应对这些情况,我们有了 Options API 接口。 Pandas 中的 Options API 是什么?如前所述,为了处理不连贯的数据并自定义诸如行为、数据、分析等各个方面,我们使用 Pandas 模块提供的 Options API 接口。更简单地说,我们可以说 Options API 接口帮助我们修改和配置 DataFrame 的全局行为,如数据、行为等。通过使用 Options API 接口,我们可以直接将 get 和 set 选项作为高级选项属性的属性来使用。 Options API 接口为我们提供了 5 个函数来处理数据:`get_option()`、`set_option()`、`reset_option()`、`describe_option()` 和 `option_context()`。我们将在下一节中详细介绍它们。这些函数以及 Options API 接口的其他功能有助于我们控制 DataFrame 中数据的显示方式。 Pandas 中选项和设置的方法到目前为止,我们已经讨论了 Pandas 中选项和设置的使用场景及其必要性。现在,让我们通过一些示例来详细了解各种相关函数,以便更清楚。
`get_option()` 函数用于获取单个选项的值。因此,在我们需要确定 DataFrame 的最大列数的情况下,我们可以使用 `get_option()` 函数。此函数为我们提供了 Pandas 中任何参数的默认值。我们可以查看该值,但不能设置或更改该值(对于设置,我们有另一个函数,我们将在稍后讨论)。`get_option()` 函数接受一个参数。 例如,让我们使用 `display.max_rows` 和 `display.max_columns` 参数来获取 Pandas 模块提供的默认最大行数或列数。 示例 输出 The Maximum number of rows present are = 60 The Maximum number of columns present are = 0
`set_option()` 函数用于设置单个选项的值。此函数帮助我们将任何参数的默认值设置为任何期望值。`get_option()` 函数接受两个参数,第一个是参数的名称,第二个是参数的值。
现在,要更改 DataFrame 的最大行数或列数,我们可以使用 `set_option()` 函数。 例如,让我们使用 `display.max_rows` 和 `display.max_columns` 参数来更改 Pandas 模块提供的默认最大行数或列数。 示例 输出 By default, the Maximum number of rows present are = 60 By default, the Maximum number of rows present are = 0 The new Maximum number of rows present are = 20 The new Maximum number of columns present are = 20
`reset_option()` 函数用于重置单个选项的值。因此,在我们需要重置 DataFrame 的最大行数的情况下,我们可以使用 `reset_option()` 函数。`reset_option()` 函数接受一个参数,即必须将其重置为默认值的参数。 例如,让我们首先使用 `display.max_rows` 和 `display.max_columns` 参数来更改 Pandas 模块提供的默认最大行数和列数。之后,我们将使用 `reset_option()` 函数将值恢复到原始状态。 示例 输出 By default, the Maximum number of rows present are = 60 By default, the Maximum number of rows present are = 0 After resetting the values of the parameters The default Maximum number of rows present are = 60 The default Maximum number of columns present are =0
`describe_option()` 函数用于打印任何参数的完整描述。例如,让我们打印 `display.max_columns` 参数的描述。 示例 输出 display.max_columns : int
If max_cols is exceeded, switch to truncate view. Depending on
`large_repr`, objects are either centrally truncated or printed as
a summary view. 'None' value means unlimited.
In case Python/IPython is running in a terminal and `large_repr`
equals 'truncate' this can be set to 0 and pandas will auto-detect
the width of the terminal and print a truncated object which fits
the screen width. The IPython notebook, IPython qtconsole, or IDLE
do not run in a terminal and hence it is not possible to do
correct auto-detection.
[default: 0] [currently: 0]
None
`option_context()` 参数用于在断言期间将可选参数设置为临时值。当离开代码块时,选项的值会自动恢复。简而言之,我们可以说此函数用于调用一个 Pandas 选项,该选项仅在代码块的适应期内有效。 例如,让我们更改 `maximum_row` 参数。 示例 输出 The maximum number of rows present are = 20 The maximum number of rows present are = 20 错误和异常我们可以将上述函数与 regexp 模式一起用作参数,以匹配模糊的子字符串。如果我们只提供一个匹配多个参数的小型 regex,我们会收到错误 `OptionError`:“Example matched multiple keys”。 例如,如果我们只提供 `max` 作为参数,Python 解释器和 Pandas 模块将无法确定要使用的参数。我们的 `display.max_colwidth`、`display.max_rows` 和 `display.max_columns` 的名称中都包含 `max`,因此仅提供 `max` 将是一个问题。让我们看看错误以获得更清晰的理解。 示例 输出:错误 Traceback (most recent call last): File "d:\Personal\Study Material\Scaler Topics Articles\test.py", line 4, in |
在本文中,我们将讨论 Python 中 os 路径 curdir 是什么,如何更改工作目录,以及如何使用 Python 检索当前目录。OS Python 模块提供了一种与操作系统通信的可移植方式。用于定位的工具...
阅读 3 分钟
Rich 库是一个强大的 Python 库,为终端应用程序提供了广泛的文本格式化和样式选项。使用 Rich,您可以为文本输出添加颜色和样式,创建表格和进度条,甚至在终端中显示图像和动画...
阅读9分钟
本教程将教我们如何将元组连接成嵌套元组。有时,我们需要将单个记录转换为嵌套集合,但它们仍作为单独的元素存在。换句话说,我们将添加元组并展平结果容器;它通常是...
阅读 3 分钟
在本教程中,我们将通过跳过 GIL 来学习 Python 中的并行处理。GIL 是 Python 中的一个重要概念,它阻止多个线程在同一进程中并行执行 Python 字节码。这意味着即使在多核处理器上,Python 线程...
14 分钟阅读
在这个问题中,我们将得到两个链表。这两个链表将在它们各自的一个节点上合并,形成一个 Y 形列表。我们必须找到链表合并的节点。让我们看一些例子来理解...
阅读 16 分钟
scipy.stats.lomax 描述了洛马克斯连续随机变量。它是从通用方法继承的 rv_continuous 类的一个实例。它通过添加特定于此分布的细节来完善技术。给出洛马克斯分布的概率密度函数为:概率密度函数...
阅读 4 分钟
简介:Scrapy 是一个用 Python 编写的开源网络爬行和网络抓取框架。它允许开发人员构建和扩展网络爬虫,这些爬虫可以爬取网站、提取数据并将其存储为结构化格式,如 JSON、CSV 或 XML。Scrapy 提供了一个用于爬行的高级 API...
阅读 16 分钟
乒乓球游戏是街机游戏中最著名的游戏之一,与乒乓球非常相似。这个游戏的规则很简单:有两个玩家。双方都控制着自己一方的球拍。他们可以在垂直方向上移动球拍,从...
阅读 6 分钟
回文数一直以来都对数学家和爱好者们有着特殊的魅力。这些数字正读和反读都一样,它们具有内在的对称性和美学上的愉悦感。在本文中,我们将探讨回文数的概念以及如何...
阅读 4 分钟
我们每天都会遇到一系列任务。其中一些可能很有趣,有些可能很繁琐。然而,完成这些任务的重要性是毋庸置疑的,特别是当它们是常规任务时。有时可能有很多...
阅读27分钟
我们请求您订阅我们的新闻通讯以获取最新更新。

我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India