您应该记住的 6 个 Pandas 显示选项

2025 年 1 月 7 日 | 阅读 14 分钟

Pandas 是一个强大的 Python 模块,经常用于数据科学。在学习数据科学时,它通常是您遇到的第一个库之一,因为它允许您导入和处理来自各种来源的数据集。

大多数用户会发现,在使用 Pandas 时,默认选项是合适的。另一方面,有时您可能希望更改显示内容的格式。Pandas 提供了广泛的用户可配置设置,让您可以个性化显示项目的方式。

以下几节展示了更改这些默认参数的一些用例。以下是所有可用选项的完整列表。

本文将讨论以下主题

  • 控制显示行数
  • 控制显示列数
  • 抑制科学计数法
  • 控制浮点精度
  • 控制小数格式
  • 更改绘图后端库
  • 重置显示选项

1. 控制 Pandas DataFrame 显示的行数

有时您可能希望在 DataFrame 中看到比默认显示的 10 行更多的行。这包括 DataFrame 的前五行和后五行。

这可以防止 Pandas 在调用 DataFrame 时显示过多的数据,这可能会减慢您的计算机速度。

下面的代码可用于为本示例创建样本数据

输出

 
           A          B          C          D          E
0  70.806623  98.504342   6.592742  45.743665  36.499483
1   1.329283  80.114035  13.493388  36.894693  31.089477
2  13.915921  88.317668  99.230799   2.796114  56.116030
3  39.586387  63.269042  72.932000  67.621841  74.626459
4  53.909081  29.741650   9.789031  67.881445  91.828485   

可以使用以下两种方法之一调整显示的行数。

第一个是 display.max_rows,它设置 DataFrame 在被截断之前将显示的最多行数。如果 DataFrame 的行数超过此数量,则显示将变短。默认设置为 60。

如果您希望在调用 DataFrame 时看到所有行,则必须调整显示。选择 max_rows 选项,然后单击 None。请注意,如果您有一个非常大的 DataFrame,这可能会导致您的计算机出现延迟。

如果 DataFrame 的行数超过 max_rows 指定的数量,则必须将 min_rows 参数设置为您希望显示的行数。此外,您必须确认 max_rows 选项大于 min_rows。

现在,如果您将 min_rows 设置为 20,则在调用 DataFrame 进行查看时,您将看到来自 DataFrame 顶部和底部的 10 行。

2. 控制 DataFrame 中显示的列数

在处理有很多列的数据集时,Pandas 会将 DataFrame 显示截断为只显示 20 列。查找三点(省略号),如下图所示,介于第 9 列和第 15 列之间,以确定您的 DataFrame 列是否已被截断。

您可以使用以下代码创建上述数据

您可以调整显示以查看更多列。因此,display.max_columns 参数

这样做时,将显示最多 30 列。但这可能也会导致其他问题,例如使类似本文的文章难以阅读,因为您希望包含图表。

3. 抑制科学计数法

处理科学数据时,经常会遇到非常大的数字。当这些数字达到数百万时,Pandas 会将它们转换为科学计数法,这有时有用,有时则不然。

使用以下代码创建具有极大数据值的 DataFrame。

输出

 
                      0	                                 1	                                2
0	5.846573e+06	2.821318e+06	2.754422e+06
1	3.543897e+06	1.119202e+06	5.772056e+06
2	6.093199e+06	2.213001e+06	1.471416e+06
3	5.955919e+06	2.782912e+06	4.220957e+05
4	8.235746e+06	1.018401e+06	7.322486e+06
5	2.542592e+06	2.809710e+06	9.920906e+06
6	6.367181e+06	6.162073e+06	8.503032e+06
7	1.969760e+06	3.656060e+06	6.043409e+06
8	8.450249e+06	3.904650e+06	9.861896e+06
9	9.528518e+06	8.635652e+05	8.123744e+06   

4. 更改 DataFrame 中的浮点精度

有时您正在处理的数据小数点后的值过多。有时,这会使视觉上显得混乱。Pandas 默认会显示小数点后六位。

通过调用 display.precision 选项并传入要显示的所需值数量,您可以减少显示的数据量,使其更易于阅读。

现在,当您检查原始 DataFrame 时,可以看到数字列的浮点精度已降低到 2。

请记住,此选项仅影响数据的显示方式。基础数据的实际值不受影响。

5. 控制浮点格式

在某些情况下,您处理的数字可能是百分比或美元金额。在这种情况下,使用适当的单位格式化它们可能很有用。

您可以使用 display.float_format 选项为您列添加百分比指示符,并提供一个带有您希望显示的格式的 f-string

 

您可以这样修改代码,为浮点数添加美元符号

 

6. 更改默认 Pandas 绘图库

在进行探索性数据分析时,快速可视化数据是一个常见要求。虽然您可以使用 matplotlib 创建图表,但您也可以使用 pandas 的 .plot() 函数和几行代码来实现相同的功能。

Pandas 为我们提供了多种绘图库可供使用

  • Matplotlib
  • hvplot >= 0.5.1
  • holoviews
  • pandas_bokeh
  • plotly >= 4.8
  • altair

为了修改当前实例的默认绘图库,您必须使用 pandas plotting.backend 选项。


6 Pandas Display Options You Should Memorise

7. 重置 Pandas 显示选项

如果您想将特定选项的参数恢复为其默认值,可以使用 reset_option 方法并传入您希望重置的选项。

作为替代,如果您更改了一个以上的选项,可以使用 all 作为参数将所有选项重置为默认设置。

一次更改多个选项

利用字典的强大功能,您可以遍历每个选项并进行设置,而不是逐个处理。

通过这样做,您可以编写更少的代码,节省时间,并使代码更易于阅读。