您应该记住的 6 个 Pandas 显示选项2025 年 1 月 7 日 | 阅读 14 分钟 Pandas 是一个强大的 Python 模块,经常用于数据科学。在学习数据科学时,它通常是您遇到的第一个库之一,因为它允许您导入和处理来自各种来源的数据集。 大多数用户会发现,在使用 Pandas 时,默认选项是合适的。另一方面,有时您可能希望更改显示内容的格式。Pandas 提供了广泛的用户可配置设置,让您可以个性化显示项目的方式。 以下几节展示了更改这些默认参数的一些用例。以下是所有可用选项的完整列表。 本文将讨论以下主题
1. 控制 Pandas DataFrame 显示的行数有时您可能希望在 DataFrame 中看到比默认显示的 10 行更多的行。这包括 DataFrame 的前五行和后五行。 这可以防止 Pandas 在调用 DataFrame 时显示过多的数据,这可能会减慢您的计算机速度。 下面的代码可用于为本示例创建样本数据 输出 A B C D E 0 70.806623 98.504342 6.592742 45.743665 36.499483 1 1.329283 80.114035 13.493388 36.894693 31.089477 2 13.915921 88.317668 99.230799 2.796114 56.116030 3 39.586387 63.269042 72.932000 67.621841 74.626459 4 53.909081 29.741650 9.789031 67.881445 91.828485 可以使用以下两种方法之一调整显示的行数。 第一个是 display.max_rows,它设置 DataFrame 在被截断之前将显示的最多行数。如果 DataFrame 的行数超过此数量,则显示将变短。默认设置为 60。 如果您希望在调用 DataFrame 时看到所有行,则必须调整显示。选择 max_rows 选项,然后单击 None。请注意,如果您有一个非常大的 DataFrame,这可能会导致您的计算机出现延迟。 如果 DataFrame 的行数超过 max_rows 指定的数量,则必须将 min_rows 参数设置为您希望显示的行数。此外,您必须确认 max_rows 选项大于 min_rows。 现在,如果您将 min_rows 设置为 20,则在调用 DataFrame 进行查看时,您将看到来自 DataFrame 顶部和底部的 10 行。 2. 控制 DataFrame 中显示的列数在处理有很多列的数据集时,Pandas 会将 DataFrame 显示截断为只显示 20 列。查找三点(省略号),如下图所示,介于第 9 列和第 15 列之间,以确定您的 DataFrame 列是否已被截断。 您可以使用以下代码创建上述数据 您可以调整显示以查看更多列。因此,display.max_columns 参数 这样做时,将显示最多 30 列。但这可能也会导致其他问题,例如使类似本文的文章难以阅读,因为您希望包含图表。 3. 抑制科学计数法处理科学数据时,经常会遇到非常大的数字。当这些数字达到数百万时,Pandas 会将它们转换为科学计数法,这有时有用,有时则不然。 使用以下代码创建具有极大数据值的 DataFrame。 输出 0 1 2 0 5.846573e+06 2.821318e+06 2.754422e+06 1 3.543897e+06 1.119202e+06 5.772056e+06 2 6.093199e+06 2.213001e+06 1.471416e+06 3 5.955919e+06 2.782912e+06 4.220957e+05 4 8.235746e+06 1.018401e+06 7.322486e+06 5 2.542592e+06 2.809710e+06 9.920906e+06 6 6.367181e+06 6.162073e+06 8.503032e+06 7 1.969760e+06 3.656060e+06 6.043409e+06 8 8.450249e+06 3.904650e+06 9.861896e+06 9 9.528518e+06 8.635652e+05 8.123744e+06 4. 更改 DataFrame 中的浮点精度有时您正在处理的数据小数点后的值过多。有时,这会使视觉上显得混乱。Pandas 默认会显示小数点后六位。 通过调用 display.precision 选项并传入要显示的所需值数量,您可以减少显示的数据量,使其更易于阅读。 现在,当您检查原始 DataFrame 时,可以看到数字列的浮点精度已降低到 2。 请记住,此选项仅影响数据的显示方式。基础数据的实际值不受影响。 5. 控制浮点格式在某些情况下,您处理的数字可能是百分比或美元金额。在这种情况下,使用适当的单位格式化它们可能很有用。 您可以使用 display.float_format 选项为您列添加百分比指示符,并提供一个带有您希望显示的格式的 f-string 您可以这样修改代码,为浮点数添加美元符号 6. 更改默认 Pandas 绘图库在进行探索性数据分析时,快速可视化数据是一个常见要求。虽然您可以使用 matplotlib 创建图表,但您也可以使用 pandas 的 .plot() 函数和几行代码来实现相同的功能。 Pandas 为我们提供了多种绘图库可供使用
为了修改当前实例的默认绘图库,您必须使用 pandas plotting.backend 选项。 ![]() 7. 重置 Pandas 显示选项如果您想将特定选项的参数恢复为其默认值,可以使用 reset_option 方法并传入您希望重置的选项。 作为替代,如果您更改了一个以上的选项,可以使用 all 作为参数将所有选项重置为默认设置。 一次更改多个选项利用字典的强大功能,您可以遍历每个选项并进行设置,而不是逐个处理。 通过这样做,您可以编写更少的代码,节省时间,并使代码更易于阅读。 下一个主题6 本面向数据科学家的软件工程书籍 |
我们请求您订阅我们的新闻通讯以获取最新更新。