Pandas DataFrame.pivot_table()

2024 年 8 月 29 日 | 阅读 2 分钟

Pandas 的 pivot_table() 用于计算、聚合和总结您的数据。它被定义为一个强大的工具,可以聚合数据并进行计算,例如求和、计数、平均值、最大值最小值

它还允许用户在创建数据透视表后对数据进行排序和过滤。

参数

  • data: 一个 DataFrame。
  • values: 这是一个可选参数,指的是要聚合的列。
  • index: 它指的是列、Grouper 和数组。

如果我们传递一个数组,它必须与数据的长度相同。

  • columns: 指的是列、Grouper 和数组

如果我们传递一个数组,它必须与数据的长度相同。

  • aggfunc: 函数,函数列表,字典,默认值 numpy.mean
    如果我们传递函数列表,生成的透视表将具有分层列,其顶层是函数名称。
    如果我们传递一个字典,键指的是要聚合的列,值是函数或函数列表。
  • fill_value[标量,默认值 None]: 它用一个值替换缺失值。
  • margins[布尔值,默认值 False]: 它添加所有行/列(例如,用于小计/总计)
  • dropna[布尔值,默认值 True] : 它删除所有条目均为 NaN 的列。
  • margins_name[字符串,默认值 'All'] : 它指的是将包含总计的行/列的名称(当 margins 为 True 时)。

返回值

它返回一个 DataFrame 作为输出。

示例

输出

    P          Q         R
   John       C         24
   Parker     Java      25
   Smith      Python    19
   William    C         22

下一个主题DataFrame.query()