Pandas DataFrame.describe()

2024 年 8 月 29 日 | 阅读 2 分钟

describe() 方法用于计算序列或 DataFrame 数值的某些统计数据,如百分位数均值std。 它分析数字和对象序列,以及混合数据类型的 DataFrame 列集。

语法

参数

  • percentile: 这是一个可选参数,它是一个类似于数字列表的数据类型,应介于 0 和 1 之间。 它的默认值为 [.25, .5, .75],它返回第 25 个、第 50 个和第 75 个百分位数。
  • include: 这也是一个可选参数,在描述 DataFrame 时包含数据类型列表。 它的默认值为 None。
  • exclude: 这也是一个可选参数,在描述 DataFrame 时排除数据类型列表。 它的默认值为 None。

返回值

它返回序列和 DataFrame 的统计摘要。

示例 1

输出

count     3.0
mean      2.0
std       1.0
min       1.0
25%       1.5
50%       2.0
75%       2.5
max       3.0
dtype: float64

示例 2

输出

count      4
unique     3
top        q
freq       2
dtype: object

Example3

输出

	categorical
count	3
unique	3
top     u
freq	1

Example4

输出

      categorical  numeric
count     3         3.0
unique    3         NaN
top       u         NaN
freq      1         NaN
mean      NaN       2.0
std       NaN       1.0
min       NaN       1.0
25%       NaN       1.5
50%       NaN       2.0
75%       NaN       2.5
max       NaN       3.0