均值、中位数与众数的区别

17 Mar 2025 | 5 分钟阅读

统计学中最重要的三个集中趋势度量是中位数、平均数和众数。当描述数据集时,我们总是指出其中心位置。中心趋势度量一词就是用来描述它的。我们每天都在处理统计数据。

Difference Between Mean Median and Mode

我们的银行对账单、手机和水电费账单,以及媒体和报纸上的故事都包含它们。它们源源不断,无处不在。挑战在于通过仅考虑其表示的一个子集来识别关键数据特征。

这是通过利用平均数或中心趋势度量来实现的,例如平均数、中位数和众数。

描述平均数

Difference Between Mean Median and Mode

大多数人在中学数学中就已经学会了平均数。平均数是通过将一组所有值相加,然后除以总数来计算的。总体是一组用数学表示为 X1,..., Xn 的值。

中位数的值是有益的。它给出了组的特征。认识到平均数是总体的紧凑表示,而不是一个独立的项目,这是很重要的。实际上,任何事物的值都可能等于平均数。

平均数分为

  • 未分组频数分布的平均数
  • 原始数据的平均数
  • 基于离差的未分组频数分布的平均数

描述中位数

Difference Between Mean Median and Mode

通常,中位数更能代表群体中的典型成员。如果所有值都被考虑并按升序排列,中位数将是列表中间的值。群体中的每个人都会获得中位数。值分布表明,平均数可能不接近任何群体成员的特征。

平均数对偏度也很敏感;即使是一个脱离其余群体的值,也可能极大地改变平均数。中位数提供了中心群体的成员,而没有由异常值引起的偏斜效应。正态分布的中位数可以作为合适的总体样本。

描述众数

Difference Between Mean Median and Mode

类别中出现频率最高的事物就是众数。哪个值最常见并不重要,众数总是组中最大或最小的值。由于它们通常最不相关,因此这三个中位数度量中的大部分也最少被使用。

然而,有时它可能是有用的。如果你的数据准确且一致,那么中位数、平均数和众数将是相同的。

平均数、众数和中位数的有用性

Difference Between Mean Median and Mode

统计分布中的中心趋势度量包括平均数、中位数和众数。中位数是值分布在各种情况下的中间点,其上方和下方的案例数量相等。

当数据集中包含极端值时,不受极端值影响的中位数可能比平均数更有用。当需要数据集中最典型的项目特征或值时,众数就很有优势。

利用平均数、中位数和众数

  • 鉴于它们的优点和缺点是互补的,因此将这三个主要的中心趋势度量结合使用会很有益。然而,根据变量的测量方式,通常只有一个或两个适用于您的数据集。
  • 众数可以用于任何测量级别,但在名义和顺序级别上最有用。
  • 只有可以排序的数据,例如来自顺序、区间和比例测量级别的数据,才能用于计算中位数。
  • 由于平均数要正常工作需要相邻值之间的等距或尺度得分,因此只能使用区间和比例测量级别。

平均数、中位数和众数之间的经验关系

这种关系可以分为四种不同的情况。

  • 对于具有显著偏斜的分布,平均数与众数之间的差异通常是平均数与中位数之间差异的三倍。因此,在这种情况下,实际关系表示为:平均数 - 众数 = 3 * (平均数 - 中位数)。
  • 根据经验关系,当频数分布具有对称频数曲线时,平均数 = 中位数 = 众数。
  • 在具有正偏斜的频数分布曲线上,平均数大于中位数和众数。
  • 当频数分布呈负偏斜时,则使用平均数、中位数和众数。

平均数、中位数和众数之间的区别

平均数中位数众数
含义平均数是统计数据组中的平均数值中位数是数据集合中的中间数值众数是数据集中出现频率最高的数值
平均数类型这是一个由数学确定的平均数这是一个位置平均数众数是位置平均数
基础平均数受每一个统计数据的影响中位数是中间点众数是常见项
能力平均数可以进一步进行代数处理中位数需要更强的能力众数也不太有能力
观察平均数只能通过数学确定可以通过简单观察确定中位数此外,也可以通过简单观察确定
地点在图表中,无法找到平均数在图表中,可以找到中位数在图表中,也可以找到众数
受影响极端数值会影响这些极端数值对中间点影响不大极端值对众数也没有显著影响
定义在所有情况下,平均数都定义明确在所有情况下,中位数都定义明确在某些情况下,众数的定义可能更直接
用途在以下情况时不能使用
1. 分布存在显著偏斜
2. 分布中包含开放式类别。
3. 所需平均数是针对比率和比例的
当存在以下情况时
1. 数据无法直接测量
2. 分布中的每个组都是开放式的
很多时候,众数可能更直接
1. 在表达问题中的偏好时,使用众数

结论

由于上述平均数、中位数和众数之间的差异,我们通常希望确定数据集的中心趋势。根据具体情况,可以选择最能捕捉您确定数据部分的平均数、中位数和众数。


下一主题区别