中位数定义17 Mar 2025 | 5 分钟阅读 中位数是集中趋势的一种统计度量,代表数据集中间的数值。它是将数据集中下 50% 的数据与上 50% 的数据分隔开的数值。换句话说,当数据按顺序排列时,中位数是数据集的中间值。例如,如果你有一个数据集 {1, 2, 3, 4, 5},中位数是 3,因为它在集合中是中间值。如果你有一个数据集 {1, 2, 3, 4},中位数是 2.5,因为它是在 2 和 3 之间的值。 ![]() 中位数是集中趋势的一个重要度量,因为它比均值对极端值或异常值不敏感。这是因为中位数仅基于数据集中值的位置,而不是它们的幅度。因此,当中位数出现在数据包含极端值或数据分布不对称的情况下时,通常会使用中位数。 计算中位数要计算中位数,首先需要将数据按从低到高或从高到低的顺序排列。如果数据集包含偶数个值,则中位数是两个中间值的平均值。如果数据集包含奇数个值,则中位数是中间值。 例如,如果你有一个数据集 {1, 2, 3, 4, 5},你会先将它们按顺序排列:{1, 2, 3, 4, 5}。因为值的数量是奇数,所以中位数是中间值,即 3。 如果你有一个数据集 {1, 2, 3, 4},你会将它们按顺序排列:{1, 2, 3, 4}。因为值的数量是偶数,所以中位数是两个中间值(2 和 3)的平均值。因此,中位数是 2.5。 中位数的用途
中位数的局限性
尽管存在局限性,但中位数是数据分析中的一个有价值的工具,并且通常与其他集中趋势度量(如均值和众数)结合使用。均值、中位数和众数提供了关于数据集集中趋势的补充信息,并有助于更全面地了解数据。 除了在描述性统计中的应用外,中位数还用于推断性统计,特别是在假设检验中。假设检验是一种统计方法,用于根据样本数据确定假设是真还是假。中位数通常用于非参数假设检验,该检验不对数据分布做任何假设。 当数据不呈正态分布或样本量较小时,非参数假设检验很有用。在非参数假设检验中,零假设通常是总体中位数等于某个特定值。然后根据样本中位数与假设中位数之间的差异计算检验统计量。然后计算 p 值,它表示在零假设为真的情况下获得观察到的检验统计量的概率。如果 p 值小于显著性水平,则拒绝零假设,接受备择假设。 结论总之,中位数是集中趋势的一种统计度量,代表数据集中间的数值。它比均值对极端值不敏感,并且通常用于数据包含异常值或极端值的情况。但是,它也有一些局限性,例如它不能用于分类数据,并且它没有考虑数据集值的幅度。尽管存在这些局限性,中位数是数据分析中的一个有价值的工具,并且通常与其他集中趋势度量结合使用。它还用于非参数假设检验,以检验关于总体中位数的假设。 下一个主题正态性定义 |
我们请求您订阅我们的新闻通讯以获取最新更新。