非参数统计简介

2025年6月21日 | 阅读 4 分钟

统计非参数方法为数据分析提供了更广阔的途径,而无需严格依赖关于总体分布的假设。参数方法采用数据需要符合特定分布(可能为正态分布)的观点,而非参数方法则倾向于与有序数据、偏斜数据或小样本数据集一起使用。在这些情况下,对数据点进行排序而不是使用精确的数值证明是很有用的。

一些非参数检验包括 Mann-Whitney U 检验(用于评估两个独立组)、Wilcoxon 符号秩检验(适用于配对样本)和 Kruskal-Wallis 检验(用于比较两个以上组)。这些检验对传统的 t 检验和 ANOVA 提出了挑战,因为它们关注中位数和秩而不是均值和方差。非参数方法具有多功能性和对异常值的抵抗力,但它们通常比参数检验的统计功效低,这使得它们在检测微小效应方面不那么敏感。

当参数假设不成立或样本量较小时,非参数检验是替代方案。它们不像参数检验那样严格遵循关于总体分布的假设。非参数检验最适合分析非正态或偏斜数据:例如,对于有序或非区间数据,有 Wilcoxon 符号秩检验和 Mann-Whitney U 检验。非参数检验最相关的缺点是,它们不如参数检验强大,尤其是在样本量较大时。功率降低会导致遗漏真实效应,从而导致更高的 II 型错误率。在这方面,研究人员在稳健性和统计效率之间做出了权衡,通过根据他们的数据和参数假设的有效性来决定最佳方法。

代码

输出

Introduction to Non-Parametric Statistics

当传统独立样本 t 检验的假设被违反时,Mann-Whitney U 检验是其有效的非参数替代方案。Mann-Whitney U 检验适用于数据是有序的、非正态分布的且样本量较小的情况。与依赖均值和方差的参数检验不同,Mann-Whitney 检验通过观察值的秩来发现两个独立组之间的差异,从而最大限度地减少对特定分布假设的依赖。通过评估两个组分布之间的随机相似性,该检验在参数方法不适用时提供了一种稳健灵活的数据分析方法。

代码

输出

Introduction to Non-Parametric Statistics

配对样本的非参数检验,例如 Wilcoxon 符号秩检验,为通常使用的配对样本 t 检验提供了强大的替代方案,其中无法保持正态性假设。该检验根据配对观察值的秩而不是其实际值来评估两个相关组的分布是否不同。因此,它比参数配对样本 t 检验具有更广泛的适用性,并且在小样本量和数据正态性受损时表现尤为出色。

代码

输出

Introduction to Non-Parametric Statistics

代码

输出

Introduction to Non-Parametric Statistics

当不满足正态性和方差齐性条件时,非参数检验为传统的单向 ANOVA 提供了可靠的替代方案。其中之一是 Kruskal-Wallis 检验,它专门用于分析两个以上独立组,而不做任何分布假设。它用组间的排序观察值代替均值和方差,因此适用于有序数据或非正态分布数据。它的灵活性提供了在方差不相等的情况下进行有效比较的可能性,因此在各种研究背景下的统计分析中都具有重要价值。

代码

输出

Introduction to Non-Parametric Statistics

Mann-Whitney U 检验与 Bonferroni 校正的成对比较可用于事后分析。

代码

输出

Introduction to Non-Parametric Statistics