什么是 t 检验?

17 Mar 2025 | 6 分钟阅读

t 检验是一种推断统计方法,用于确定两组均值之间是否存在显著差异,这两组可能与某些特征相关。t 检验用作假设检验工具,允许检验适用于总体的假设。

t 检验分析 t 统计量、t 分布值和自由度,以确定统计学上的显著性。t 检验使我们能够比较两个数据集的平均值,并确定它们是否来自同一总体。

例如,如果我们从 A 班抽取一个学生样本,从 B 班抽取另一个学生样本,我们会得到不同的均值和标准差。同样,从服用安慰剂的对照组抽取的样本和从服用药物的组抽取的样本应该具有略微不同的均值和标准差。

在数学上,t 检验从两个集合中各抽取一个样本,并通过假设两个均值相等的零假设来建立问题陈述。根据适用的公式,计算出某些值并与标准值进行比较,然后接受或拒绝所假设的零假设。

如果零假设可以被拒绝,则表明数据读数有力,不是由偶然造成的。t 检验只是用于此目的的众多检验之一。统计学家必须另外使用 t 检验以外的检验来检查更多变量和更大样本量的检验。统计学家对大样本量使用 **z 检验**。其他检验选项包括 **卡方检验** 和 **f 检验**。

t 检验的假设

  1. 关于 t 检验的第一个假设涉及测量尺度。t 检验假定收集的数据应用的测量尺度遵循连续或有序尺度,例如智商分数。
  2. 第二个假设是简单随机样本,即数据是从总体的代表性、随机选择的部分收集的。
  3. 第三个假设是,当数据绘图时,会产生正态分布的钟形分布曲线。
  4. 最后一个假设是方差齐性。当样本的标准差近似相等时,就存在齐性或等方差。

何时使用 t 检验?

t 检验仅用于比较两组的均值,也称为 **成对比较**。如果你想比较两个以上的组或进行多次成对比较,请使用 **ANOVA 检验** 或 **事后检验**。

t 检验是一种参数检验,它对你的数据做出与其他参数检验相同的假设。

  1. t 检验假定你的数据是独立的。
  2. t 检验假定你的数据(近似)呈正态分布。
  3. t 检验假定你的数据在每个组内的方差相似,与 **方差齐性** 一致。

如果你的数据不符合这些假设,你可以尝试 t 检验的非参数替代方法,例如对于方差不等的 **Wilcoxon 符号秩检验**。

t 检验的类型

根据数据,我们可以进行三种 t 检验:

What is t-Test?

1. 单样本 t 检验

在单样本 t 检验中,我们将一组的平均值与设定的平均值进行比较。这个设定的平均值可以是任何理论值,也可以是总体均值。

简而言之,计算或执行单样本 t 检验的公式如下:

What is t-Test?

其中,

  • t = t 统计量
  • m = 组的均值
  • µ = 理论值或总体均值
  • s = 组的标准差
  • n = 组大小或样本量

注意:如前所述,应取大样本量以使数据接近正态分布。尽管 t 检验对于小样本量很重要,因为它们的分布是非正态的。

2. 非配对或独立 t 检验

非配对 t 检验用于比较两个不同样本组的均值。

例如,我们想比较男性员工的平均身高与他们的平均身高。当然,为了进行这种比较,男性和女性的数量应该相等。这就是使用非配对或独立 t 检验的地方。

计算两样本 t 检验的 t 统计量的公式如下:

What is t-Test?

其中,

  • mA和 mB 是两个不同组的均值
  • nA和 nB 是样本量
  • S2 是两个样本的共同方差的估计量,例如:
What is t-Test?

这里,自由度是 nA + nB - 2。

我们将遵循与单样本 t 检验相同的逻辑,以检查一组的平均值是否与另一组的平均值有显著差异。没错——我们将计算出的 t 统计量与来自临界值表的 t 值进行比较。

3. 配对 t 检验

配对样本 t 检验非常有趣。在这里,我们在两个不同的时间测量一组。我们比较同一组在两个不同时间或两种不同条件下的不同均值。

某经理发现其员工的生产力水平呈显著下降趋势。这位经理决定为所有员工举办一个培训计划,以提高他们的生产力水平。配对 t 检验计算 t 统计量的公式为:

What is t-Test?

其中,

  • t = t 统计量
  • m = 组的均值
  • µ = 理论值或总体均值
  • s = 组的标准差
  • n = 组大小或样本量
What is t-Test?

计算 t 检验

计算 t 检验需要三个关键数据值。它们包括每个数据集均值之间的差异(称为 **均值差**)、每个组的标准差以及每个组的数据值数量。

t 检验的结果产生 t 值。然后将此计算出的 t 值与从临界值表中获得的称为 **t 分布表** 的值进行比较。这种比较有助于确定纯粹的偶然性对差异的影响,以及它是否超出了该偶然范围。

t 检验质疑组间的差异是否代表研究中的真实差异,还是可能一个无意义的随机差异。

  1. t 分布表
    t 分布表有 **单尾** 和 **双尾** 两种格式。前者用于评估具有固定值或范围且具有明确方向(正或负)的情况。
    例如,掷一对骰子时,输出值保持在 -3 以下或超过 7 的概率是多少?后者用于范围分析,例如询问坐标是否落在 -2 和 +2 之间。
    可以使用支持必要统计功能的标准软件程序执行计算,例如 MS Excel 中的那些。
  2. t 值和自由度
    t 检验的输出为两个值:**t 值** 和 **自由度**。
    **t 值** 是两个样本集均值之差与样本集内部变异之比。虽然分子(两个样本集均值之差)易于计算,但分母(样本集内部的变异)可能因涉及的数据值类型而变得有些复杂。该比率的分母是离散度或变异性的度量。t 值(也称为 **t 分数**)的较高值表示两个样本集之间存在较大差异。t 值越小,两个样本集之间的相似性越大。
    • 高的 t 分数表示组之间存在差异。
    • 低的 t 分数表示组之间相似。
    **自由度** 指的是研究中可以变化的且对于评估零假设的重要性和有效性至关重要的值。这些值的计算通常取决于样本集中可用的数据记录数量。

下一个主题什么是生态系统