卡方检验的假设

2025年3月17日 | 阅读 3 分钟

在本节中,我们将学习卡方检验的假设。 在SPSS中,Pearson卡方检验有两个主要的假设

第一个个体观察应该彼此独立。 假设我们以频率格式获取数据,并且我们以列联表格式对数据进行分类。 列联表如下

Assumptions of Chi-Square test

这是我们为演示目的创建的表。 现在,看一下此表中每个单元格中写入的。 该表基本上是关于衡量男性女性之间足球比赛受欢迎程度研究人员随机抽取了100名男性足球迷和100名女性足球迷。 他会问他们最喜欢的球队是哪个。 我们可以看到30名男性投票给德国,20名投票给法国,15名投票给意大利,35名投票给巴西

Assumptions of Chi-Square test

女性类别中,40名女性投票给德国,15名投票给法国,18名投票给意大利,27名投票给巴西

Assumptions of Chi-Square test

现在,对德国30名男性的观察结果和对法国29名男性的观察结果,他们必须彼此独立。 这是第一个假设的含义。 选择第一类的30名男性不会影响选择第二类的这20名男性等等。 因此,卡方检验的第一个假设个体观察彼此独立

Assumptions of Chi-Square test

卡方的第二个重要假设预期的单元格频率不应太。 实际上,如果每个预期单元格中至少有五个频率或观测值,那么我们认为我们的数据足以进行卡方检验。 我们将回到我们的示例数据集

Assumptions of Chi-Square test

这些是实际观察到的频率。 当研究人员进行研究时,这些是实际投票支持不同球队的个体期望是每个足球队都有相同数量的选民。 因此,如果我们总共有100名男性4个球队,我们希望每个球队有20名男性受试者。 这意味着支持每个球队的20名男性足球迷,对于女性也是如此。 因此,这些实际观察结果是不同的,但我们希望它们在所有类别中都相似。 因此,可以以这样一种方式重新绘制表,我们可以显示预期观察到的频率。 看一下重新绘制的表

Assumptions of Chi-Square test

在表中,我们还重新创建了预期频率。 如果我们在男性类别中有100名受试者,在女性类别中有100名受试者,我们预计四个单元格中的每一个都有25名受试者。 这意味着25名男性受试者和25名女性受试者都支持四个足球队中的每一个。 因此,观察到的频率和预期的频率彼此之间都是不同的。 可以通过找出观察的总数并将其除以类别数来得出预期频率。 在我们的例子中,类别的数量是4。这意味着有四个球队。 如果我们将100除以4,我们将分别为男性女性预期频率得到25卡方检验不过是对观察到的频率和预期的频率之间差异的检验。

Assumptions of Chi-Square test

卡方检验公式

卡方检验的公式用于计算。公式如下

Assumptions of Chi-Square test

其中

fo 代表观察到的频率

fe 代表预期频率

在分母中,我们再次有预期频率。 因此,当我们计算卡方时,我们采用观察到的频率预期的频率。 我们从观察到的扣除预期,然后将其平方。 平方的结果除以预期频率。 因此,上面表格的计算结果将是

(30-25)2 / 25 + (20-25)2 / 25 + (15-25)2 / 25 + (35-25)2 / 25 

因此,通过以简单的方式使用卡方公式,我们可以找出各组之间的显着差异。 在下一节中,我们将学习如何在SPSS中输入此数据,以及如何执行卡方检验并解释结果。


下一个主题卡方检验的计算