卡方检验2025年3月17日 | 阅读 3 分钟 - 在本节中,我们将学习如何在 SPSS 中解释和使用卡方检验。卡方检验也被称为皮尔逊卡方检验,因为它是由统计学界四大天才之一的卡尔·皮尔逊提出的。
- 卡方检验是一种非参数检验,用于检验组频率之间的显著差异。通常,当我们处理数据时,我们得到的数据并不总是以连续数据格式呈现。数据可能以频率的形式出现。例如,在办公室里有多少男性,有多少女性在工作。他们之间是否存在显著差异,这意味着在从事一份工作或在办公室工作的男性人数是否明显多于女性。
- 例如,假设我们是一名政府公务员,我们想传达一个信息,即在被认为是危险的行业,如采矿业等,可能有更多的男性工人受雇,而不是女性工人。因此,在这种情况下,我们可以计算皮尔逊卡方检验,并传达结果,即在采矿业中工作的男性工人数量明显多于女性工人,因为这项工作具有危险性。
- 假设我们在IT行业或某些其他行业工作,在那里应该雇用相同数量的男性和女性。在这种情况下,我们可能对证明在办公室工作的男性和女性人数之间没有显著差异感兴趣。因此,在这种情况下,我们可以使用我们的数据并计算皮尔逊卡方检验来传达我们的结果。由于男性和女性的人数以频率的形式出现,因此我们无法应用任何参数检验,例如方差分析 (ANOVA) 或t检验。因此,卡方检验仅在我们的数据以频率的形式出现时才可以使用。
- 频率可以像我给你的例子一样简单,例如男性的人数和女性的人数。但是,如果我们采用多个组,在这种情况下,频率可能会变得复杂。但是,卡方通过简单地计算结果使我们的工作变得容易。让我们看看这些数据
 我们已从SPSS文件夹中获取了这些数据。这里有银行贷款数据,我们有诸如年龄、教育、与当前雇主的年限、地址、收入等变量,以及贷款违约情况。研究人员可能想找出受过高等教育的人与受教育程度较低的人相比,违约贷款的情况是否较少。因此,我们以频率的形式呈现了违约情况,即一个人是否违约。在我们的例子中,未违约用 0 表示,违约用 1 表示。  对于教育,我们有各种类别,范围从 1 到 5,如下所示  因此,找出不同教育类别的人在贷款违约方面是否存在显著差异可能会非常有趣。在我们的例子中,自变量是学历或教育类别,而贷款违约是我们的因变量。自变量和因变量都以频率的形式出现。因此,我们无法应用任何参数检验,例如t检验或方差分析 (ANOVA)。在这种情况下,一个合适的检验将是皮尔逊卡方检验。
|