验证性因子分析2025年4月26日 | 阅读 8 分钟 引言验证性因子分析 (CFA) 是一种统计方法,用于确定一组观测变量是否有效地代表了某个潜在的因子结构。与探索性因子分析 (EFA) 不同,EFA 在不进行任何预设假设的情况下探索可能的因子系统,CFA 要求研究者在分析之前构建一个假设模型。这项技术常用于商业研究、心理学和社会科学,以验证观测变量是否准确地测量了期望的潜在构念。 在结构方程模型 (SEM) 的框架内,CFA 评估观测指标与其相关潜在因子之间的关系。在定义了因子载荷、误差项和因子相关性之后,研究者会使用像比较拟合指数 (CFI)、近似误差均方根 (RMSEA) 和卡方检验等拟合优度指标来评估模型与数据的拟合程度。 一个拟合良好的 CFA 模型能够验证一个构念的理论结构,从而提高测量工具的可靠性和准确性。相反,模型拟合不良则表明可能需要进行修改或探索其他模型。CFA 为心理量表、调查工具和其他在实证研究中使用的测量工具的开发和改进提供了全面的统计验证,因此至关重要。 探索性因子分析 (EFA) 和 CFA 之间的区别- 目标
- 当因子框架不明确时,使用 EFA。它在不进行任何假设的情况下探索潜在原因。
- CFA 用于检验基于理论或先前研究的预设因子结构。
- 因子结构方法
- EFA:在没有任何先验信息的情况下,确定观测变量如何聚类。
- CFA:要求研究者指定哪些潜在因子由观测变量加载。
- 假设检验
- EFA:数据驱动,让因子自然出现。
- CFA:理论驱动,用于验证数据是否符合已开发的模型。
- 载荷和旋转
- EFA:使用因子旋转(如 Varimax 和 Oblimin)来简化因子结构。
- CFA:直接检验因子载荷,无需旋转。
- 统计框架
如何进行 CFA- 模型细节
CFA 的第一步是根据理论或先前的研究来确定提出的因子结构。需要指定潜在因子的数量以及加载到每个因子上的观测变量(指标)。 - 模型识别
在估计参数之前,识别模型是否可识别至关重要。如果存在足够的可观测信息点来估计未知参数,则模型是可识别的。为确保识别,每个因子通常需要至少 3 个观测指标。 - 模型估计
模型构建完成后,将计算必要的参数(因子载荷、误差方差和协方差系数)。虽然通常使用最大似然 (ML) 估计,但根据数据的特性,也可以使用其他方法,如加权最小二乘法 (WLS) 或广义最小二乘法 (GLS)。 - 模型评估
使用拟合优度指标来评估模型的拟合程度。关键指标包括:
- 卡方检验(对于良好拟合,它不应过大)
- 比较拟合指数 (CFI) 为 0.90 或以上表示良好拟合。
- 近似误差均方根 (RMSEA) 小于 0.06 表示良好拟合。
- 标准化近似误差均方根 (SRMR) 小于 0.08 表示良好拟合。
- 模型修改
如果初始模型的拟合不佳,可能需要进行修改。可以添加或删除路径、释放参数,或根据修改指数的指示包含误差协方差。为了防止过拟合,修改必须有概念上的支持。 - 报告和解释
在获得充分的模型拟合后,会评估因子载荷以评估构念效度。较高的载荷(通常 > 0.5)表示观测变量与其相应的因子之间存在很强的相关性。清楚地记录最终结果,包括拟合指数、因子载荷和修改,这一点很重要。
典型的 CFA 估计技术- 最大似然法 (ML)
在 CFA 中,最常用的估计技术是最大似然法 (ML)。它假设数据呈正态分布,通过最大化在给定模型下找到数据的可能性来估计参数。ML 允许对变量进行统计显著性检验,并在样本量充足时产生稳健的估计。当数据偏离正态分布时,它可能效果不佳。 - 广义最小二乘法 (GLS)
GLS 与 ML 类似,但对偏离正态性的容忍度较低。它通过最小化观测和预测协方差矩阵之间平方差的加权平均值来估计参数。尽管 GLS 在实践中不如 ML 常用,但在处理明显非正态数据时可能很有用。 - 加权最小二乘法 (WLS)
当分析包含有序或分类变量的数据时,建议使用 WLS。它使用权重矩阵来考虑不同的测量尺度,并且不假设正态性。然而,它可能计算量大,并且需要较大的样本量。 - 稳健的最大似然法 (MLR)
MLR 是 ML 的一种变体,它考虑了异方差性(不相等的方差)和非正态性。当数据偏离正态性假设时,它可能很有用,因为它提供了调整后的检验统计量和稳健的标准误差。这种技术常用于 Lavaan (R) 和 Mplus 等软件中。 - 对角加权最小二乘法 (DWLS)
DWLS 是 WLS 的一种变体,它仅使用权重矩阵的对角元素。由于它比 WLS 提供了更稳健的参数估计,因此常用于分类数据和较小的样本量。
进行 CFA 的软件- 结构方程模型分析 (AMOS)
AMOS 与 SPSS 集成,是一款图形化、易于使用的结构方程模型 (SEM) 软件。凭借其拖放界面,研究者可以指定 CFA 模型,使其对初学者也易于使用。AMOS 特别提供了全面的模型拟合指数,并支持最大似然 (ML) 估计。与其他应用程序相比,它不包含所有复杂的 SEM 功能。 - 线性结构关系 (LISREL)
LISREL 是最早也是最受欢迎的 SEM 软件之一。它提供稳健的统计结果,并支持使用基于语法的命令进行 CFA 和 SEM。尽管 LISREL 常用于协方差基础的 SEM,但其复杂的语法使得理解起来更加困难。 - Mplus
Mplus 是一款功能强大且灵活的软件,常用于 SEM、CFA 和更复杂的建模方法,如多层 SEM 和潜在类别分析。它支持多种估计技术,包括最大似然法 (ML)、加权最小二乘法 (WLS) 和贝叶斯估计。用户需要以脚本格式创建模型规范,因为 Mplus 是基于语法的。 - R 中的 Lavaan 包
Lavaan 是 R 中一个广受欢迎的开源工具,用于进行 CFA 和 SEM。它为用户提供了灵活性,支持多种估计技术,并允许使用易于理解的语法进行 CFA。由于其强大的统计功能和免费可用性,R 和 Lavaan 常用于学术研究。 - Stata
Stata 的 sem 命令提供了 CFA 和 SEM 功能。它适合熟悉 Stata 环境的研究人员,因为它同时提供基于语法和图形用户界面。Stata 在社会科学和经济学领域广泛使用,并支持 ML、GLS 和 WLS 等估计技术。
CFA 中的常见问题和挑战- 模型拟合不足
找到合适的模型拟合是 CFA 中最具挑战性的任务之一。如果关键拟合指数(如 CFI、RMSEA 和 SRMR)显示拟合不佳,研究者可能需要修改模型,添加或删除路径,连接误差项,或重新评估理论框架。修改必须有概念上的支持,以防止过拟合。 - 样本量问题
足够大的样本量对于 CFA 提供准确的参数估计至关重要。样本量小可能导致模型拟合不佳和估计不稳定。尽管更复杂的模型可能需要更大的样本,但一般来说,每个估计的参数应至少包含 5-10 个观测值。 - 数据非正态性
许多 CFA 估计技术,包括最大似然法 (ML),都假设数据呈正态分布。偏离正态性可能导致估计有偏和不准确的显著性检验。在处理非正态数据时,研究者应采用稳健的估计技术,如 WLSMV(加权最小二乘均值和方差调整)或 MLR(稳健 ML)。 - 多重共线性现象
高度相关的因子可能导致估计问题,使得区分潜在因子变得困难。如果两个因子表现出过强的相关性(例如,r > 0.85),研究者应该重新评估这两个变量是否测量了不同的构念,或者是否应该将它们合并。 - 收敛和估计问题
CFA 模型有时可能无法收敛,导致无法估计参数。高多重共线性、模型定义不当或每个因子包含的指标数量不足都可能导致这种情况。一些解决方案包括增加样本量、简化模型或确保每个潜在因子至少包含三个观测变量。 - 因子载荷和交叉载荷
低于 0.50 的因子载荷表明观测变量与相关潜在因子之间的相关性较弱。此外,交叉载荷(即一个项目加载到多个因子上)可能是区分效度不足的标志,这表明构念定义不清。
CFA 的研究应用- 心理学和行为学研究
CFA 在心理学中广泛用于验证心理构念和量表,如人格特质、心理健康障碍和智力。通过确定问卷项目是否有效验证了潜在的心理特质,它有助于研究者验证问卷项目的效度和信度。 - 教育学研究
CFA 在教育学中用于评估测量工具的可靠性,例如学习风格问卷、学生动机量表和标准化考试。它确保不同的测试项目能够测量期望的行为或认知特质,如阅读理解能力或数学天赋。 - 社会学和社会科学
社会科学研究者使用 CFA 来检验政治意识形态、文化价值观和社会态度等构念。它有助于验证调查问题是否准确地反映了社会资本、偏见和信任等复杂的社会学概念。 - 商业和市场营销研究
在商业和市场营销领域,CFA 常用于验证客户满意度指数、品牌形象调查和消费者行为模型。它确保客户信任、品牌忠诚度和购买意愿等构念的测量量表的统计有效性和可靠性。 - 医学和健康研究
CFA 在医疗保健领域用于验证临床生活质量指标、患者满意度调查和诊断工具。它有助于确定特定的健康指标(如社会、情感和身体健康)是否代表了更广泛的健康类别。
|