倾向得分分析简要指南

2025年7月14日 | 阅读 7 分钟

引言

倾向性得分分析(PSA)是一种流行的统计技术,用于在观察性研究中估计因果效应,同时考虑混淆变量。与随机对照试验(RCT)中个体被随机分配到治疗组或对照组不同,观察性研究由于非随机分配,经常会遇到选择偏倚。为了克服这个问题,PSA 根据个体的观测特征来计算其接受特定治疗的概率(即“倾向性得分”)。

倾向性得分分析(PSA)是一种流行的统计技术,用于在观察性研究中估计因果效应,同时考虑混淆变量。与随机对照试验(RCT)中个体被随机分配到治疗组或对照组不同,观察性研究由于非随机分配,经常会遇到选择偏倚。为了克服这个问题,PSA 根据个体的观测特征来计算其接受特定治疗的概率(即“倾向性得分”)。

本指南概述了其理论基础、倾向性得分的计算方法以及 PSA 的典型应用。此外,它还涵盖了评估平衡性、使用匹配策略和解读结果的方法。尽管 PSA 有许多优点,但它也有局限性,为了有效使用它,必须了解这些局限性。本简明指南旨在为研究人员提供在其研究中应用 PSA 和准确评估结果所需的基本知识。

什么是倾向性得分分析?

在观察性研究中,倾向性得分分析(PSA)是一种统计方法,用于在考虑混淆变量的情况下评估治疗、干预或暴露的因果影响。在一个理想的实验中,如随机对照试验(RCT),参与者被随机分配到对照组或治疗组,这确保了组间的可比性并最小化了偏倚。然而,由于观察性研究的非随机分配,如果具有不同特征的人有更高的机会接受治疗,就可能导致选择偏倚。

为了解决这个问题,PSA 根据个体的观测属性(如年龄、性别、社会经济地位和其他相关变量)来计算其接受治疗的概率(或倾向)。我们将这个概率称为“倾向性得分”。为了模拟 RCT 的随机化过程,PSA 对具有相似倾向性得分的个体进行分组、匹配或加权,以产生在基线特征方面相似的平衡组。

倾向性得分可以通过多种策略加以利用,包括加权(根据得分调整个体的影响力)、分层(根据得分范围将个体分成组)和匹配(匹配得分相似的个体)。当 RCT 不切实际或不符合伦理时,这些方法有助于研究人员减少混淆并得出更准确的因果结论,使 PSA 成为评估治疗或干预的强大工具。

应用倾向性得分的方法

  • 匹配

匹配是根据相似的倾向性得分,将治疗组和未治疗组的个体配对。最近邻匹配,可以是一对一或多对一,将每个接受治疗的个体与倾向性得分最接近的对照个体配对,有或无放回。卡尺匹配则设置了一个容忍阈值,仅当得分差异在此范围内时才进行配对,从而减少了不良匹配,但可能导致样本量减小。马氏匹配同时使用倾向性得分和其他变量来增强组间的平衡性。

  • 分层或分组

分层是根据倾向性得分将个体分为多个层(例如五分位数)。在每个层内,治疗组和对照组的个体得分相似,使得比较有效。计算每个层的治疗效应,然后汇总得到总体估计值。虽然这种方法能增强平衡性,但如果分层过细,效果可能不佳。

  • 逆概率加权 (IPW)

IPW 通过根据个体的倾向性得分为其分配权重,创建一个相等的人工样本。为了确保组间相似,代表性不足的个体被赋予更高的权重,而代表性过度的个体则被赋予较低的权重。尽管 IPW 在直接匹配困难时效果很好,但如果存在来自极高或极低得分的极端权重,它可能会变得不稳定。

  • 使用倾向性得分进行协变量调整

这种方法通过在回归模型中将倾向性得分作为一个协变量,来解释组间差异。它将经典回归与 PSA 相结合,以考虑混淆因素。虽然简单,但如果模型有误或得分极端,可能无法完全消除偏倚,需要谨慎解释。

  • 双重稳健技术

双重稳健方法结合了 IPW 和协变量调整,假设其中任一模型被正确设定,就能产生一个独立的估计。尽管依赖于特定的模型系统,但这种方法提供了防止偏倚的保护。它在需要平衡性的复杂研究中很有用,但错误的模型仍可能产生有偏倚的估计。

倾向性得分分析的优点和局限性

好处

  • 减少混淆偏倚

PSA 通过平衡治疗组和对照组的变量,减少了混淆偏倚,从而提高了经验研究中因果估计的可靠性。在随机化不可行或不道德的情况下,这尤其有用。

  • 适应性

PSA 可以通过多种技术来应用,包括匹配、分类、逆概率加权和协变量调整。这种灵活性使得研究人员可以选择最适合其数据和研究设计目的的方法。

  • 模拟随机化

PSA 试图通过根据个体的倾向性得分进行分组或加权,来创建与随机对照试验(RCT)中相似的组别,从而使结果更接近于实验设计。

  • 在不同领域的相关性

在医疗保健、社会科学和经济学等领域,进行对照试验有时很困难,因此 PSA 被广泛使用。它有助于利用现有的观察性数据来估计治疗效果。

  • 透明度和可重复性

通过使用统计软件来重现和明确记录 PSA 方法,可以使研究结果更加透明。

限制

  • 未观测到的混淆

PSA 只能对那些被测量并纳入倾向性得分模型的混淆因素进行调整。如果重要的混淆因素未知或未被测量,偏倚可能仍然存在,并导致不准确的发现。

  • 模型设定的敏感性

正确定义倾向性得分模型对于 PSA 的准确性至关重要。错误设定(例如,不正确的函数形式或遗漏变量)可能导致有偏倚或不准确的发现。

  • 样本量损失

匹配方法,特别是像卡尺匹配这样严格的方法,可能会排除未匹配的个体,从而降低有效样本数量,并可能影响研究的统计功效。

  • 极端的倾向性得分

如果某些个体接受治疗的概率极高或极低,逆概率加权(IPW)和其他方法可能对极端的倾向性得分敏感,导致估计的不稳定和大的波动。

  • 复杂性与解读

实施 PSA 需要统计专业知识,特别是对于像双重稳健方法这样更复杂的程序。此外,理解结果可能具有挑战性,尤其是在考虑假设和限制时。

案例研究与应用

  • 医学研究

PSA 在流行病学和医疗保健领域常被用于评估干预、治疗和医疗政策的安全性和有效性。当无法随机分配到接受治疗的组别时,它常被用于比较接受不同治疗的患者的预后。PSA 已被用于研究,以评估新药治疗、手术或生活方式改变对健康结果(如生活质量、疾病进展或存活率)的影响。例如,为了确保基线健康变量(如年龄和合并症)在组间匹配,PSA 可以比较接受两种不同类型心脏手术的个体的总生存率。

  • 教育与社会科学

PSA 在社会科学中用于研究在随机化通常不切实际的情况下,项目、政策或干预措施的效果。例如,在教育领域,PSA 已被用于评估不同项目或教学策略对学生表现的影响。为了确保在接受不同教育干预的儿童之间进行比较,研究人员可以考虑社会经济地位、过往学业表现和学校资源等变量。通过平衡人口统计和学业数据中的基线差异,一个案例研究可以比较课外活动对学生参与度和学业成就的影响。

  • 公共政策与经济学

当实验不可行时,PSA 也常用于公共政策和经济学研究,以评估项目或政策的效果。它常用于评估社会项目、税收改革和劳动力市场政策。例如,为了减少偏倚,研究人员可以利用 PSA 来研究职业培训项目对就业结果的影响,根据参与者和非参与者的工作经历和人口统计数据进行比较。一个具体的案例研究可以利用 PSA 来平衡公司规模、地理位置和行业类型等因素,研究最低工资法对小企业的影响。

  • 行为与心理学研究

PSA 已被用于心理学领域,以评估行为疗法或治疗方案的有效性。例如,一项 PSA 研究可以调查认知行为疗法项目对参与者焦虑水平的影响,并与接受常规护理的对照组进行比较。为了确保子组在基线变量(如年龄、性别、症状强度和其他相关参数)上相似,研究人员会进行匹配,从而可以更准确地评估治疗效果。

  • 流行病学与公共卫生

公共卫生研究人员使用 PSA 来评估免疫接种运动、社区干预和预防性项目的有效性。例如,在控制了收入、教育和医疗设施可及性等变量后,一项研究可以使用公共服务公告(PSA)来考察公共卫生运动对吸烟率的影响。另一个例子可能是评估疫苗接种项目在预防疾病暴发方面的效果,使用 PSA 来解释已接种和未接种人群在人口统计和健康特征上的差异。


下一主题代理优化简介