增益模型

2025 年 7 月 14 日 | 阅读 13 分钟

在一个由数据推动的世界中,组织和团队不断寻求优化他们与个人(无论是客户、患者还是用户)互动的方式。传统的预测模型在预测购买意愿、流失或转化率等行为方面表现良好。然而,这些模型通常缺乏一个关键要素:理解因果关系。这就是提升建模的作用——一个强大的工具,不仅可以衡量结果,还可以衡量干预的增量影响。

无论是营销活动、医疗治疗还是政策变化,提升建模都允许决策者量化其行动的影响并相应地优化其策略。让我们探讨一下什么是提升建模、它是如何工作的以及为什么它很重要。

什么是提升建模?

提升建模是一种预测分析方法,用于估计治疗或干预对个人行为的因果影响。与预测结果(例如,客户是否会购买产品)的传统模型不同,提升模型侧重于预测特定行动(例如,营销活动或医疗治疗)对个人采取特定行动的可能性的增量影响。

提升建模的目标是识别哪些人会对干预做出积极反应,以及反应程度如何,从而使公司能够更有效地分配资源。

提升建模的关键概念

提升建模涉及几个核心概念和思想,这些概念和思想使其能够有效地识别干预的因果影响。以下是关键概念

1. 治疗组和对照组

提升建模基于治疗组和对照组的实验设计,类似于 A/B 测试。这允许模型衡量干预的因果影响

  • 治疗组:接受干预或行动(例如,营销优惠、医疗治疗)。
  • 对照组:不接受干预,并作为比较的基线。

2. 提升

提升是模型的核心指标,指由于干预导致的特定结果(例如,购买或对治疗积极响应)概率的增量变化。它衡量了个人由于处于治疗组而采取行动的可能性增加了多少。

  • 正向提升:干预增加了预期结果的概率。
  • 负向提升:干预降低了预期结果的概率(例如,客户可能会被不合时宜的电子邮件激怒)。

3. 客户细分

提升模型根据个人对干预的预期反应将个人分为四个部分。这些部分对于目标定位至关重要

  • 易受影响者:没有干预就不太可能采取预期行动,但在接受治疗时更有可能采取行动的个人。这是最有价值的目标群体。
  • 确定者:无论是否接受干预都会采取预期行动的个人。向此群体发送治疗会浪费资源。
  • 无可救药者:即使接受治疗也不太可能积极响应的个人。这些人通常被排除在干预之外。
  • 勿扰者:更有可能对治疗做出负面反应的个人,这意味着干预可能会降低预期结果的概率(例如,取消订阅服务)。避免针对此群体很重要。

4. 增量影响与绝对结果

提升建模侧重于增量影响,这意味着它着眼于接受治疗的个体与不接受治疗的个体之间的行为差异。这与完全侧重于预测绝对结果(例如,谁将购买、流失或响应)的传统预测模型不同。

示例:传统模型可能会预测谁可能购买产品。相比之下,提升模型预测谁最有可能因为获得促销而购买产品。

5. 建模技术

有几种方法用于构建提升模型

  • 双模型方法:构建两个独立的模型——一个用于治疗组,一个用于对照组。提升分数来源于两个模型预测之间的差异。
  • 提升树:决策树的一种变体,根据治疗结果而不是最大化预测精度来拆分数据。这些树旨在最大化每个拆分处治疗组和对照组之间的响应率差异。
  • 元学习器:一种机器学习方法,首先直接预测治疗效果,然后将此估计作为第二个模型中的特征。

6. 随机化

为了使提升建模有效工作,将个体分配到治疗组和对照组必须是随机的。这确保了结果差异可以归因于干预本身,而不是其他混杂因素。

7. 因果推断

提升建模深深植根于因果推断的概念,旨在理解干预与结果之间的因果关系。提升建模不是仅仅识别相关性,而是寻求估计干预导致行为变化的程度。

8. 可操作的洞察

提升建模通过识别不仅会采取预期行动的人,还会识别由于干预而采取行动的人,从而提供可操作的洞察。这使得公司能够更有效地利用其资源并最大限度地提高其活动的投资回报率 (ROI)。

9. 评估指标

与传统模型不同,提升模型使用不同的指标进行评估,包括

  • Qini 曲线:一种图形表示,显示模型识别对治疗积极响应的个体的有效性。
  • 提升分数:治疗过的个体与未治疗个体之间结果概率的差异。分数越高,模型区分响应者和非响应者的能力越强。

为什么提升建模很重要

提升建模已成为营销、医疗保健和公共政策等领域的重要工具,因为它侧重于干预的因果效应,使机构能够做出更明智和高效的决策。以下是提升建模很重要的主要原因

1. 优化资源分配

提升建模的主要优势之一是它能够优化资源的投放位置和方式。在传统的预测模型中,机构可能会针对那些可能采取特定行动的个体,例如购买或续订订阅。然而,这种方法经常忽略一个关键问题:这些个体是否会因为干预而采取行动?

提升建模通过识别哪些人会对干预做出积极响应来解决这个问题。这确保了资源集中在最有可能受到治疗影响的个体身上,从而导致

  • 更高的投资回报率:资源被引导到“易受影响者”身上,他们可能仅因干预而采取行动。
  • 减少浪费:避免在那些无论如何都会采取行动的人(确定者)或甚至可能做出负面反应的人(勿扰者)身上花费。

2. 定向营销和个性化

在营销中,瞄准正确的客户对成功至关重要。提升建模有助于企业识别哪些客户最有可能响应特定的营销活动。这导致

  • 提高转化率:通过关注易受影响的客户,企业可以增加将这些个体转化为客户的可能性。
  • 更好的客户体验:不太可能积极响应或可能对某些促销活动做出负面反应的客户被排除在活动之外,从而确保更个性化和有效的营销策略。

示例:企业可以使用提升建模仅向那些可能因折扣而购买的客户发送折扣优惠,而不是向所有客户发送,从而提高效率和成本效益。

3. 减少流失和提高客户保留率

在基于订阅的企业中,客户保留至关重要。提升建模可以帮助识别哪些客户可能流失(取消订阅),更重要的是,哪些客户可以通过有针对性的保留策略(例如,特殊优惠或服务改进)进行保留。

  • 挽留有风险的客户:通过关注易受影响的客户,企业可以更有效地减少流失。
  • 最大限度地减少不必要的折扣:提升模型有助于避免向那些没有激励也会留下的客户提供保留优惠,从而防止不必要的价值。

4. 个性化医疗和医疗保健

在医疗保健领域,提升建模正在彻底改变个性化治疗。提升模型不是采用一刀切的方法治疗所有患者,而是帮助预测哪些患者将从特定治疗中受益。

  • 有针对性的干预:医生可以识别哪些患者可能对特定治疗做出积极反应,并将资源集中在他们身上。
  • 成本效益:医院和医疗服务提供者可以避免对不太可能受益的患者进行昂贵的治疗,从而优化患者结果和资源利用。

5. 促进决策的因果洞察

与识别相关性的传统预测模型不同,提升模型提供对因果关系的洞察。这有助于决策者理解

  • 为什么某个行动会导致特定结果。
  • 干预将对特定个体产生什么影响。

这种因果理解在公共政策等领域特别有价值,在这些领域,提升建模可以验证社会项目或倡议的有效性,帮助将资源分配到最能发挥作用的地方。

6. 改进活动效果衡量

提升建模使企业能够更准确地衡量干预的有效性。传统技术可能表明营销活动或治疗导致了某些转化或成功,但它们无法揭示这些成功是否会在没有干预的情况下发生。

通过提升建模,企业和组织可以衡量

  • 真实影响:干预提供的实际增量提升。
  • 可操作的洞察:谁对治疗有反应,为什么有反应,从而为未来的活动制定更好的战略计划。

7. 道德目标定位和客户尊重

提升建模可以帮助企业避免向客户发送不必要的干预。例如,向“确定者”(无论如何都会购买的客户)发送频繁的营销电子邮件可能会导致客户疲劳或沮丧。通过应用提升建模,企业可以

  • 尊重客户偏好:仅针对需要干预的客户,避免与客户过度沟通。
  • 减少负面反应:避免针对“勿扰者”,他们更有可能对营销或挽留措施做出负面反应。

提升建模如何运作

提升建模是预测分析中的一种专门方法,侧重于确定治疗或干预的增量影响。目标是预测个人由于干预而采取特定行动的可能性增加了多少。以下是提升建模如何运作的逐步概述

1. 数据设置:治疗组和对照组

提升建模的基础是基于随机实验,类似于 A/B 测试。个体分为几类

  • 治疗组:接受干预(例如,折扣、促销优惠或医疗治疗)。
  • 对照组:不接受干预,并作为比较的基线。

该模型比较两组的结果,以确定干预如何影响行为。

2. 结果变量

下一步涉及定义结果或目标变量。这通常是一个二元结果,例如客户是否购买、患者是否从治疗中康复或订阅者是否续订会员资格。

  • 二元结果:个体要么采取了预期行动(例如,进行了购买),要么没有。
  • 治疗效果:模型估计治疗过的个体与未治疗个体之间的结果差异。

目标是预测个体由于干预而表现出预期行为的可能性。

3. 构建提升模型

有几种策略可以构建提升模型,每种策略都旨在估计干预的因果效应。最常见的方法包括

A. 双模型方法

在这种方法中,构建了独立的预测模型

  • 治疗模型:预测治疗组中个体的结果。
  • 对照模型:预测对照组中个体的结果。

提升分数计算为两个模型对每个个体预测之间的差异。此分数反映了个人由于治疗而采取预期行动的可能性。

示例:如果治疗模型预测客户购买的概率为 70%,对照模型预测的概率为 50%,则提升分数为 20%。这意味着客户由于干预而购买的可能性增加了 20%。

B. 提升树

提升树是决策树的一种专门形式,旨在最大化治疗组和对照组之间的响应差异。提升树不是为了优化整体预测精度而进行拆分,而是根据最大化治疗效果进行拆分——即每个节点内治疗过和未治疗的个体之间的结果差异。

  • 拆分标准:节点根据分支之间治疗效果的差异进行拆分,旨在找到更有可能对干预做出积极响应的个体群体。
  • 结果:该树有助于识别高提升的亚组,使机构能够针对那些最有可能对治疗做出响应的群体。

C. 元学习器

元学习器是机器学习模型,旨在直接预测治疗效果,而不是为治疗组和对照组构建单独的模型。一些常见的元学习器方法包括

  • T-学习器:为治疗和对照学习单独的模型,然后将提升估计为预测差异(类似于双模型方法)。
  • S-学习器:使用一个以治疗组为特征的单一模型,允许模型学习治疗组与未治疗组结果的差异。
  • X-学习器:结合多个模型的预测,以更好地估计治疗效果,特别是对于治疗组或对照组可能不平衡的情况。

4. 个体细分

一旦计算出提升分数,个体将根据他们对干预的预期反应分为四个关键部分

  • 易受影响者:这些个体不太可能自行采取预期行动,但如果进行干预,他们会采取行动。他们为治疗提供了最高的潜在投资回报率。
  • 确定者:这些个体无论是否接受治疗都会采取预期行动。针对他们不会带来任何增量收益。
  • 无可救药者:这些个体不太可能采取预期行动,即使接受治疗。针对他们通常是徒劳的。
  • 勿扰者:这些个体在接受治疗时采取预期行动的可能性较小。在某些情况下,治疗可能会适得其反,使这些个体更有可能流失或做出负面反应。

5. 模型评估:衡量提升性能

提升模型使用与传统预测模型不同的指标进行评估,因为目标是衡量增量影响而不是仅仅衡量整体准确性。

A. Qini 曲线

Qini 曲线是评估提升模型的一种流行方法。它显示了模型根据其提升分数对个体进行排名的效果,并衡量了随着更多人接受治疗而获得的累积增量收益。Qini 曲线下的面积(类似于 ROC 曲线)反映了模型识别那些可能对干预做出积极响应的个体的效率。

B. 提升分数

提升分数表示治疗过个体与未治疗个体之间预期结果概率的差异。它量化了干预的增量影响。

示例:如果治疗组中的一组个体购买率为 60%,而类似的对照组购买率为 50%,则提升分数将为 10%,表明治疗具有积极效果。

C. 响应率比较

评估模型的另一种方法是比较治疗组和对照组之间的响应率。治疗组中较高的响应率表明干预成功,但提升建模允许您分离出对该较高率贡献最大的个体。

6. 可操作的洞察和目标定位

一旦生成提升分数,下一步就是将这些洞察用于有针对性的干预

  • 营销:只针对那些可能因活动而购买或转化的易受影响者。
  • 医疗保健:仅对那些最有可能从干预中受益的患者进行治疗。
  • 保留:向那些容易流失但如果获得正确优惠就会留下的客户提供保留激励。

通过关注高提升分数的个体,企业可以最大限度地提高干预的有效性,并最大限度地减少对那些不太可能做出响应的个体造成的浪费。

提升建模的用例

1. 营销和客户保留

提升建模最常见的应用之一是定向营销。例如,企业可以使用提升模型来定位那些可能因为收到促销而购买产品(易受影响者)的个体,而不是向所有客户发送电子邮件促销。这不仅增加了转化率,还降低了营销成本。

对于客户保留,提升模型有助于识别那些没有激励可能会流失的客户,从而使企业能够专注于保留高风险个体,同时忽略那些无论如何都会留下的个体。

2. 个性化医疗

在医疗保健领域,提升建模正在彻底改变个性化治疗。医生不是对所有患者进行相同的干预,而是可以使用提升模型来识别哪些患者将从特定治疗中受益最大。这可以带来更好的患者结果和更有效的医疗资源利用。

3. 政策实施和公共项目

政府和非营利组织经常实施旨在改变行为的计划——无论是鼓励更健康的生活方式还是改善教育成果。提升建模可以帮助识别哪些个人或群体将从这些项目中受益最大,从而更有效地利用资源。

挑战与注意事项

虽然提升建模提供了巨大的优势,但也存在挑战

  • 数据要求:提升建模需要随机对照试验 (RCT) 或准实验设计,以确保清晰的治疗-对照结构,这可能成本高昂且耗时。
  • 复杂性:提升模型本质上比传统模型更复杂,因为它们需要同时考虑治疗组和对照组。
  • 可解释性:根据所使用的算法(例如,神经网络或复杂的集成),提升模型可能比传统决策树或逻辑回归模型更难解释。

尽管存在这些挑战,但更好的目标定位和改进结果的优势使提升建模成为许多领域中的宝贵工具。