赤池信息准则 (AIC)2025 年 8 月 27 日 | 阅读 10 分钟 赤池信息准则 (AIC) 是一种流行的模型选择统计系统。AIC 由日本统计学家赤池弘次开发,通过平衡模型复杂度和拟合优度,帮助确定几个候选模型中最佳拟合的模型选择。AIC 还会对参数过多的模型进行惩罚,在这种情况下,使用 AIC 而不仅仅是依赖准确性。 它在机器学习、计量经济学和生物信息学等研究方向上特别方便,这些领域需要比较多个模型。AIC 旨在给出一个较小的数字;数字越小,模型越好,因此,它是数据驱动决策和预测过程中一个非常重要的工具。 AIC 在实际场景中的应用案例财务预测和计量经济学AIC 在经济学和金融领域中选择模型以预测重要参数(例如GDP、通货膨胀率或价格)方面起着至关重要的作用。分析师使用 AIC 比较自回归模型(AR、ARIMA、VAR)并选择提供最有效估计和准确预测且不会过拟合的模型。一个例子是市场趋势的时间序列预测。AIC 有助于找出哪些滞后结构更可取,以使其更复杂或更不复杂。 它经常应用于计量经济学建模,其中模型的简洁性与预测能力同等重要。在不同模型的预测功能彼此非常接近的情况下,AIC 通过使用惩罚来评分拟合度,从而协助找到最佳模型。 生态学和环境科学AIC 是生态学研究中关于物种分布建模、生物多样性分析和气候影响的重要方面。科学家们倾向于构建许多模型来演示影响物种数量的各种环境因素(例如,温度、降雨、土壤养分)。AIC 帮助他们选择以最少复杂性描述数据变异性的模型。 这在处理通过野外工作收集的大数据时特别有用。AIC 可用于例如,在逻辑回归中建模物种的存在/缺失,或在线性模型中预测动物行为模式与环境条件(栖息地)的关系。 遗传学和生物信息学在生物信息学中,AIC 广泛应用于基因表达模型、蛋白质结构预测的比较以及进化树(系统发育学)的计算。例如,在分析基因调控网络时,可以尝试多种统计模型,并依靠 AIC 来决定最能解释基因相互作用的网络结构。 它们还用于系统发育学,其中使用 AIC 对最大似然模型进行排名,以根据 DNA 序列比对得出最佳进化树。AIC 可以阻止过度参数化这一事实在生物信息学中更有用,因为高维度的使用是过度拟合的主要危险。 预测建模和机器学习AIC 在机器学习的特征选择和模型比较中可能很有用,特别是在经典统计学习(如线性/逻辑回归)中。它根据预测变量的数量帮助选择不同的模型。在某些情况下,节省时间并进行高效计算至关重要,例如高频交易、数据过滤和数据传输。在这些情况下,除了现代机器学习中的交叉验证外,AIC 仍然可能有用。 它通常用于管道模型选择,最著名的是在广义线性模型 (GLM) 和正则化路径中,以及嵌套模型的相互比较中。AIC 与模型的简洁度和拟合优度成反比。 AIC 与其他模型选择标准AIC 与 BIC(贝叶斯信息准则)的比较AIC 和 BIC 是两种流行的模型选择度量,尽管它们的哲学有所不同。AIC 关注预测的准确性,但它轻微惩罚模型复杂度,而 BIC 基于贝叶斯概率,并对模型复杂度施加更大的惩罚,样本量越大。 其中 n 是样本,k 是参数数量。AIC 倾向于在小数据集上选择更复杂的模型,而 BIC 倾向于选择更简单的模型。BIC 倾向于提供卓越的模型识别,特别是当一个人有兴趣识别实际模型时,而 AIC 在一个人想要强调预测时很有用。因此,关于选择哪一个的决定应该基于您是要进行推断还是预测。 在处理线性模型时,AIC 与调整后的 R 方 AIC调整后的 R 方已成为线性回归中常见的分析工具,它试图通过修改 R 方值来考虑预测变量的数量。然而,它未能考虑模型的机会;因此,它不适用于广义统计模型。与可在各种模型(线性、逻辑、时间序列)中实现的 AIC 相比,调整后的 R 方必须降至线性回归。 此外,调整后的 R 方不提供过度拟合的统计惩罚。相比之下,AIC 明确考虑了拟合优度以及模型复杂度。因此,AIC 是评估模型比较多个领域中更通用和可靠的指标。 AIC 与交叉验证(例如,k 折 CV)的比较交叉验证 (CV) 是一种基于重采样的方法,用于估计或评估模型在新数据或未知数据上的性能,给出预测误差的实际估计。CV 的不同之处在于,与 AIC 不同,它不通过数学方式惩罚复杂性,而是使用似然性并通过将数据集分成训练和验证来测试实际数据上的性能。CV 需要大量的计算工作,通常使其更可靠地估计误差,尤其是在预测建模中。 AIC 速度快,因此更适合快速模型比较。但与 AIC 不同,CV 不提供标量性能度量;它只提供性能的平均值(例如,MSE、准确性)度量。在许多情况下,AIC 用于选择初始模型,CV 或 VC 用于确认性能。 Mallows Cp 和 AIC回归分析过程中提供的另一个模型选择度量是 Mallows Cp。与 AIC 一样,它使用偏差和方差权衡来确定模型。公式为 其中 SSEp 是包含 p 个预测变量的模型的平方误差之和。与 AIC 类似,它奖励模型拟合并惩罚复杂性。Cp = p 被认为是一个好模型。另一件事是 Mallows Cp 需要假设一个正确的完整模型,该模型容易出现多重共线性。 AIC 更通用,它使用似然理论,因此更适用于非线性、非正态模型。尽管两者在回归中都有效,但 AIC 用于推广非基于回归的模型。 人工智能在实际应用中的用例时间序列预测和计量经济学AIC 广泛应用于计量经济学,以决定哪种时间序列模型最适合用于确定财务预测。例如,经济学家应用 AIC 来选择 ARIMA 模型在准确性和复杂性之间的适当权重。假设模型参数过多,模型可能会过拟合并最终无法建模。AIC 通过惩罚复杂性来引导分析师选择一个通过使用最少变量进行良好预测的模型。 这在预测通货膨胀、GDP 或股票收益等经济指标时起着非常重要的作用。金融数据可能容易受到季节性和一般噪声的影响,它使用 AIC,这将有助于确定一个随时间提供稳定性的模型结构,从而有助于在市场策略和政策制定中提供足够的预测和卓越的决策。 医疗保健预测建模在医疗保健领域,信息选择准则 AIC 对于选择参与预测分析的模型至关重要,这些分析包括给定疾病发生或治疗结果的概率。这种模型的一个例子是心脏病预测的逻辑回归模型,其中 AIC 协助比较使用不同特征子集(例如年龄、胆固醇水平或血压)的模型。 通过选择最小 AIC 模型,研究人员将能够通过更少地拟合患者数据来提高其预测的准确性。该方法提高了过程的通用性和临床决策。 生态和环境建模生态学家经常使用 AIC 来选择哪些环境变量最有助于解释物种的分布或丰度。例如,在开发一个详细描述鸟类种群趋势的模型时,该模型依赖于类型和栖息地,AIC 协助比较模型中包含温度、植被和海拔的鸟类模型。在这些模型中,最能解释生态关系的模型是 AIC 值最低的模型。 这有助于保护规划,因为它有助于了解生物多样性变化的驱动因素。此外,AIC 还可以在将野外数据与地理空间数据整合时实现可靠的生态推断,从而使所得的保护模型由数据提供信息,同时又不是不合适的,或者与给定的真实世界生态系统良好拟合,而不是过于复杂的拟合。 客户行为和营销分析在营销中,AIC 用于选择预测客户行为(例如,购买意图、客户流失概率或营销活动响应)的预测模型。例如,可以针对客户的各种属性(例如年龄、历史和浏览行为)生成多个逻辑回归模型。AIC 有助于选择最具预测性且仍然简单的模型,该模型将有效地瞄准策略,而不会因包含不必要的特征而使系统过载。 它在 A/B 测试和细分模型中特别有利,在这些模型中,验证了许多假设,然后选择了最具启发性的假设。这种模型有效性可以简单地转化为更好的营销活动 ROI 和更好的用户参与度。 机器学习模型的选择在机器学习中,如果特定应用程序涉及概率模型(例如朴素贝叶斯或隐马尔可夫模型),并且希望比较模型结构,则可以应用 AIC。虽然网格搜索或交叉验证等更现代的过程被广泛使用,但 AIC 提供了一种相对快速且统计上可靠的基于似然性比较多个模型的方法。 在自然语言处理中,AIC 用于选择语言模型中 n-gram 的最佳值,其中训练数据过拟合是一个问题。通过选择最小 AIC 的模型,实践者不必使用不必要的复杂且结果可能无法推广的模型。通过这种方式,AIC 在模型选择管道中仍然很重要,特别是在可解释和可解释人工智能的应用中。 解释和应用 AIC 进行模型选择使用 AIC 进行模型拟合AIC(赤池信息准则)提供了模型与数据拟合优度的度量,以及不必要复杂度的度量。AIC 考虑了模型简洁性和拟合优度之间的权衡,而有些指标只衡量准确性。AIC 值越低,数据与模型的拟合度越好,使用的参数越少。 这在 AIC 中特别有用,因为它涉及评估具有不同数量预测变量的模型。对复杂性的惩罚阻止了过度拟合,这是数据建模中的主要问题。 嵌套模型与非嵌套模型AIC 的主要优点之一是模型比较可以包含嵌套(一个模型是另一个模型的子集)和非嵌套(模型指代不同的结构)模型比较形式。这对于构建各种形式模型的实践至关重要。一个例子是,在逻辑回归中,可以选择添加不同组合的预测变量。 AIC 允许分析师对所有模型进行排名,不一定基于传统的假设检验。如果所有模型都拟合相同的数据,也可以直接比较不同模型的 AIC 值。这是因为它为研究人员提供了更大的自由度,可以采用更具创新性的建模技术,因为他们不会受到结构约束的限制。 ΔAIC 和模型排名的含义孤立地看,AIC 并不表示绝对结果。相反,解释的是模型的 ΔAIC(Delta AIC)分数。当 AIC 小于 2 时,模型应被视为彼此合理相等。ΔAIC 在 4 到 7 之间表明对更优模型的适度支持,而 ΔAIC 大于 10 则表明强烈反对 ΔAIC 较大的模型。 这种排名方法有助于根据相对证据而不是任意阈值线来选择模型。它特别适用于生态学或医学等领域,在这些领域中,决策的性质可能很重要,但决策过程必须透明且可重现。 AIC 的限制和不适用情况尽管 AIC 功能强大,但它并非适用于所有情况。它假设模型似然性规范正确,并且观测值的分布是独立同分布 (i.i.d)。如果这些假设失败,即当时间序列数据高度自相关时,AIC 可能导致模型排名有偏差。 AIC 不考虑模型在以前未见过的数据上的表现。在这种情况下,诸如 BIC 或 AICc(校正后的 AIC)之类的信息准则更适合。分析师不应将 AIC 作为唯一的分析工具,而应与领域知识、残差分析和其他模型检查结合使用。 结论总之,AIC 是最有效和最流行的模型选择方法之一,它倡导准确性和简洁性。它能够成功比较多个模型,做出更好的决策,并防止过拟合。尽管存在局限性,但当与所有领域(例如金融、医疗甚至机器学习)的其他验证方法结合使用时,AIC 可以有效提高统计建模的可靠性,因此仍然是任何数据驱动的专业人士或研究人员的重要工具。 下一主题使用机器学习预测心脏病 |
我们请求您订阅我们的新闻通讯以获取最新更新。