最大似然估计简介

2025年2月3日 | 阅读 8 分钟

在统计评估领域,最有力的参数估计工具之一是最大似然估计(MLE)。MLE 是一种方法,它允许统计学家以最大化观察到给定数据的可能性来估计模型的参数。该方法不仅因其效率和一致性而被广泛使用,而且还因其在处理各种类型数据和模型方面的灵活性而被广泛使用。

什么是最大似然估计?

最大似然估计(MLE)是一种用于估计统计模型参数的统计方法。它包括找到最大化似然函数(衡量在给定参数值下观察到给定数据的可能性)的参数值。

似然函数

在统计分析中,似然函数是用于估计统计模型参数的重要概念。它是最大似然估计(MLE)的基石,MLE 是一种在经济学、生物学、工程学和机器学习等众多领域广泛采用的技术。理解似然函数对于任何从事数据分析和统计建模的人来说都至关重要。

什么是似然函数?

在统计分析中,似然函数是用于估计统计模型参数的重要概念。它是最大似然估计(MLE)的基石,MLE 是一种在经济学、生物学、工程学和机器学习等众多领域广泛采用的技术。理解似然函数对于任何从事数据分析和统计建模的人来说都至关重要。

什么是似然函数?

似然函数是给定一组观测数据的情况下,统计模型参数的函数。与概率函数(它是给定参数的数据的函数)不同,似然函数颠倒了这种关系。它衡量了对于不同参数值观察到给定数据的可能性。

形式化定义

假设我们有一组观测值 {X = x1, x2, x3, x4, ……., xn} 和一个由 θ 参数化的统计模型。似然函数 L(θ ; X) 定义为:L(θ ; X) = P(X ∣ θ)

这里,P(X ∣ θ) 表示在给定参数 θ 下观察到数据 X 的概率。

似然函数的性质

  • 非负性:似然函数始终是非负的,即 L(θ ; X) ≥ 0 对于所有 θ 成立。
  • 相对度量:似然函数是相对度量,而不是绝对概率。它允许比较不同的参数值,以确定哪个参数值最有可能产生观察到的数据。
  • 参数空间:似然函数定义在整个参数空间上,允许对不同参数值进行评估。

示例:二项分布

考虑一个简单示例,我们有一组数据,表示一系列伯努利试验(例如,抛硬币)中的成功次数。令 X 为 n 次试验中成功的次数,令 p 为每次试验成功的概率。此二项分布的似然函数为

Introduction to Maximum Likelihood Estimation

在这种情况下,θ 是参数 p,似然函数 L(p ; X) 给出在给定不同 p 值的情况下,n 次试验中观察到 X 次成功的可能性。

对数似然函数

在实践中,处理对数似然函数通常更方便,它是似然函数的自然对数。对数转换简化了涉及的算术,特别是在最大化似然时

ℓ(θ ; X) = logL (θ ; X)

对于二项示例,对数似然函数将是

Introduction to Maximum Likelihood Estimation

为什么使用对数似然函数?

转换为对数似然函数具有几个优点

  • 将乘法化为加法:似然函数通常涉及概率的乘积,尤其是在处理独立观测值时。取对数将这些乘积转换为和,使数学运算更易于处理。
  • 数值稳定性:对数有助于处理可能随着大型数据集出现的大量非常小的概率。小概率的乘积可能变得非常小,可能导致数值下溢。对数通过将这些乘积转换为更稳定的和来防止这种情况。
  • 更容易求导:对数似然函数简化了寻找最大值或最小值的方法。与似然函数的导数相比,对数似然函数的导数更容易处理,这有助于 MLE 中的优化过程。

最大化似然函数

最大似然估计的目标是找到最大化似然函数的参数值。这包括对参数求对数似然函数的导数,将导数置零,然后求解参数。

似然函数的应用

  • 参数估计:似然函数用于估计各种概率分布(例如,正态、二项、泊松)的参数。
  • 模型比较:似然比可用于比较不同的模型或假设。
  • 推断:基于似然的方法构成了统计推断技术的基础。

MLE 过程

最大似然估计(MLE)是统计推断的基石,它提供了一种估计统计模型参数的方法。MLE 技术包含几个关键步骤,从定义模型到找到最大化似然函数的参数值。在此,我们描述了 MLE 的分步过程,使其易于理解。

步骤 1:定义模型

MLE 过程的第一步是指定统计模型。这包括确定

  • 描述数据的概率分布。
  • 需要估计的分布参数。

示例:假设我们正在研究一组来自未知均值 μ 和已知方差的正态分布的数据。

步骤 2:构建似然函数

接下来,我们构建似然函数,它表示给定数据作为参数函数的观测概率。对于一组观测值 X = {x1, x2, x3, x4, ………., xn},似然函数 L(θ ; X) 是给定参数 θ 的观测数据的联合概率。

步骤 3:转换为对数似然函数

为了简化优化过程,我们取似然函数的自然对数以获得对数似然函数。对数转换将概率的乘积转换为和,这在数学上更容易处理。

步骤 4:对对数似然函数求导

下一步是求对数似然函数相对于参数的导数,以找到关键点。这些导数称为得分函数,它们指示了对数似然函数如何随参数变化。

示例:对数似然函数相对于 的导数

Introduction to Maximum Likelihood Estimation

步骤 5:将导数置零

为了找到对数似然函数的最大值,我们将得分函数(导数)置零。这将产生似然方程,我们求解这些方程以获得参数估计。

示例:将导数置零得到

Introduction to Maximum Likelihood Estimation

步骤 6:求解参数

最后,我们求解似然方程以找到最大化对数似然函数的值的参数。

示例:求解 μ 的方程得到

Introduction to Maximum Likelihood Estimation

因此,μ 的 MLE 是样本均值。

总结

MLE 过程包括定义模型、构建似然函数、将其转换为对数似然函数、求导、将导数置零以及求解参数。通过遵循这些步骤,我们可以估计在所需模型下最可能产生观测数据的参数。

应用

MLE 被广泛应用于各个领域,包括

1. 经济学

在经济学中,MLE 用于估计经济模型的参数,使经济学家能够对经济行为和趋势做出预测和推断。

  • 回归分析:MLE 用于估计回归模型(例如,线性回归和逻辑回归)中的参数。这些模型有助于理解变量之间的关系并进行预测。
  • 时间序列分析:经济学家使用 MLE 来估计时间序列模型(例如,ARIMA 模型)的参数,这些模型对于分析和预测 GDP、通货膨胀和股票价格等经济指标至关重要。

2. 生物学

生物学家和生态学家利用 MLE 来估计各种生物模型中的参数,从而有助于研究种群动态、遗传学和进化过程。

  • 群体遗传学:MLE 用于估计等位基因频率和其他遗传参数,这对于理解种群的遗传变异和进化历史至关重要。
  • 增长模型:使用 MLE 来估计生长模型(例如,逻辑增长模型)的参数,以研究种群或个体生物的生长模式。

3. 工程学

在工程学中,MLE 应用于可靠性分析和系统建模,帮助工程师设计更可靠、更高效的系统。

  • 可靠性工程:MLE 用于估计寿命分布(例如,指数分布、威布尔分布)的参数,以评估组件和系统的可靠性和故障率。
  • 信号处理:工程师使用 MLE 来估计信号处理模型中的参数,从而提高通信和雷达系统的准确性。

4. 机器学习

MLE 是训练各种机器学习模型的基础,确保模型与数据很好地匹配。

  • 分类模型:使用 MLE 训练逻辑回归和其他分类模型,以优化参数以准确分类数据点。
  • 神经网络:MLE 用于通过优化权重和偏差来训练神经网络,以最大化观测训练数据的可能性。

5. 医学研究

在医学研究中,MLE 对于分析临床试验数据和理解治疗效果至关重要。

  • 生存分析:MLE 用于估计生存模型(例如,Cox 比例风险模型)中的参数,这些模型用于研究事件发生时间(例如,疾病复发时间)的数据。
  • 药代动力学:使用 MLE 来估计描述药物在体内如何被吸收、分布、代谢和排泄的药代动力学模型的参数。

6. 环境科学

环境科学家采用 MLE 来估计描述环境过程的模型中的参数,并评估环境变化的影响。

  • 生态模型:MLE 用于估计物种分布和丰度模型的参数,以支持保护工作和生物多样性研究。
  • 气候模型:使用 MLE 来估计气候模型中的参数,以提高天气预报的准确性并评估气候变化的影响。

7. 金融

在金融领域,MLE 用于估计描述金融市场和工具的模型中的参数。

  • 风险管理:MLE 用于估计风险模型(例如,风险价值 (VaR) 模型)中的参数,以评估和管理金融风险。
  • 期权定价:使用 MLE 来估计期权定价模型(例如,Black-Scholes 模型)的参数,以确定金融衍生品的公允价值。

下一主题回归分析