最大似然估计17 Mar 2025 | 4 分钟阅读 密度估计是估计问题域中数据子集的概率分布的过程。密度估计可以使用各种策略来解决,但最大似然估计(MLE)是机器学习中常用的范例。 最大似然的目标是找到最佳方式将分布拟合到数据中。 似然度似然(Likelihood)涵盖了如何发现特定特征或场景下数据的最佳分布,而概率(Probability)则说明了如何在给定数据样本分布的情况下计算某事的可能性。 例如,如果我们想知道老鼠体重超过 34 克的可能性,我们将编辑下图左侧的部分。右侧指定了分布的形状和位置,保持不变。 鉴于我们称量了一只 34 克的老鼠,均值 = 32,标准差 = 2.5 的分布的概率很高。如你所见,右侧的测量值保持不变,但我们可以改变左侧分布的形状和位置。 MLE 的概念最大似然分类的主要目标是预测使观测数据 x 的似然最大化的类别标签 y。我们将假设 x 是一个随机向量,y 是一个影响 x 分布的非随机参数。首先,我们必须对 x 的分布做出假设(通常是高斯分布)。 然后,我们的数据学习包括以下内容:
当对新的数据向量 x 进行预测时
让我们从一个简单的例子开始,只有一个一维输入 x 和两个类别:y = 0 和 y = 1。 假设我们在 y = 0 和 y = 1 两种情况下都计算了我们的参数,得到了上面所示的两个 PDF。蓝色图 (y = 0) 的均值 μ=1,标准差 σ=1,而橙色图 (y = 1) 的 μ=-2,σ=1.5。为了预测给定新数据点 x = -1 的标签 y,我们分析两个 PDF:fy=0(-1)≈0.05 和 fy=1(-1)≈0.21。最高结果 0.21 是在考虑 y = 1 时获得的,因此我们预测标签 y = 1。 这是一个简单的例子,但在实际情况中,我们会有更多的输入因子用于进行预测。因此,我们需要一个具有以下 PDF 的多元高斯分布 ![]() 其中
为了使用这种方法,协方差矩阵 (Σ) 必须是正定、对称且具有正特征值。协方差矩阵 (Σ) 包含 x 的所有分量对之间的协方差:Σij=cov(xi,xj)。因此它是一个对称矩阵,因为 cov(xi,xj)=cov(xj, xi),我们只需验证所有特征值都是正的;否则,我们将显示一个警告。如果观测值多于变量,并且变量之间没有很高的相关性,则此条件应该满足,Σ 应该是正定的。 现在,我们将实现它。 代码 导入库读取数据集输出 ![]() 这些数据与社交网络广告相关,其中包括社交网络成员的性别、年龄和预期工资。性别是一个分类列,在将数据提供给学习器之前需要进行标签和编码。 输出 ![]() 编码结果存储在一个名为 gender 的新特征中,原始数据保持不变。为了训练和验证学习器,将数据分为训练集和测试集。 输出 ![]() 输出 ![]() 上图中显示特征年龄与预测之间关系的“学习器线”是根据最大似然估计原理创建的,该原理帮助逻辑回归模型对结果进行分类。因此,在后台,算法选择一个按年龄缩放的检测到“1”的概率,并利用它来计算观察到“0”的概率。这将适用于所有数据点,并最终将线上提供的数据的所有似然相乘。乘法过程持续进行,直到识别出最高概率或最佳拟合线。 下一个主题核主成分分析 (KPCA) |
机器学习是 IT 界最受欢迎的技术之一,也已成为大多数初创公司和其他组织的首选。所有公司都希望实现业务自动化,而机器学习通过开发智能软件帮助他们实现这一目标...
阅读 6 分钟
机器学习中有许多集成模型的方法,例如Bagging、Boosting和堆叠。堆叠是最流行的集成机器学习技术之一,用于预测多个节点以构建新模型并提高模型性能。堆叠使我们能够训练...
7 分钟阅读
在这个技术驱动的时代,机器学习和分布式计算是世界上最令人印象深刻的进步。这两种创新都为小型和大型组织发展其业务发挥着关键作用。人工智能协助客户进行预测和开发能够自动改进...的人工智能。
阅读9分钟
我们生活在一个科技时代,一切都与技术息息相关。机器学习也是计算机科学领域最流行的技术之一,它使计算机能够从过去的经验中自动学习。此外,机器学习在 IT 领域需求量很大……
阅读 6 分钟
机器学习 (ML) 领域是多方面的,包含各种为 ML 技术的开发、实施和进步做出贡献的角色。该领域中的两个关键角色是系统学习工程师和设备掌握研究员。尽管他们共同的目标是利用...
阅读 6 分钟
什么是核方法?核方法是一组用于机器学习中解决分类、回归和其他预测问题的技术。它们围绕核的概念构建,核是衡量两个数据点之间相似程度的函数……
阅读 6 分钟
机器学习中的回归与分类回归和分类算法都是监督学习算法。这两种算法都用于机器学习中的预测,并且都使用标记数据集。但它们之间的区别在于如何用于不同的机器学习问题。主要区别在于……
阅读 3 分钟
一种称为动态定价的定价方法包括根据当前市场条件调整价格。它是一种定价策略,可以实时响应供需变化、竞争对手价格、客户行为和其他市场条件。这可能涉及客户需求、竞争对手……
阅读9分钟
几何模型可以是系统或元素的数学模型,它使用几何来解释其属性和连接。在机器学习中,几何模型可用于以易于分析的方式表示信息……
阅读 6 分钟
机器人以其出色的任务执行自主性一直吸引着我们。随着技术的发展,机器学习 (ML) 和机器人技术的融合开启了一个前所未有的可能性领域。ML 算法使机器人能够通过经验获取知识,快速适应……
阅读 4 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India