人工智能中的贝叶斯定理

10 Jun 2025 | 10分钟阅读

贝叶斯定理也称为贝叶斯规则、贝叶斯定律或贝叶斯推理,它确定了在知识不确定性下的事件的概率。

在概率论中,它关系到两个随机事件的条件概率和边缘概率。

贝叶斯定理以英国数学家托马斯·贝叶斯的名字命名。贝叶斯推理是贝叶斯定理的一个应用,它是贝叶斯统计的基础。

它是一种在知道P(A|B)的情况下计算P(B|A)值的方法。

贝叶斯定理允许通过观察来自现实世界的新信息来更新事件的概率预测。

贝叶斯定理的核心概念

贝叶斯定理假定概率可以根据新的信息而改变。构成贝叶斯推理的要素是先验概率、似然性、后验概率和归一化常数,它们是贝叶斯推理最重要的实体。

先验概率

对一个事件概率的初始猜测(通常称为“先验”)是在不考虑新证据的情况下,关于事件可能性的初步假设。它是在特定时间点上,相对于历史事实或直觉,我们对事物状态的假设或知识的进步。

例如,一个医生可能最初有机会知道某个病人是否患有某种疾病,因为这种疾病已经或尚未影响到人群中的个体。

似然度

似然性是关于某个假设的证据的假定确认的指标。如果你认为一个假设是正确的,那么看到观察到的数据的几率。

例如,如果一个诊断测试能在95%的情况下正确检测出疾病,那么一个人如果患有该疾病,检测结果呈阳性的概率将是0.95。

后验概率

后验概率是通过新证据对特定假设进行的重新评估。它是先验概率乘以似然性,它告诉我们相信给定数据的准确性。

数学上

P(假设 | 证据) = P(证据 | 假设)⋅P(假设) / P(证据)

在这里,P(假设 | 证据) 是后验概率。

归一化常数

确保概率之和为一

归一化常数将确保所有可能的假设的概率之和等于一。所有假设的概率之和以及每个假设的概率。

数学上

P(证据) = ∑i P(证据 | 假设i) ⋅ P(假设i)

这是另一个使后验概率答案的真实性和可理解性成为可能的标题。

示例

如果癌症与年龄相关,那么通过使用贝叶斯定理,我们可以根据年龄更准确地确定患癌症的概率。

贝叶斯定理可以通过乘法规则和已知事件B的事件A的条件概率推导出来

根据乘法规则,我们可以写成

P(A ∩ B) = P(A|B) P(B) 或

类似地,已知事件A的事件B的概率

P(A ∩ B) = P(B|A) P(A)

将两个方程的右侧相等,我们将得到

Bayes' Theorem in Artificial Intelligence

上述方程(a)称为贝叶斯规则或贝叶斯定理。这个方程是大多数现代人工智能系统进行概率推理的基础。

它显示了联合概率和条件概率之间的简单关系。这里,

P(A|B) 称为后验概率,是我们试图计算的,它表示当我们遇到了证据 B 时,假设 A 为真的概率。

P(B|A) 称为似然性,其中我们假设假设为真,然后计算证据的概率。

P(A) 称为先验概率,即在考虑证据之前假设的概率。

P(B) 称为边缘概率,即一个事件的纯粹概率。

在方程(a)中,一般地,我们可以写 P(B) = P(A)⋅P(B|Ai);因此,贝叶斯规则可以写成

Bayes' Theorem in Artificial Intelligence

其中 A1, A2, A3,........, An 是一组互斥且完备的事件。

贝叶斯定理在人工智能中的作用

不确定性下的决策

  • 信念的动态更新:根据贝叶斯定理的方式,人工智能系统可以提供最初的观点(先验概率),并根据新出现的信息(似然性)的条件来重新考虑提供的观点。事实上,在自动驾驶汽车的情况下,它们可以回顾并根据传感器数据确定潜在障碍物的预先概率;在这种情况下,系统可以专注于制动、转向或加速。
  • 概率推理:相反,在确定性方法中,贝叶斯定理并非独一无二,因为它可以描述量化不确定性的不确定性。例如,在医疗诊断中,对于症状,提供了疾病的概率,即为医生指明了正确的检查或治疗方向,这提高了决策的信任度。
  • 在机器人技术中的应用:机器人通常在混乱的环境中工作。在导航等任务中,贝叶斯推理在支持决策方面非常有用,因为传感器可能提供的信息是嘈杂的或不足的,机器人可以采取最可能的路线来到达目的地。

数据驱动学习

  • 用于模型训练的贝叶斯推理:贝叶斯推理是将先验知识和数据结合起来计算后验分布的一种应用,后验分布是对模型参数的概率推理。这非常有用,尤其是在缺乏丰富数据的情况下,因为它不会让模型对自己呈现的内容过于自信。
  • 持续学习:在实时系统中,如自适应用户界面或推荐引擎,贝叶斯定理促进了持续学习。例如,一个预测用户偏好的人工智能可以在收集更多交互数据时不断改进其模型。
  • 特征选择和降维:贝叶斯技术有助于识别给定问题最相关的特征,降低模型复杂性同时保持其准确性。这种能力对于图像识别等应用至关重要,因为这些数据集具有高维特征空间。

预测建模和风险评估

  • 风险评估模型:人工智能系统采用的贝叶斯计算用于预测发生不利事件的概率。例如,在金融领域,预测模型将提供信贷违约或市场崩溃的可能性。这是机构需要具备的准备,以便为可能随时出现的威胁做好应对。
  • 个性化预测:贝叶斯程序可以根据个体的信息进行个性化数据判断。例如,在个性化医疗保健的情况下,个体对治疗反应的可能性是从贝叶斯模型中得出的,因此可以制定更具指导性的治疗策略。
  • 情景分析:贝叶斯定理被发现可以轻松地进行情景分析,因为只需输入不同的数字,所需的计算结果就会自动得出,无需额外努力。例如,供应链管理部门通过过去的趋势和必要条件来为可能发生的颠覆做好准备;因此,企业将提前做好准备。

应用贝叶斯规则

贝叶斯规则允许我们用 P(A|B)、P(B) 和 P(A) 来计算单个项 P(B|A)。这在我们可以很好地估计这三个项的概率并想确定第四个项时非常有用。假设我们想感知某些未知原因的影响并想计算该原因,那么贝叶斯规则将变为

Bayes' Theorem in Artificial Intelligence

示例 1

问题:患者有颈部僵硬,患脑膜炎的概率是多少?

已知数据

一位医生知道脑膜炎这种疾病会导致患者出现颈部僵硬,这种情况发生在80%的病例中。他还知道一些其他事实,如下所示:

  • 已知患者患有脑膜炎的概率为1/30,000。
  • 已知患者有颈部僵硬的概率为2%。

令 a 为患者有颈部僵硬的命题,令 b 为患者患有脑膜炎的命题。因此,我们可以计算如下:

P(a|b) = 0.8

P(b) = 1/30000

P(a) = 0.02

Bayes' Theorem in Artificial Intelligence

因此,我们可以假设每750名患者中就有1名患有脑膜炎并伴有颈部僵硬。

示例 2

问题:从一副标准的扑克牌中抽取一张牌。抽到国王的概率是4/52,那么计算后验概率 P(King|Face),意思是抽到的牌是人头牌,且是国王的牌。

解决方案

Bayes' Theorem in Artificial Intelligence

P(king):抽到国王的概率 = 4/52 = 1/13

P(face):抽到人头牌的概率 = 3/13

P(Face|King):假设抽到的是国王,那么它是人头牌的概率 = 1

将所有值代入方程(i),我们将得到

Bayes' Theorem in Artificial Intelligence

贝叶斯定理在人工智能中的应用

自然语言处理(NLP)

使用朴素贝叶斯分类器进行垃圾邮件检测

这是贝叶斯定理的一个应用,它帮助朴素贝叶斯分类器区分垃圾邮件和非垃圾邮件。

  • 机制:分类器会监控电子邮件中的某些词语或短语,以确定它是否是垃圾邮件。
  • 示例:根据“优惠”和“免费”等词语在垃圾邮件或非垃圾邮件中出现的频率,算法会判断一封未读邮件是垃圾邮件的可能性。

情绪分析

其目的是判断文本是积极的、消极的还是中性的。

  • 机制:为了确定情感,贝叶斯会检查并计数在给定检查数据中找到的关键词。
  • 示例:当某人将一条帖子描述为“极好”或“糟糕”时,算法会使用这些词作为分类它的术语。

计算机视觉

图像识别和分类

应用贝叶斯方法有助于显示图像识别结果的确定性水平。

  • 机制:图像的特征被用来根据其概率给它一个标签和可能性。
  • 示例:通过贝叶斯技术,汽车可以通过查看捕获数据中收到的示例来识别交通标志。

机器人技术

定位和建图 (SLAM)

使用 SLAM 的机器人依靠贝叶斯定理来绘制环境地图和导航。

  • 机制:传感器产生的越多数据,贝叶斯推理就越能更新机器人的位置和地图。
  • 示例:在仓库中,SLAM 负责让机器人搬运货物,选择一条避开沿途任何障碍物的路线。

医疗保健

疾病预测模型

如果我们查看患者的症状,使用各种测试的结果并回忆之前的估计,贝叶斯定理有助于更准确地预测疾病。

  • 机制:过去类似的病例被用来预测当前患者的成功治疗。
  • 示例:在肿瘤学中,通过贝叶斯方法为患者推荐化疗。

个性化医疗

贝叶斯模型通过根据患者的基因和健康记录提供个性化治疗来提供帮助。

  • 机制:过去类似的病例被用来预测当前患者的成功治疗。
  • 示例:在肿瘤学中,通过贝叶斯方法为患者推荐化疗。

推荐系统

动态用户偏好预测

推荐系统依赖贝叶斯定理进行推荐。

  • 机制:它们使用某人的过去互动数据和进一步的详细信息来确定他们喜欢该产品的可能性。
  • 示例:它依赖于贝叶斯方法来观察用户的活动并选择他们喜欢的电影来推荐新节目。

在人工智能中使用贝叶斯定理的优点和挑战

贝叶斯理论通过提供一种思考数据不完整情况的方式来帮助人工智能。虽然它很有益,但确实存在一些缺点。要成功地在人工智能中使用贝叶斯定理,必须了解其优点和缺点。

优点

对少量数据的鲁棒性

即使几乎没有证据,贝叶斯定理也能产生有用的结果。与大多数形式的机器学习不同,贝叶斯方法可以处理较少的观察。

示例

通常,当样本量较少时,贝叶斯模型会分析有限数据,并根据过去的观察率和一些测试结果预测疾病的可能性。

概率模型的可解释性

该定理产生概率形式的结果,这使得利益相关者更容易理解模型的预测。透明度在医疗保健和金融等活动中非常有帮助。

  • 关键特性:它清楚地显示了新的发现(数据)如何有助于更新关于决策过程的先有信念。
  • 实际应用:贝叶斯方法用于欺诈检测系统,以帮助解释为什么某笔交易被检测为可疑。

由于人工智能是可解释的,人们信任它并做出明智的决定。

挑战

计算复杂性

使用贝叶斯推理很复杂,尤其是在有许多参数和大量数据的情况下。为了执行这些计算,统计学家通常使用 MCMC,这需要大量的时间和精力。

  • 影响:贝叶斯技术可能很慢,因此很少用于实时系统。
  • 可能解决方案:虽然它们不能给出精确的结果,但变分推理和 PyMC3 或 Stan 等工具有助于缩短贝叶斯计算所需的时间。

对精确先验的依赖

贝叶斯模型的准确性在多大程度上取决于用作先验知识的概率。如果使用的先验不正确或不完全合适,模型中的信息可能会产生误导,并且可能无效。

挑战示例:在新领域数据很少的情况下,设定合适的先验并不容易,可能依赖于个人意见。

缓解策略

  • 当没有先验知识时,不要使用先验,因为这会产生更平均的结果。
  • 使用分层贝叶斯模型根据可用数据计算先验。

因此,专家建议验证模型并确保对该领域有深入的了解。