贝叶斯深度学习简介

2024 年 8 月 28 日 | 阅读 6 分钟

引言

在本教程中,我们将学习贝叶斯深度学习的入门知识。可以通过使用贝叶斯接口来检查神经网络的概率。我们可以通过对标准神经网络工具进行一些简单的修改来近似解决这个概念性问题。

贝叶斯定理是数据科学的一部分。它还包括以下学科:计算机科学、统计学和概率论。该定理用于根据可用的重要数据计算事件发生的概率。与此同时,贝叶斯推理利用贝叶斯定理来改变假设的概率,当面对额外数据时。

贝叶斯深度学习是一个新兴领域,它将贝叶斯方法的模型不确定性与深度学习的表示能力相结合。结合这两个概念为解决许多深度学习问题提供了一个框架,例如过拟合问题、加权不确定性问题、模型比较等。

贝叶斯深度学习有时也被称为贝叶斯神经网络。本教程主要教授贝叶斯深度学习的基本入门知识。我们还学习了与此主题相关的方法、发展以及许多其他内容。

什么是贝叶斯深度学习?

贝叶斯深度学习简称为 BDL。它依赖于深度学习理论和贝叶斯概率论。与此同时,贝叶斯推理对于统计学和概率分布机器学习很重要。概率主要用于模型学习、不确定性和可观察状态。贝叶斯深度学习 (BDL) 的主要目标是为深度学习提供不确定性估计。

贝叶斯深度学习是一个新兴领域,它将贝叶斯方法的模型不确定性与深度学习的表示能力相结合。贝叶斯深度学习一直令人着迷又令人畏惧。神经网络中的不确定性用于衡量预测模型的准确性。贝叶斯建模中主要有两种不确定性,如下所述 -

1. 固有不确定性 (Aleatoric uncertainty)

固有不确定性是贝叶斯建模中不确定性的一部分。它主要用于测量观察过程中固有的噪声。例如传感器噪声。传感器噪声在数据集中可能均匀分布。即使收集更多数据,也无法减少这种不确定性。

2. 模型不确定性 (Epistemic uncertainty)

模型不确定性是贝叶斯建模中不确定性的另一部分。这种不确定性是由模型本身引起的,也称为模型不确定性。它捕获了我们对所收集数据(模型生成的数据)的理解需求。通过收集更多数据,我们可以减少这种不确定性。

因此,BDL 模型通常通过定位样本权重的分布或学习直接的概率图来估计不确定性。模型不确定性通过对样本权重进行初步分布来建模。它还可以捕获这些权重随数据变化的程度。另一方面,固有不确定性通过提供输出分布来建模,并且它也用于测量给定数据集的噪声。

许多数据科学家认为将机器学习、贝叶斯学习和神经网络结合起来是一种成功的应用。然而,贝叶斯神经网络通常非常难以训练。通过使用反向传播方法,我们可以轻松训练任何神经网络。我们通常使用贝叶斯与反向传播结合来训练 BNN,即贝叶斯神经网络。

什么是贝叶斯推理和边缘化?

贝叶斯接口是学习过程。它用于找出后验分布。这与通过优化方差来找到最佳值相反。另一方面,要计算总的最终值,我们需要对整个参数空间进行边缘化。但这通常是不可能的,因为我们可能有无数个这样的数据集。因此,贝叶斯方法使用边缘化而不是优化技术。

后验中的复杂积分导致了许多需要运行参数值的变量。贝叶斯接口通常使用马尔可夫链蒙特卡洛 (MCMC) 或微分方程等采样方法,而不是梯度下降。这些策略试图在使用更简单的分类之后进行建模。变分自编码器 (VAEs) 是一种近似复杂分布以进行归一化流的新方法。

贝叶斯深度学习的优势是什么?

最近,许多人尝试将神经网络的优势与贝叶斯方法相结合。贝叶斯深度学习具有各种优势,如下所述 -

1. 插值

插值是贝叶斯学习的一个重要优势。贝叶斯学习的工作包括纯粹的架构。在面临学习问题时,需要在人类和计算机应投入多少时间和精力之间做出选择。当你构建一个设计的机器时,你会创建一个地球模型并在该模型中找到一个好的控制器。

贝叶斯方法通过“思考良好”(指在世界之前学习模式)和“接下来思考”(指事后思考)来插值这个极端位置。许多其他机器学习方法仍然需要这种保证。

2. 直觉

直觉是贝叶斯深度学习的另一个优势。贝叶斯学习涉及两个操作,即先验和积分。这些操作通常很有用。

3. 语言

语言是贝叶斯深度学习的另一个优势。贝叶斯和近贝叶斯学习技术都有一个关于之前和之后表达的关联语言。这在处理“艰难思考”解决方案时很有用。

贝叶斯深度学习的缺点是什么?

不确定性估计,尤其是在医疗保健、汽车等领域,对于决策过程至关重要。在贝叶斯深度学习中,存在各种缺点,如下所述 -

1. 计算不可行性

计算不可行性是贝叶斯深度学习 (BDL) 的一个缺点。假设你可以准确预测房间里的每一个空气分子。但是,计算后验可能需要很长时间。这种困难意味着需要进行计算预测。

2. 理论不可行性

理论不可行性是贝叶斯深度学习的另一个缺点。事实证明,先验规范需要大量工作。在这里,我们需要为模型参数的每个设置指定实数。许多熟悉贝叶斯学习的人出于某些原因(如下所述)并未看到这种困难 -

  1. 他们懂允许先验规范的语言。获取此信息需要付出巨大的努力。
  2. 他们在撒谎。他们实际的先验并没有事先指定。

3. 非自动化

非自动化是贝叶斯深度学习的另一个缺点。“批判性思维”是“贝叶斯就业”规则中贝叶斯研究的一部分。随着新的学习问题的出现,贝叶斯确保工程师必须解决它们。

BDL(贝叶斯深度学习)的未来发展是什么?

在这里学习 BDL(贝叶斯深度学习)的未来发展。贝叶斯深度学习定理用于根据可用的重要数据计算事件发生的概率。它依赖于深度学习理论和贝叶斯概率论。

在这里,我们主要学习 BDL 的未来发展。过去,计算效率一直是贝叶斯深度学习 (BDL) 广泛使用的主要障碍。缺乏公开可用的软件包。近期的举措已朝着解决这些问题迈出了坚实的一步。

例如,在硬件和软件方面已经做了大量工作来加速,并且开发了 Edward 等新的软件包,专门用于设计和理论。

未来,我们预计 BNN 在小数据、批处理学习和模型压缩方面将取得进展。更广泛地说,将基于 BDL 的通用范围进行进一步的研究。贝叶斯深度学习利用其在各种调整问题中重现图像结构的能力。例如,计算机视觉和自然语言处理。

结论

在本教程中,我们将学习贝叶斯深度学习的入门知识。贝叶斯深度学习是一个新兴领域,它将贝叶斯方法的模型不确定性与深度学习的表示能力相结合。贝叶斯深度学习一直令人着迷又令人畏惧。这也可能令人失望,因为它基于对正在发生的事情的大量猜测。

它还可以从少量数据中学习,然后告知我们预测的不确定性。在这里,我们还讨论了贝叶斯深度学习的优缺点。如果需要解决问题,贝叶斯主义者应该致力于解决它,并且很有可能解决它。

总之,贝叶斯深度学习可以为将不确定性整合到深度神经网络的预测中提供一个框架。