深度学习教程

17 Mar 2025 | 6 分钟阅读

深度学习是机器学习的一个分支,而机器学习又是人工智能的一个子集。由于神经网络模仿人脑,所以深度学习也会如此。在深度学习中,没有任何东西是明确编程的。基本上,它是一种机器学习类别,利用大量的非线性处理单元来执行特征提取和转换。每个前一层输出的输出都被每个后续层作为输入。

深度学习模型能够通过程序员的少量指导来专注于准确的特征,并且在解决维度问题方面非常有用。深度学习算法尤其在我们有大量输入和输出时使用。

由于深度学习是由机器学习演变而来的,而机器学习本身又是人工智能的一个子集,并且人工智能背后的理念是模仿人类行为,因此“深度学习的理念是构建可以模仿大脑的算法”。

深度学习通过神经网络实现,而神经网络的动机来源于生物神经元,即脑细胞。

深度学习是机器学习统计技术的集合,用于学习基于人工神经网络的特征层次结构。

所以基本上,深度学习是通过深度网络实现的,而深度网络就是具有多个隐藏层的神经网络。

深度学习示例

Deep Learning Tutorial

在上面的示例中,我们将图像的原始数据提供给输入层的第一层。然后,这些输入层将根据颜色、亮度等来确定局部对比度模式。然后,第一个隐藏层将确定面部特征,即它将固定在眼睛、鼻子和嘴唇等上。然后,它会将这些面部特征固定到正确的面部模板上。因此,在第二隐藏层中,它实际上会在这里确定正确的面部,如上图所示,之后它将被发送到输出层。同样,可以添加更多的隐藏层来解决更复杂的问题,例如,如果你想找出具有大或浅肤色的特定类型面部。因此,随着隐藏层的增加,我们能够解决更复杂的问题。

架构

  • 深度神经网络
    它是一种神经网络,它包含一定级别的复杂性,这意味着输入层和输出层之间包含多个隐藏层。它们在建模和处理非线性关联方面非常高效。
  • 深度信念网络
    深度信念网络是一种深度神经网络,它由多层信念网络组成。
    执行 DBN 的步骤
    1. 借助对比散度算法,从可感知的单元学习特征层。
    2. 接下来,将先前训练的特征视为可见单元,执行特征学习。
    3. 最后,当最终隐藏层的学习完成后,整个 DBN 就被训练好了。
  • 循环神经网络
    它允许并行和顺序计算,并且与人脑(连接神经元的大型反馈网络)完全相似。由于它们能够回忆所有与接收到的输入相关的必要事物,因此它们更精确。

深度学习网络的类型

Deep Learning Tutorial

1. 前馈神经网络

前馈神经网络不过是一种人工神经网络,它确保节点不形成循环。在这种神经网络中,所有感知器都组织在层内,以便输入层接收输入,输出层生成输出。由于隐藏层不与外部世界连接,因此它被称为隐藏层。单个层中包含的每个感知器都与后续层中的每个节点相关联。可以得出结论,所有节点都完全连接。它在同一层中的节点之间不包含任何可见或不可见的连接。前馈网络中没有反向循环。为了最小化预测误差,可以使用反向传播算法来更新权重值。

应用

  • 数据压缩
  • 模式识别
  • 计算机视觉
  • 声纳目标识别
  • 语音识别
  • 手写字符识别

2. 循环神经网络

循环神经网络是前馈网络的另一种变体。这里,隐藏层中的每个神经元都以特定的时间延迟接收输入。循环神经网络主要访问现有迭代的先前信息。例如,要猜测任何句子中的下一个单词,必须了解以前使用的单词。它不仅处理输入,还在时间上共享长度和权重。它不会让模型的规模随着输入规模的增加而增加。然而,这种循环神经网络唯一的问题是它的计算速度慢,并且它不考虑当前状态的任何未来输入。它在回忆先前信息方面存在问题。

应用

  • 机器翻译
  • 机器人控制
  • 时间序列预测
  • 语音识别
  • 语音合成
  • 时间序列异常检测
  • 节奏学习
  • 音乐创作

3. 卷积神经网络

卷积神经网络是一种特殊类型的神经网络,主要用于图像分类、图像聚类和对象识别。DNN 能够无监督地构建分层图像表示。为了获得最佳准确性,深度卷积神经网络比任何其他神经网络更受青睐。

应用

  • 识别面部、路标、肿瘤。
  • 图像识别。
  • 视频分析。
  • 自然语言处理 (NLP)。
  • 异常检测。
  • 药物发现。
  • 跳棋游戏。
  • 时间序列预测。

4. 受限玻尔兹曼机

RBM 是玻尔兹曼机的另一种变体。这里,输入层和隐藏层中的神经元之间包含对称连接。然而,各自层内没有内部关联。但与 RBM 相反,玻尔兹曼机确实在隐藏层内部包含内部连接。BM 中的这些限制有助于模型高效训练。

应用

  • 过滤。
  • 特征学习。
  • 分类。
  • 风险检测。
  • 商业和经济分析。

5. 自动编码器

自动编码器神经网络是另一种无监督机器学习算法。这里,隐藏单元的数量远小于输入单元的数量。但输入单元的数量与输出单元的数量相等。自动编码器网络经过训练,可以显示与馈入输入相似的输出,以强制 AE 查找常见模式并推广数据。自动编码器主要用于输入的较小表示。它有助于从压缩数据重建原始数据。该算法相对简单,因为它只需要与输入相同的输出。

  • 编码器: 将输入数据转换为低维度。
  • 解码器: 重建压缩数据。

应用

  • 分类。
  • 聚类。
  • 特征压缩。

深度学习应用

  • 自动驾驶汽车
    在自动驾驶汽车中,它能够通过处理大量数据来捕捉周围的图像,然后决定应该采取哪些行动来左转、右转或停车。因此,它将相应地决定采取什么行动,这将进一步减少每年发生的事故。
  • 语音控制助手
    当我们谈论语音控制助手时,Siri 是我们想到的第一件事。所以,你可以告诉 Siri 任何你想让它为你做的事情,它会为你搜索并显示出来。
  • 自动图像标题生成
    无论你上传什么图像,算法都会以一种方式工作,即它会相应地生成标题。如果你说蓝色眼睛,它会显示一张蓝色眼睛的图像,并在图像底部显示标题。
  • 自动机器翻译
    借助自动机器翻译,我们能够借助深度学习将一种语言转换为另一种语言。

局限性

  • 它只通过观察来学习。
  • 它包含偏见问题。

优点

  • 它减少了对特征工程的需求。
  • 它消除了所有不必要的成本。
  • 它容易识别困难的缺陷。
  • 它在问题上取得了同类最佳的性能。

缺点

  • 它需要大量的​​数据。
  • 它训练起来相当昂贵。
  • 它没有坚实的理论基础。

下一主题深度学习算法