机器学习中的转置卷积2025年6月19日 | 阅读 4 分钟 转置卷积也称为反卷积或上采样卷积。它主要应用于计算机视觉领域,用于图像生成、分割和超分辨率。与标准卷积“扁平化”输入数据的空间维度,对其进行下采样不同,转置卷积扩展空间分辨率以重建更精细的细节。因此,转置卷积是各种神经网络架构(例如自编码器、生成对抗网络和 U-Net 模型)不可或缺的一部分。 机器学习中转置卷积的工作原理标准卷积通过对输入数据的重叠区域求和来应用过滤器(也称为核),从而创建较小的特征图。与卷积相反,转置卷积通过在元素之间插入“间隙”来使用小输入将其转换为大输出。这些间隙为过滤器在更宽的区域上滑动创造了空间,从而产生更大、上采样的输出。 从技术上讲,转置卷积是常规卷积矩阵操作的逆运算,因此得名转置。这并不意味着它只是简单地“取消应用”原始卷积,而是它在空间区域中拉伸输入以形成扩展的表示。 现在我们将在机器学习中应用转置卷积来生成图像。 输出 ![]() 这是一个转置卷积的应用,使用提供的核和步长在 4x4 矩阵上进行。该过程继续表明输入有效地从 2x2“扩展”,表明转置卷积有潜力抵消常规卷积引起的收缩效应——这在生成模型或图像分割任务中对上采样有很好的应用。 输出 ![]() 此代码在 4x4 输入上计算转置卷积,并产生 7x7 的输出大小。这就是转置卷积派上用场的地方,因为在许多此类任务(包括生成和分割)中,空间上采样通常是必要的。 现在我们将使用 PyTorch 对图像实现转置卷积。这首先通过 PIL 读取图像,将其转换为 4D 张量,其中输入有一个批处理维度,并且还有另一个常见的应用会自动添加此维度以与神经网络的大多数层兼容;然后,它定义了一个由实际值组成的自定义 3D 核,这些值将作为此“卷积”操作的过滤器。初始化一个 `ConvTranspose2d` 层,它具有 3 个输入通道(与 RGB 图像匹配)和 2 个输出通道。其核大小为 2x2,步长为 2 以对图像进行上采样,填充设置为 1。然后,必须手动设置核权重,如预定义的那样,并将输入图像通过转置卷积层。这会创建上采样输出图像,该图像的通道也将通过此转置卷积层进行更改;这演示了如何通过扩展空间维度来完成卷积操作。最后但同样重要的是,将输出转换回 PIL 图像以进行可视化。 输出 ![]() 下一主题机器学习最佳笔记本电脑 |
简介:在本教程中,我们将学习医学图像中的目标识别。在医学领域,检测目标是分类和回归的挑战。由于其在计算机辅助诊断和计算机辅助检测系统中的重要应用,研究人员正在增加用途的转移...
阅读 15 分钟
Imbalanced-Learn 是一个 Python 库,用于解决不平衡数据集的问题,即一个类别的样本比其他类别多。这种不平衡可能导致模型偏向多数类。顾名思义,Imbalanced-Learn 提供了不同的...
阅读 8 分钟
Vaswani 等人在论文“Attention is All You Need”中给出的 Transformer 模型已成为自然语言处理 (NLP) 的新王者。因此,Transformer 的主要组成部分之一是所谓的注意力机制,它使模型能够确定如何...
11 分钟阅读
“对抗性”一词在计算机安全领域被用来愚弄或误导机器学习模型。网络安全对于所有数据科学家和程序员来说都是最重要的概念之一。黑客总是试图...
阅读 13 分钟
机器学习中的超参数是由用户明确定义的、用于控制学习过程的参数。这些超参数用于改进模型的学习,并在模型学习过程开始之前设置其值。在本主题中,我们...
5 分钟阅读
在记录评估和操作方面,经常需要处理以 DataFrame 等依赖格式存储的表格数据。 PySpark,一个强大的分布式数据处理框架,提供了各种功能来高效地执行复杂的数据转换。一个常见的任务是拆分单个...
5 分钟阅读
简介 ImageNet 大规模视觉识别挑战赛(简称 ILSVRC)是计算机视觉领域的一项极其严峻的挑战。ILSVRC 于 2010 年首次出现,并在改进深度学习和人工智能研究方面发挥了重要作用。ILSVRC 的目标是改进……
阅读 4 分钟
数据质量是任何机器学习 (ML) 模型成功的关键因素。机器学习模型严重依赖数据来分析模式并做出准确的预测。数据质量差可能导致有偏见、不可靠和无用的模型,最终会妨碍决策并影响业务……
阅读 8 分钟
机器学习(ML)的根本是应用数学模型从数据中获得洞察。这些数学模型和复杂方程很少能以解析解的形式进行公式化,因此必须使用数值逼近。数值方法提供的近似解包括优化问题的解决方案……
阅读9分钟
简介:通过添加上下文强盗,一个称为上下文强盗的决策算法族扩展了经典的多臂强盗 (MAB) 难题。代理在标准 MAB 配置中选择多个动作(臂)中的一个,并且所选动作决定了收益。但在实际情况中……
5 分钟阅读
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India