CNN 滤波器

17 Mar 2025 | 5 分钟阅读

卷积神经网络（CNN）在各种应用中都非常有效，包括分割、物体识别和图像分类。卷积核，通常被称为特征检测器或滤波器，是 CNN 的大脑。它们在从原始像素值中提取重要特征的过程中至关重要。

CNN 卷积核是小的、可学习的矩阵，它们在输入图像上滑动以执行卷积操作。这些卷积核充当特征提取器，检测图像中存在的模式、边缘、纹理和其他独特的特征。在训练过程中，每个卷积核都会学习检测特定特征，从而捕捉输入数据的不同方面。

CNN 卷积核的工作原理

卷积是 CNN 卷积核工作机制的一部分。本质上，卷积是一种数学技术，它通过组合两个函数来创建一个第三个函数。在 CNN 的上下文中，卷积涉及将卷积核在输入图像上滑动，并计算图像的局部感受野与卷积核的逐元素乘积。之后，将数据相加，生成一个包含在特征图中的单个输出值。

CNN 卷积核的类型

CNN 卷积核有四种类型：

边缘检测卷积核：它们识别图像中的梯度和边缘，并记录像素强度的急剧变化。Sobel、Prewitt 和 Roberts 卷积核是几个例子；这些通常用于边缘检测应用。
模糊和平滑卷积核：使用 Box 模糊和 Gaussian 模糊等卷积核可以使图像更平滑、噪声更少。它们有助于消除高频分量，并产生更均匀的外观。
锐化卷积核：这些卷积核可以增强图像的边缘和细节，使其外观更清晰、更明确。Laplacian 和 Unsharp Mask 卷积核是两个例子，它们通过放大高频分量来强调边缘。
特征提取卷积核：特征提取卷积核通过 CNN 训练阶段进行训练，可用于提取纹理、形状和物体片段等更高级别的特征。CNN 的层由多个卷积核组成，每个卷积核都专注于捕获某个特定方面。

代码

现在我们将尝试可视化卷积核

可视化卷积层

众所周知，神经网络模型是不透明的。这意味着它们在为某个选择或预测提供上下文方面并不擅长。由于其结构和功能，旨在处理图像数据的卷积神经网络应该比其他类型的神经网络更容易理解。

特别是，模型由小的线性卷积核和卷积核的输出（称为激活图，或更广泛地说，特征图）组成。可以可视化特征图和卷积核。例如，我们可以创建和理解像线条检测器这样的小型卷积核。也许通过观察其卷积核，可以了解训练好的卷积神经网络如何工作。

我们将使用 Keras 框架中预先训练好的模型。虽然有其他 CNN 模型，但我们将采用 VGG 模型。它有 16 个已学习的层，非常深入，并且性能非常出色，因此产生的卷积核和特征图将捕捉到有价值的特征。

导入库

 # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
from tensorflow.keras.applications.vgg16 import VGG16
from tensorflow.keras.applications.vgg16 import preprocess_input
from tensorflow.keras.preprocessing.image import load_img
from tensorflow.keras.preprocessing.image import img_to_array
from tensorflow.keras.models import Model
from matplotlib import pyplot
from numpy import expand_dims
from matplotlib import pyplot

import warnings
warnings.filterwarnings('ignore')

#Load the model
model = VGG16()

# Summary of the model
model.summary()

输出

可视化卷积核

用神经网络的语言来说，学习到的卷积核只是权重；但是，由于卷积核独特的二维结构，权重值在空间上相互关联，将每个卷积核绘制成二维图像是有意义的（或可能是有意义的）。模型摘要（在之前的步骤中打印）提供了每个层输出形状的概述，例如最终特征图的形状。它只提供了每个层的总权重数；它没有指示网络中卷积核（权重）的实际形状。通过使用 model.layers 属性，我们可以访问模型中的每一层。

卷积层的命名约定是 block#_conv#，其中 # 是一个整数。每个层都有一个 layer.name 属性。因此，我们可以查找每个层的名称并忽略那些不包含“conv”字符串的层。

每个卷积层的权重有两组。一组是卷积核块，另一组是偏置值块。这些可以通过 layer.get_weights() 方法访问。可以检索这些权重，然后总结它们的形状。

for layer in model.layers:
    
    if 'conv' not in layer.name:
        continue    
    filters , bias = layer.get_weights()
    print(layer.name , filters.shape)

输出

可以看到每个层的 3x3 卷积核。

由于我们使用的是 channel-last 格式，因此可以看到每个卷积核对于包含红色、绿色和蓝色三个通道的输入图像具有三个深度。一个卷积核可以表示为三个图像的图，每个通道一个，或者可以将其压缩成单个彩色图像。另一种选择是仅查看第一个通道，并相信其余通道也会看起来相同。问题是还有六十三个卷积核我们可能想要可视化。

以下是我们如何从第一层获取卷积核的方法

# retrieve weights from the second hidden layer
filters , bias = model.layers[1].get_weights()

权重值可能很小，对于正值和负值，中心都为 0.0。

为了更容易看到它们，我们可以将它们的值归一化到 0 到 1 之间。

# Normalize filter values to 0-1 so we can visualize them
f_min, f_max = filters.min(), filters.max()
filters = (filters - f_min) / (f_max - f_min)

将可视化第一层中的 64 个卷积核中的 6 个。

n_filters =6
ix=1
fig = pyplot.figure(figsize=(20,15))
for i in range(n_filters):
    # get the filters
    f = filters[:,:,:,i]
    for j in range(3):
        # subplot for 6 filters and 3 channels
        pyplot.subplot(n_filters,3,ix)
        pyplot.imshow(f[:,:,j] ,cmap='gray')
        ix+=1
#plot the filters 
pyplot.show()

输出

显而易见，第一行显示了所有通道的卷积核相同的实例，而最后一行显示了卷积核不同的实例。大或兴奋的权重由浅色方块表示，而小或抑制的权重由深色方块表示。通过这种理解，我们可以看到第一行的卷积核识别出从左上角浅到右下角深的渐变。

尽管有可视化，但我们只看到了第一个卷积层中 64 个卷积核中的前 6 个。可以在一张照片中看到所有 64 个卷积核。

不幸的是，这不可扩展。在检查第二个卷积层的卷积核时，我们发现再次有 64 个卷积核，但每个卷积核有 64 个通道，以便与输入特征图相对应。要显示所有 64 个卷积核在一行中的所有 64 个通道，将需要 (64×64) 4,096 个子图，并且可能很难从中看到任何细节。

下一主题香农熵

← 上一个下一个 →

CNN 滤波器

CNN 卷积核的工作原理

CNN 卷积核的类型

可视化卷积层

导入库

可视化卷积核

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

机器学习

监督式学习

分类

杂项

相关教程

面试题

CNN 滤波器

CNN 卷积核的工作原理

CNN 卷积核的类型

可视化卷积层

导入库

可视化卷积核

相关帖子

机器学习在儿童医疗保健中预测腺病毒疾病

深度学习和机器学习对数据结构和算法的需求

Python 中的 Imbalanced Learn 模块

著名公司如何使用机器学习

机器学习中的数据增强

机器学习中的词袋 (BoW) 模型

人类行为识别

机器学习中的安置预测

使用智能手机进行人类活动识别

图像分割的区域级评估指标

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器