TensorFlow中CNN的训练

2024 年 11 月 14 日 | 阅读 9 分钟

MNIST数据库（**Modified National Institute of Standard Technology database**）是一个广泛的手写数字数据库，用于训练各种图像处理系统。它由“**重新整合**”来自**MNIST**原始数据集的样本创建。

如果我们熟悉Connects的构建模块，我们就可以用TensorFlow构建一个。我们使用MNIST数据集进行图像分类。

准备数据与之前的教程相同。我们可以运行代码并直接跳转到CNN的架构。

在这里，我们在**Google Colab**（机器学习的在线编辑器）中执行我们的代码。

我们可以通过以下链接访问TensorFlow编辑器：https://colab.research.google.com

这些是用于训练CNN（卷积神经网络）的步骤。

步骤：

**步骤 1：**上传数据集

**步骤 2：**输入层

**步骤 3：**卷积层

**步骤 4：**池化层

**步骤 5：**卷积层和池化层

**步骤 6：**密集层

**步骤 7：**Logit层

步骤 1：上传数据集

MNIST数据集可通过scikit学习，网址为（统一资源定位符）。我们可以下载它并将其存储在我们的下载中。我们可以使用fetch_mldata('MNIST Original')上传它。

创建测试/训练集

我们需要将数据集拆分为**train_test_split**。

缩放特征

最后，我们借助**MinMax Scaler**缩放函数。

import numpy as np
import tensorflow as tf

from sklearn.datasets import fetch_mldata
#Change USERNAME by the username of the machine
##Windows USER
mnist = fetch_mldata('C:\\Users\\USERNAME\\Downloads\\MNIST original')
## Mac User
mnist = fetch_mldata('/Users/USERNAME/Downloads/MNIST original')
print(mnist.data.shape)
print(mnist.target.shape)
from sklearn.model_selection import train_test_split
A_train, A_test, B_train, B_test = train_test_split(mnist.data,mnist.target, test_size=0.2, random_state=45)
B_train  = B_train.astype(int)
B_test  = B_test.astype(int)
batch_size =len(X_train)
print(A_train.shape, B_train.shape,B_test.shape )
## rescale
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
# Train the Dataset
X_train_scaled = scaler.fit_transform(A_train.astype(np.float65))

#test the dataset
X_test_scaled = scaler.fit_transform(A_test.astype(np.float65))
feature_columns = [tf.feature_column.numeric_column('x',shape=A_train_scaled.shape[1:])]
X_train_scaled.shape[1:]

定义CNN（卷积神经网络）

与传统的神经网络相比，CNN使用图像的像素上的过滤器来学习详细的模式而不是全局模式。要创建CNN，我们必须定义

**卷积层：**将多个过滤器应用于特征图。卷积之后，我们需要使用一个中继激活函数来向网络添加非线性。
**池化层：** Convention之后的下一步是降低最大特征的采样率。目的是减少特征图的移动性，以防止过度拟合并提高计算速度。最大池化是一种传统技术，它将特征图拆分为子字段并仅保留最大值。
**完全连接层：**过去层的所有神经元都与其他下一个层相关联。 CNN已根据卷积层的特征对标签进行分类，并通过任何池化层减少。

CNN架构

**卷积层：**它应用14个5x5过滤器（提取5x5像素子区域），
**池化层：**这将执行最大池化，使用2x2过滤器和步幅为2（指定池化的区域不重叠）。
**卷积层：**它应用36个5x5过滤器，并具有ReLU激活函数
**池化层：**再次执行最大池化，使用2x2过滤器和步幅为2。
**1,764个神经元，** dropout正则化率为0.4（其中任何给定元素在训练中被丢弃的概率为0.4）
**密集层（Logits层）：**有十个神经元，每个神经元对应一个数字目标类（0-9）。

在创建CNN中使用的重要模块

Conv2d ()。构造一个二维卷积层，带有过滤器数量、过滤器内核大小、填充和激活函数等参数。
max_pooling2d ()。使用最大池化算法构造二维池化层。
Dense ()。构造一个具有隐藏层和单元的密集层

我们可以定义一个函数来构建CNN。

让我们详细了解如何在函数中包装所有内容之前构建每个构建模块。

步骤 2：输入层

#Input layer
def cnn_model_fn(mode, features, labels):
input_layer = tf.reshape(tensor= features["x"],shape=[-1, 26, 26, 1])

我们需要定义一个具有数据形状的张量。为此，我们可以使用**模块tf.reshape**。在此模块中，我们需要声明要重塑的张量，并确定张量的形状。第一个参数是数据的特征，它在函数的参数中定义。

图片具有宽度、高度和通道。 **MNIST**数据集是尺寸为**28x28**的单色图片。我们将批处理大小设置为-1，使其采用特征["x"]的形状。优点是可以调整批处理大小到超参数。如果批处理大小为7，则张量将馈送**5,488**个值（**28 * 28 * 7**）。

步骤 3：卷积层

# first CNN Layer
conv1 = tf.layers.conv2d(
 inputs= input_layer, 
 filters= 18, 
 kernel_size= [7, 7], 
 padding="same", 
 activation=tf.nn.relu) 

第一个卷积层有18个过滤器，内核大小为7x7，且具有相等填充。相同的填充使输出张量和输入张量都具有相同的宽度和高度。 TensorFlow将在行和列中添加零以确保相同的大小。

我们使用Relu激活函数。输出大小将为[28, 28和14]。

步骤 4：池化层

卷积之后的下一步是池化计算。池化计算将减少数据的扩展。我们可以使用大小为3x3和步幅为2的模块max_pooling2d。我们使用上一层作为输入。输出大小可以是[batch_size，14，14和15]。

##first Pooling Layer 
pool1 = tf.layers.max_pooling2d (inputs=conv1,
pool_size=[3, 3], strides=2)

步骤 5：池化层和第二卷积层

第二个CNN恰好有32个过滤器，输出大小为[batch_size，14，14，32]。池化层的大小与前面相同，输出形状为[batch_size，14，14和18]。

conv2 = tf.layers.conv2d(
      inputs=pool1,
      filters=36,
      kernel_size=[5, 5],
      padding="same",
      activation=tf.nn.relu)
pool2 = tf.layers.max_pooling2d (inputs=conv2, pool_size=[2, 2],strides=2).

步骤6：完全连接（密集）层

我们必须定义完全连接的层。特征图必须先压缩，然后才能与密集层组合。我们可以使用大小为**7*7*36**的模块重塑。

密集层将连接**1764**个神经元。我们添加一个Relu激活函数，并可以添加一个Relu激活函数。我们添加一个dropout正则化项，其速率为0.3，这意味着30％的权重将为0。dropout仅在训练阶段进行。如果模型需要训练或评估，则**cnn_model_fn()**具有一个参数模式来声明。

pool2_flat = tf.reshape(pool2, [-1, 7 * 7 * 36])
dense = tf.layers.dense(inputs=pool2_flat, units=7 * 7 * 36, activation=tf.nn.relu)
dropout = tf.layers.dropout(
inputs=dense, rate=0.3, training=mode == tf.estimator.ModeKeys.TRAIN)

步骤 7：Logits层

最后，我们定义具有模型预测的最后一层。输出形状等于批处理大小12，等于该层中图像的总数。

#Logit Layer
logits = tf.layers.dense(inputs=dropout, units=12)	

我们可以创建一个包含类和每个类可能性的字典。如果logit层，该模块使用tf.argmax()返回最大值。 softmax函数返回每个类的概率。

predictions= {
 # Generate predictions 
"classes":tf.argmax(input=logits, axis=1),
"probabilities":tf.nn.softmax (logits, name="softmax_tensor")}

我们只想在模式设置为预测时返回字典预测。我们添加这些代码以显示预测。

If mode== tf.estimator.ModeKeys.PREDICT:
return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)

下一步包括计算模型的损失。可以使用以下代码轻松计算损失

# Calculate Loss (for both EVAL and TRAIN modes)
loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)

最后一步是优化模型，即找到权重的最佳值。为此，我们使用学习率为0.001的梯度下降优化器。目的是减少损失。

optimizer= tf.train.GradientDescentOptimizer(learning_rate=0.0001)
train_op= optimizer.minimize(
loss=loss,
global_step=tf.train.get_global_step())

我们已经完成了CNN。但是，我们希望在评估模式期间显示性能指标。多类模型的性能指标是准确性指标。 TensorFlow配备了一个具有两个参数（标签和预测值）的准确性模型。

eval_metric_ops = {
"accuracy": tf.metrics.accuracy(labels=labels, predictions=predictions["classes"])}
return tf.estimator.EstimatorSpec(mode=mode, loss=loss, eval_metric_ops=eval_metric_ops)

我们可以创建我们的第一个CNN，并且我们准备好将所有内容包装在一个函数中以使用它，并训练和评估该模型。

def cnn_model_fn(features, labels, mode):
""Model function for CNN.""
  # Input Layer
  input_layer = tf.reshape(features["x"], [-1, 28, 28, 1])

  # Convolutional Layer
  conv1 = tf.layers.conv2d(
      inputs=input_layer,
      filters=32,
      kernel_size=[5, 5],
      padding="same",
      activation=tf.nn.relu)

  # Pooling Layer
  pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2, 2], strides=2)

  # Convolutional Layer #2 and Pooling Layer
  conv2 = tf.layers.conv2d(
      inputs=pool1,
      filters=36,
      kernel_size=[5, 5],
      padding="same",
      activation=tf.nn.relu)
  pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[2, 2], strides=2)

  # Dense Layer
  pool2_flat = tf.reshape(pool2, [-1, 7 * 7 * 36])
  dense = tf.layers.dense(inputs=pool2_flat, units=7 * 7 * 36, activation=tf.nn.relu)
  dropout = tf.layers.dropout(
      inputs=dense, rate=0.4, training=mode == tf.estimator.ModeKeys.TRAIN)

  # Logits Layer
  logits = tf.layers.dense(inputs=dropout, units=10)

  predictions = {
      # Generate predictions (for PREDICT and EVAL mode)
      "classes": tf.argmax(input=logits, axis=1),
      "probabilities": tf.nn.softmax(logits, name="softmax_tensor")
  }

  if mode == tf.estimator.ModeKeys.PREDICT:
    return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)

  # Calculate Loss
  loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)

  # Configure the Training Op (for TRAIN mode)
  if mode == tf.estimator.ModeKeys.TRAIN:
    optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.001)
    train_op = optimizer.minimize(
        loss=loss,
        global_step=tf.train.get_global_step())
    return tf.estimator.EstimatorSpec(mode=mode, loss=loss, train_op=train_op)
# Add evaluation metrics Evaluation mode
  eval_metric_ops = {
   "accuracy": tf.metrics.accuracy( 
   labels=labels, predictions=predictions["classes"])} 
  return tf.estimator.EstimatorSpec(
  mode=mode, loss=loss, eval_metric_ops=eval_metric_ops) 

CNN需要花费很多时间进行训练，因此，我们创建一个日志记录钩子，以每**50**次迭代存储软件层的值。

# Set up logging for predictions
tensors_to_log = {"probabilities": "softmax_tensor"}
logging_hook =tf.train.LoggingTensorHook(tensors=tensors_to_log, every_n_iter=50)

我们准备评估模型。我们的批处理大小为100，并将数据分为多个部分。请注意，我们将训练步骤设置为18000，这可能需要花费大量时间来训练。

#Train the model
train_input_fn = tf.estimator.inputs.numpy_input_fn(
    x={"x": X_train_scaled},
    y=y_train,
    batch_size=100,
    num_epochs=None,
    shuffle=True)	
    mnist_classifier.train( 
    input_fn=train_input_fn,
    steps=18000, 
    hooks=[logging_hook])

现在，该模型已经过训练，我们可以对其进行评估并轻松打印结果。

# Evaluate the model and print the results
eval_input_fn = tf.estimator.inputs.numpy_input_fn(
    x= {"x": X_test_scaled},
    y=y_test,
    num_epochs=1,
    shuffle=False)
eval_results = mnist_classifier.evaluate(input_fn=eval_input_fn)
print(eval_results)

INFO:tensorflow:Calling model_fn
INFO:tensorflow:Done calling model_fn
INFO:tensorflow:Starting evaluation at 2019-08-10-12:53:40
INFO:tensorflow:Graph is finalized.
INFO:tensorflow:Restoring parameters from train/mnist_convnet_model/model.ckpt-15652
INFO:tensorflow: Running local_init_op
INFO:tensorflow: Running local_init_op
INFO:tensorflow:Finished evaluation at 2019-07-05-12:52:56
INFO:tensorflow: Saving dict for global step 15652: accuracy = 0.9589586, global_step = 15852, loss = 0.13894269{'accuracy': 0.9689286, 'loss': 0.13894269, 'global_step': 15652}

借助该体系结构，我们获得了97％的准确度。我们可以更改体系结构，批处理大小和迭代次数以提高准确性。架构，批处理大小和迭代次数以提高准确性。

CNN神经网络的性能远胜于ANN或逻辑回归。在有关人工神经网络的教程中，我们的准确度为96％，这在CNN中较低。 CNN在速度计算和准确性方面，在广泛的图像集中表现令人印象深刻。

要构建CNN，我们需要遵循以下六个步骤

1) 输入层

此步骤重置数据。大小等于像素数的平方根。例如，如果图片有156个像素，则该数字为26x26。我们需要指定图像是否包含颜色。如果是，则对于RGB-，我们的大小为3到3，否则为1。

2) 卷积层

我们需要创建一致的层。我们应用各种过滤器来学习网络的重要特征。我们定义内核的大小和过滤器的体积。

conv1= tf.layers.conv2d(
inputs=input_layer,
filters=14,
kernel_size=[6, 6],
padding="same",
activation= tf.nn.relu)

3) 池化层

在第三步中，我们添加一个池化层。此层减小输入的大小。它通过获取子矩阵的最大值来实现。

4) 添加卷积层和池化层

在此步骤中，我们可以根据需要添加尽可能多的池化层。它使用具有20多个硬层的Google架构。

5) 密集层

步骤5展平先前的内容以形成完全连接的层。在此步骤中，我们可以使用不同的激活函数并添加dropout效果。

pool2_flat = tf.reshape(pool2, [-1, 8 * 8 * 36])
dense = tf.layers.dense(inputs=pool3_flat, units=8 * 8 * 36, activation=tf.nn.relu)
dropout = tf.layers.dropout(
Inputs=dense, rate=0.3, trainingmode == tf.estimator.ModeKeys.TRAIN)

6) Logit层

最后一步是预测。

下一个主题CNN中的MNIST数据集

← 上一个下一个 →

我们提供所有技术（如 Java 教程、Android、Java 框架）的教程和面试问题

联系信息

G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India

hr@tpointtech.com

+91-9599086977

关注我们

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

TensorFlow 教程

TensorFlow 基础

TensorFlow 感知器

TensorFlow 中的 ANN

线性回归

TensorFlow 中的 CNN

TensorFlow 中的 RNN

风格迁移

TensorBoard

差异

目标检测

TensorFlow 调试

其他主题