讲透一个强大的算法模型,CNN!!
大家好,我是小寒
今天给大家介绍一个超强的算法模型,CNN
卷积神经网络(CNN)是一种深度学习模型,主要用于处理具有网格结构(如图像)的数据。CNN 在计算机视觉领域表现尤为突出,广泛应用于图像分类、目标检测、图像生成等任务。
CNN 的基本组成结构
卷积层
局部连接:卷积核只作用于输入图像的局部区域,因此每个输出特征仅与输入图像的一部分有关。 权重共享:卷积核在输入图像的不同区域重复使用,从而减少了模型的参数数量。
池化层
最大池化:选取池化窗口内的最大值作为输出,保留了最显著的特征。 平均池化:计算池化窗口内的平均值,平滑特征图。
全连接层
卷积层和池化层的输出(特征图)一般会展开成一个一维向量,并输入到全连接层。
全连接层类似于传统的前馈神经网络,每个节点与上一层的所有节点相连。
全连接层用于综合卷积层和池化层提取的特征并输出最终的分类结果。
输入层:输入图像数据。
卷积层:提取图像的局部特征,通过多个卷积层逐步提取更高层次的特征。
池化层:对特征图进行下采样,减少数据维度。
激活函数:引入非线性特性,使模型能够学习复杂的特征。
全连接层:将提取的特征整合并映射到分类空间。
输出层:通常使用 Softmax 函数进行多分类任务,输出每个类别的概率分布。
案例分享
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt
# 加载 MNIST 数据集
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1)).astype('float32') / 255
plt.figure(figsize=(8, 4))
for i in range(10):
plt.subplot(2, 5, i+1)
plt.xticks([])
plt.yticks([])
plt.grid(False)
plt.imshow(train_images[i].reshape(28, 28), cmap=plt.cm.binary)
plt.xlabel(train_labels[i])
plt.show()
接下来,构建 CNN 模型
# 构建卷积神经网络模型
model = models.Sequential()
# 第一层卷积,32 个过滤器,大小为 3x3,激活函数为 ReLU,输入形状为 28x28x1
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2))) # 最大池化层
# 第二层卷积,64 个过滤器,大小为 3x3
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
# 第三层卷积,64 个过滤器,大小为 3x3
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
# 全连接层
model.add(layers.Flatten()) # 将卷积层的输出展开为一维向量
model.add(layers.Dense(64, activation='relu')) # 全连接层
model.add(layers.Dense(10, activation='softmax')) # 输出层,10 个分类,使用 softmax 激活
model.summary()
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
history = model.fit(train_images, train_labels, epochs=5,
validation_data=(test_images, test_labels))
# 绘制训练和验证损失曲线
plt.plot(history.history['loss'], label='Training Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend(loc='upper right')
plt.show()
最后,对测试集进行预测
predictions = model.predict(test_images)
plt.figure(figsize=(8, 4))
for i in range(10):
plt.subplot(2, 5, i+1)
plt.xticks([])
plt.yticks([])
plt.grid(False)
plt.imshow(test_images[i].reshape(28, 28), cmap=plt.cm.binary)
plt.xlabel(f"True: {test_labels[i]}, Pred: {predictions[i].argmax()}")
plt.show()
最后
—
「进群方式:加我微信,备注 “python”」
往期回顾
Fashion-MNIST 服装图片分类-Pytorch实现