MNIST手写数字识别的Keras实现_mnist手写数字识别教学资源-CSDN文库

共9个文件

py：4个

gz：4个

h5：1个

需积分: 46 194 浏览量 2018-11-08 11:14:27 上传评论 3 收藏 22.87MB ZIP 举报

在本文中，我们将深入探讨如何使用Keras库来实现MNIST手写数字识别。MNIST数据集是一个广泛使用的机器学习基准，包含60,000个训练样本和10,000个测试样本，每个样本都是28x28像素的手写数字图像。Keras是一个高级神经网络API，它构建在TensorFlow、Theano和CNTK等深度学习框架之上，提供了简洁易用的接口，使得快速实验和开发变得非常容易。我们需要导入必要的库，包括Keras，numpy以及MNIST数据集。在`train.py`中，这通常会以如下方式开始： ```python import keras from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten from keras.layers import Conv2D, MaxPooling2D ``` 接着，我们会加载MNIST数据集，并对数据进行预处理。预处理包括将像素值归一化到0到1之间，以及将数据集分为训练集和测试集： ```python (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train = x_train.astype('float32') / 255 x_test = x_test.astype('float32') / 255 x_train = x_train.reshape((len(x_train), 28, 28, 1)) x_test = x_test.reshape((len(x_test), 28, 28, 1)) y_train = keras.utils.to_categorical(y_train, 10) y_test = keras.utils.to_categorical(y_test, 10) ``` 然后，我们构建卷积神经网络（CNN）模型。CNNs在图像识别任务中表现出色，因为它们能够捕获局部特征。以下是一个简单的CNN模型结构： ```python model = Sequential() model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1))) model.add(Conv2D(64, (3, 3), activation='relu')) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Dropout(0.25)) model.add(Flatten()) model.add(Dense(128, activation='relu')) model.add(Dropout(0.5)) model.add(Dense(10, activation='softmax')) ``` 接下来，我们编译模型，定义损失函数（交叉熵），优化器（Adam）和评估指标（准确率）： ```python model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers.Adam(), metrics=['accuracy']) ``` 现在模型已经准备就绪，我们可以训练它。通常会设置一定的训练轮数（epochs）和批次大小（batch size）： ```python model.fit(x_train, y_train, batch_size=128, epochs=10, verbose=1, validation_data=(x_test, y_test)) ``` 在训练过程中，Keras会记录训练和验证性能。这些日志可以保存在`logs`目录下，用于后续分析或可视化。测试阶段，我们可以使用`test.py`来评估模型在未见过的数据上的表现： ```python score = model.evaluate(x_test, y_test, verbose=0) print('Test loss:', score[0]) print('Test accuracy:', score[1]) ``` `utils.py`可能包含了辅助函数，如数据增强、模型保存和加载等。`constants.py`则可能定义了一些全局常量，例如模型参数或路径。 `mnist-model.h5`是训练好的模型权重文件，可以用于部署到生产环境或者在其他地方复用。通过这个项目，我们可以学习到Keras的基本用法，理解卷积神经网络的工作原理，以及如何处理图像分类问题。这只是一个简单的起点，对于更复杂的图像识别任务，可以进一步调整网络架构，比如增加更多的卷积层、池化层，或者引入批量归一化和数据增强等技术来提升模型性能。

资源推荐

资源详情

资源评论

收起资源包目录

mnist-keras.zip （9个子文件）

logs

train.py 8KB

mnist-model.h5 12.72MB

test.py 1KB

utils.py 3KB

data

t10k-labels-idx1-ubyte.gz 4KB

t10k-images-idx3-ubyte.gz 1.57MB

train-images-idx3-ubyte.gz 9.45MB

train-labels-idx1-ubyte.gz 28KB

constants.py 626B

# coding=utf-8 # 兼容python3 from __future__ import absolute_import from __future__ import division from __future__ import print_function import argparse import cv2 # 从tensorflow里导入keras和keras.layer from tensorflow import keras from tensorflow.keras import layers # 导入工具函数 from utils import * def inference(dtype): """ 使用keras定义mnist模型 """ # define a truncated_normal initializer tn_init = keras.initializers.truncated_normal(0, 0.1, SEED, dtype=dtype) # define a constant initializer const_init = keras.initializers.constant(0.1, dtype) # define a L2 regularizer l2_reg = keras.regularizers.l2(5e-4) """ 输入占位符。如果输入图像的shape是(28, 28, 1)，输入的一批图像(16张图)的shape 是(16, 28, 28, 1)；那么，在定义Input时，shape参数只需要一张图像的大小，也就是(28, 28, 1)，而不是(16, 28, 28, 1)。 input placeholder. the Input's parameter shape should be a image's shape (28, 28, 1) rather than a batch of image's shape (16, 28, 28, 1). """ # inputs: shape(None, 28, 28, 1) inputs = layers.Input(shape=(IMAGE_SIZE, IMAGE_SIZE, NUM_CHANNELS), dtype=dtype) """ 卷积，输出shape为(None, 28,18,32)。Conv2D的第一个参数为卷积核个数；第二个参数为卷积核大小，和tensorflow不同的是，卷积核的大小只需指定卷积窗口的大小，例如在tensorflow中，卷积核的大小为(BATCH_SIZE, 5, 5, 1)，那么在Keras中，只需指定卷积窗口的大小(5, 5)，最后一维的大小会根据之前输入的形状自动推算，假如上一层的shape为(None, 28, 28, 1)，那么最后一维的大小为1；第三个参数为strides，和上一个参数同理。其他参数可查阅Keras的官方文档。 """ # conv1: shape(None, 28, 28, 32) conv1 = layers.Conv2D(32, (5, 5), strides=(1, 1), padding='same', activation='relu', use_bias=True, kernel_initializer=tn_init, name='conv1')(inputs) # pool1: shape(None, 14, 14, 32) pool1 = layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding='same', name='pool1')(conv1) # conv2: shape(None, 14, 14, 64) conv2 = layers.Conv2D(64, (5, 5), strides=(1, 1), padding='same', activation='relu', use_bias=True, kernel_initializer=tn_init, bias_initializer=const_init, name='conv2')(pool1) # pool2: shape(None, 7, 7, 64) pool2 = layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding='same', name='pool2')(conv2) # flatten: shape(None, 3136) flatten = layers.Flatten(name='flatten')(pool2) # fc1: shape(None, 512) fc1 = layers.Dense(512, 'relu', True, kernel_initializer=tn_init, bias_initializer=const_init, kernel_regularizer=l2_reg, bias_regularizer=l2_reg, name='fc1')(flatten) # dropout dropout1 = layers.Dropout(0.5, seed=SEED)(fc1) # dense2: shape(None, 10) fc2 = layers.Dense(NUM_LABELS, activation=None, use_bias=True, kernel_initializer=tn_init, bias_initializer=const_init, name='fc2', kernel_regularizer=l2_reg, bias_regularizer=l2_reg)(dropout1) # softmax: shape(None, 10) softmax = layers.Softmax(name='softmax')(fc2) # make new model model = keras.Model(inputs=inputs, outputs=softmax, name='nmist') return model def main(argv=None): if argv.self_test: """ 为了测试模型是否可以运行，生成了一些随机数据集。 generate some fake data for testing model is functional. """ print('Running self-test...') # 生成训练集 # generate train dataset train_data, train_labels = fake_data(256) # 生成验证集 # generate validation dataset validation_data, validation_labels = fake_data(EVAL_BATCH_SIZE) # 生成测试集 # generate test dataset test_data, test_labels = fake_data(EVAL_BATCH_SIZE) # 只训练一个epoch # training for only 1 epoch num_epochs = 1 else: """ 准备数据集。 prepare dataset. """ # 下载数据集 # Get the data. train_data_filename = maybe_download('train-images-idx3-ubyte.gz') train_labels_filename = maybe_download('train-labels-idx1-ubyte.gz') test_data_filename = maybe_download('t10k-images-idx3-ubyte.gz') test_labels_filename = maybe_download('t10k-labels-idx1-ubyte.gz') # 把下载的数据解压为numpy数组 # Extract it into numpy arrays. train_data = extract_data(train_data_filename, 60000) train_labels = extract_labels(train_labels_filename, 60000) test_data = extract_data(test_data_filename, 10000) test_labels = extract_labels(test_labels_filename, 10000) # 分割train_data与train_labels，得到训练集以及验证集 # Generate a validation set. validation_data = train_data[:VALIDATION_SIZE, ...] validation_labels = train_labels[:VALIDATION_SIZE] train_data = train_data[VALIDATION_SIZE:, ...] train_labels = train_labels[VALIDATION_SIZE:] num_epochs = NUM_EPOCHS # 保存一下第一张图片，用来测试 # save the first image for testing img0 = test_data[0] # 因为test_data被缩放到了[-0.5, 0.5]，所以要恢复到原来的范围[0, 255] # rescale img0 from [-0.5, 0.5] to [0, 255] img0 = img0*PIXEL_DEPTH+PIXEL_DEPTH/2 # 保存 # save cv2.imwrite('test0.png', img0) # 对label进行one-hot编码，因为模型的最后一层有10个输出单元（10个类别） # one-hot encoding， because of last layer of model have 10 units(10 classes) train_labels = keras.utils.to_categorical(train_labels) validation_labels = keras.utils.to_categorical(validation_labels) test_labels = keras.utils.to_categorical(test_labels) # 获取模型 # make keras model model = inference(data_type(argv)) # 打印模型的信息 model.summary() # 编译模型；第一个参数是优化器；第二个参数为loss，因为是多元分类问题，固为 # 'categorical_crossentropy'；第三个参数为metrics，就是在训练的时候需 # 要监控的指标列表。 # compile model model.compile(optimizer=keras.optimizers.SGD(lr=0.01, momentum=0.9, decay=1e-5), loss='categorical_crossentropy', metrics=['accuracy']) # 设置回调 # setting callbacks callbacks = [ # 把TensorBoard的日志写入文件夹'./logs' # write TensorBoard' logs to directory 'logs' keras.callbacks.TensorBoard(log_dir='./logs'), ] # 开始训练 # start training model.fit(train_data, train_labels, BATCH_SIZE, epochs=num_epochs, validation_data=(validation_data, validation_labels), callbacks=callbacks) # evaluate print('', 'evaluating on test sets...') loss, accuracy = model.evaluate(test_data, test_labels) print('test loss:', loss) print('test Accuracy:', accuracy) # save model model.save('mnist-model.h5') if __name__ == '__main__': # 定义parser parser = argparse.ArgumentParser() parser.add_argument( '--use_fp16', default=False, help='Use half floats instead of full floats if True.', action='store_true') parser.add_argument( '--self_test', default=False, action='store_true', help='True if running a self test.') # 解析参数 # parse arguments FLAGS, unparsed = parser.parse_known_args() # 调用主函数 # call main() main(FLAGS)

评论收藏

内容反馈