本文是对陈耀丹、王连明的基于卷积神经网络的人脸识别方法的理解。
摘要:实现了一种基于卷积神经网络的人脸识别方法,该网络由两个卷积层,两个池化层、
一个全连接层和一个 softmax 回归层组成,它能自动提取人脸特征并进行分类,网络通过
批量梯度下降法 “训练特征提取器和分类器,各隐层应用 dropout”方法解决了过拟合问题,
应用于 ORL 和 AR 人脸数据库的人脸识别率分别达到 99.50%和 99.62%,识别单张人脸的
时间均小于 0.05s,并且对光照差异、面部表情变化、有无遮挡物等干扰具有鲁棒性。
目前人脸识别算法大致可分为两类:
(1)基于表象的方法。基本的思想是将二维的人脸输入转换到另一个空间,然后用统计
方法分析人脸模式,例如 eigenface、fisherface 和 SVM 等方法。
(2)基于特征(feature-based)的方法,一般是提取局部或者全局特征,然后送入一个
分类器进行人脸识别,例如基于集合特征的识别和 HMM 等方法。
卷积神经网络是一个受生物视觉启发、以最简化预处理操作为目的的多层感知器的变形,
本质是一个前向反馈神经网络,卷积神经网络与多层感知器的最大区别是网络前几层由卷
积层和池化层交替级联组成,模拟视觉皮层中用于高层次特征提取的简单细胞和复杂细胞
交替级联结构。
卷积层的神经元对前一层输入的一部分区域(称为局部感受野,区域之间有重叠)有响应,
提取输入的更高层次特征;池化层的神经元对前一层输入的一部分区域(区域之间无重
叠)求平均值或最大值,抵抗输入的轻微形变或者位移。卷积神经网络的后几层一般是若
干个全连接层和一个分类器构成的输出层。
卷积神经网络用于人脸识别是一种基于特征的方法,区别于传统的人工特征提取和针对特
征的高性能分类器设计,它的优点是通过逐层卷积降维进行特征提取,然后经过多层非线
性映射,使网络可以从未经特殊处理的训练样本中,自动学习形成适应该识别任务的特征
提取器和分类器,该方法降低了对训练样本的要求,而且网络的层数越多,学习到的特征
更具有全局性。
LeNet-5 是 LeCun 提出的一个具有高识别率的用于手写数字的卷积神经网络,本文借鉴
LeNet-5 的模型结构,提出 6 层卷积神经网络用于 ORL 人脸库和 AR 人脸库的人脸识别,
网络前 4 层由卷积层和池化层交替级联用于特征提取随后接入一个全连接层,最后一层采
用非线性分类能力强的 Softmax 分类器,该 6 层卷积神经网络采用 sigmoid 激活函数和固
定的学习速率。
评论0
最新资源