基于聚类算法人脸识别方法的研究

时间：2011-02-22 09:28:03

关键字：聚类算法人脸识别方法 RBF神经网络因数

手机看文章

扫描二维码
随时随地手机看文章

[导读] 0.引言　　在智能小区的安防系统中，人脸识别技术的应用，提高了安防报警系统的安全可靠性。人脸识别技术因其具有非接触性、特征提取方便、防伪性能高等优势得到广泛的应用。人脸识别技术综合了计算机、通信、光学

0.引言

　　在智能小区的安防系统中，人脸识别技术的应用，提高了安防报警系统的安全可靠性。人脸识别技术因其具有非接触性、特征提取方便、防伪性能高等优势得到广泛的应用。人脸识别技术综合了计算机、通信、光学、电子、机械等多学科技术，在控制领域和智能建筑领域有着广阔的应用前景。本文研究了基于聚类算法判别人脸图像的方法，达到应用于智能小区门禁系统和楼宇门禁系统的实际应用要求，如图1所示。

图1 智能门禁报警系统的结构图

　　基于图像分块进行人脸识别时，随着分块数目的增多，子图像保留的奇异值个数、维数的控制，以及子图像权重的赋值等问题，若只依靠主观经验来决定，则缺乏客观依据。径向基函数(RBF-Radial Basis FunctiON)网络是一种性能良好的前馈型三层神经网络，具有全局逼近性质和最佳逼近性能，训练方法快速易行，RBF 函数还具有局部响应的生物合理性。在隐含层中心确定的情况下，RBF网络只需对隐含层至输出层的单层权值学习修正，比多层感知器具有更快的收敛速度。利用 YALE人脸数据库，通过RBF网络对奇异值个数、子图像数目、特征值数量、聚类因数、聚类个数、因数的测试结果，为人脸图像的识别提供客观地指导。

　　利用相关参数的仿真实验结果，为进一步研究子图像赋值情况，提高人脸识别的速度和精确度提供了有效的帮助和参数支持。

　　1.聚类算法的初始化

　　RBF神经网络可描述为：

　　式中，w(k,i)为隐含层第i个节点与输出层第k个输出节点的连接权值。

　　隐含层聚类的初始化过程如下。

　　(1)在每个类别收敛于一个聚类中心的假设前提下，将隐含层的节点数初始设定为输出层的节点数，即u=s，再根据RBF神经网络的训练情况具体调整。

　　(2)隐含层第k个神经元的中心Ck为 k 类特征矢量的均值。

　　(3)计算从均值Ck到属于类别k的最远点kfarP的欧氏距离。

　　(4)计算各个j聚类中心到k聚类中心的距离。再根据dmin(k,l)和dk，dl的关系，对以下几种情况进行判断。

　　情况(a)：若满足的条件，则表明类别k与其他类别l无重叠。

　　情况(b)：若满足的条件，则表明类别k与其他类别l有重叠，需要进一步考虑以下情况。

　　(i)当满足的条件时，则表明两个类别虽有重叠，但是互相不包含。

　　(ii)当满足的条件时，则表明类别k包含于其他类别之中，可能导致RBF神经网络分类错误。

　　(5)按照以下分离原则对每类样本进行判别并细分。

　　(i)包含规则：若满足，则表明类别k包含于类别l之中，类别l应被进一步细分为两个聚类。

　　(ii)正确归类规则：若类别k包含许多其他类别l的数据，则需要将类别k进一步细分为两个聚类。

　　重复上述步骤，直至选定的全部人脸图像的训练样本都被处理为止，整个RBF神经网络的结构随之确定。

　　2.RBF神经网络的参数调整

　　定义误差函数为：

　　其中，lky和lkt表示在输出层ky节点上对应第l个训练样本的实际输出值和理想输出值。通过线性最小二乘法求解最佳连接权值*W。

　　RBF神经网络的训练收敛性能，如图2的实例所示。图2为RBF神经网络误差输出曲线图，图中的横轴表示RBF神经网络训练的迭代次数，纵轴表示RBF神经网络实际误差的输出值，即训练迭代一次新网络的输出值与原先网络按误差函数公式(2)计算得到的结果。实验条件为在Yale数据库中，选取15个类别的人脸图像，每个类别选取11张人脸图像作为训练样本，提取每个人脸图像的特征值数量为90，对应于网络的训练集为一个165×90的矩阵时，得到RBF神经网络训练的误差函数输出情况。在具体实验中，设定RBF神经网络停止参数训练调整的条件为：当前一次系统输出误差值与当前系统输出误差值的变化量相差小于0.01时，RBF神经网络停止参数训练调整。图2表明，RBF 神经网络的误差输出值下降得很快，在迭代过程不到15次的情况下，误差曲线就进入系统误差值输出相差较小的范围内，收敛速度较快。

图2 RBF网络误差输出曲线图

　　3.聚类算法的仿真实验

　　参数设定值的不同，将对基于聚类算法的人脸图像识别的结果产生影响，例如对子图像划分的个数、子图像奇异值向量保留的个数、聚类因数α、γ因数的选取等。对不同参数初始化时设定不同的数值，将得到的实验结果进行对比和综合分析，进而确定包括输入层、输出层、隐含层节点数目及其核函数的选取等在内的合理的RBF神经网络结构，确定包括贝叶斯分类器的权值分配、阈值选取等在内的合适融合策略，以便进行深入的研究。

　　实验中，训练样本为Yale人脸库中的每人前6张照片，共90张，测试样本为每人的后5张照片，共75张。样本完整训练误差容限为1，训练最大次数为120。

　　(1)在γ因数取为0.8、子图像的数目为32块、保留子图像的奇异值个数为10的条件下，测试不同聚类因数α取值、不同聚类个数(即RBF神经网络隐含节点个数)情况下的识别率。如图3中data1所示。

图3 不同参数下的识别结果

　　实验结果表明，随着聚类因数α的增大，聚类个数也在增多，当α>3.0以后，识别率趋于稳定。而且，在RBF神经网络中隐含层节点数增多的情况下，会加大RBF神经网络的计算负担。因此，最终选择聚类因数α=3.5，来进一步研究子图像权重的赋值。

　　(2)在聚类因数α取为3.5、子图像的数目为32块、保留子图像的奇异值个数为10的条件下，测试不同γ因数情况下的识别率，如图3中data2所示(data2与data3重合)。实验结果表明，在γ因数逐渐增大的情况下，识别率随之逐渐提高并趋于稳定。因此，最终选择γ=0.8，来进一步研究子图像权重的赋值。

　　(3)在聚类因数α取为3.5、γ因数取为0.8、子图像的数目为32块的条件下，测试每个子图像保留不同奇异值个数时识别率的情况，如图3中data3所示。实验结果表明，在子图像的奇异值个数增加的情况下，识别率的有所增加并趋于稳定。最终选择保留子图像的奇异值个数为10，来进一步研究子图像权重的赋值。

　　(4)在聚类因数α取为3.5、γ因数取为0.8的条件下，测试保留不同奇异值特征个数时识别率的情况。如图3中data4所示，其中，每个子图像保留奇异值的个数×子图像数目=每幅图像的奇异值特征个数。

　　实验结果表明，人脸图像划分的子图像数目较多的情况下，识别率较高，而且当子图像的数目达到32块时，识别率已经趋于稳定状态。人脸图像划分的子图像数目不宜过多，这样会使每幅人脸图像的奇异值特征个数过大，进而增加RBF神经网络的计算负担。最终选择子图像的数目为32块的情况，来进一步研究子图像权重的赋值。

　　4.仿真实验结果分析

　　基于上述仿真实验数据进行参数设定，在人脸识别仿真系统中测试情况如图4所示。

图4 人脸识别仿真系统

　　根据实验结果确定聚类因数 α=3.5、γ=0.8、保留子图像的奇异值个数为10。人脸图像的子图像数目对应于RBF神经网络输入空间的维数r，样本库中的人脸图像类别数对应于输出空间的维数s，每类人脸图像样本的子图像的特征空间数目对应隐含层节点数u，根据上述实验结果调整u不超过120。对人脸图像进行分块，在样本数量很大、维数很高的情况下，有效地减少了计算量。但是，子图像数目不宜过多，否则增加神经网络计算负担，识别率也会有所下降。

　　5.结语

　　本文研究了基于聚类算法的人脸识别方法。根据人脸图像划分子图像的数目和所选定的训练或测试人脸图像的类别数的情况，确定RBF神经网络的输入层、输出层的节点数;根据RBF神经网络的训练识别效果，通过调整中间隐含层节点数、核函数及其中心点和宽度，通过基于聚类算法的人脸识别仿真实验，具体量化了中间隐含层节点数与子图像的对应关系、每幅子图像中奇异值向量的保留个数、聚类因数的选取等各项参数，为进一步根据各个子图像权值的合理分配，提高人脸识别的识别精度和良好的识别速度提供了有效的参数支持。