当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]RBF网络和贝叶斯分类器融合的人脸识别方法设计

引言

本文基于人脸图像分块和奇异值压缩,进行RBF 神经网络和贝叶斯分类器融合的设计。将人脸图像本身的灰度分布描述为矩阵,其奇异值特征具有转置不变性、旋转不变性、位移不变性、镜像不变性等诸多重要的性质,进行各种代数和矩阵变换后提取的代数特征是人脸的表征。由于整体图像的奇异值向量反映的是图像整体的统计特征,对细节的描述还不够深入,本文模拟人类识别人脸的模式,在图像分块和加权的基础上,突出待识别人脸的骨骼特征,近似于人类在识别人脸时自动剔除同一人脸的变化部位的差异能力

径向基函数(RBF)网络是一种性能良好的前馈型三层神经网络,具有全局逼近性质和最佳逼近性能,训练方法快速易行,RBF 函数还具有局部响应的生物合理性。RBF神经网络隐含层结点使用了非线性传输函数,比单层感知器网络具有更强的分类能力。在隐含层中心确定的情况下,RBF神经网络只需对隐含层至输出层的单层权值学习修正,比多层感知器具有更快的收敛速度,这也是本文选择RBF神经网络作为分类器的原因。

在 RBF 神经网络构建和初始化采取有监督的聚类算法,在网络参数的最终调整和训练方面采取 Hybrid学习(HLA)算法。在隐层参数固定的条件下,由线性最小二乘法计算隐层和输出层之间的连接权值,由梯度下降法调整隐层神经元的中心和宽度。这种混合学习算法,能使RBF网络逼近Moody准则下的最优结构,即:在没有其它先验知识的情况下,与给定样本一致的规模最小的网络就是最好的选择。从而保证该网络具有较好的泛化能力。

贝叶斯网络是一个带有概率注释的有向无环图,图中的每一个结点均表示一个随机变量,图中两结点间若存在着一条弧,则表示这两结点相对应的随机变量是概率相依的,反之则说明这两个随机变量是条件独立的。网络中任意一个结点X 均有一个相应的条件概率表(CONditional Probability Table,CPT),用以表示结点X 在其父结点取各可能值时的条件概率。若结点X 无父结点,则X 的CPT 为其先验概率分布。贝叶斯网络的结构及各结点的CPT 定义了网络中各变量的概率分布。

奇异值分解SVD

奇异值分解非常有用,对于矩阵A(m*n),存在U(m*m),V(n*n),S(m*n),满足A = U*S*V’。U和V中分别是A的奇异向量,而S是A的奇异值。AA'的正交单位特征向量组成U,特征值组成S'S,A'A的正交单位特征向量组成V,特征值(与AA'相同)组成SS'。因此,奇异值分解和特征值问题紧密联系。

奇异值分解提供了一些关于A的信息,例如非零奇异值的数目(S的阶数)和A的秩相同,一旦秩r确定,那么U的前r列构成了A的列向量空间的正交基。

对于任何一个矩阵A∈Rm×n,利用奇异值分解将其转化为对角矩阵。

设A∈Rm×n(不失一般性,设m≥n),且rank(A)=k,则存在两个酉矩阵Um×m和Un×n及广义对角阵Dm×m使下式成立:

其中U的列向量是AAT的特征向量,V的列向量是ATA的特征向量,T表示转置。

称为矩阵A的奇异值, ui(i=k+1,…,m)是AAT对应于λi=0的特征向量,vi(i=k+1,…, n)是ATA对应于λi=0的特征向量。如果矩阵A代表一幅人脸图像,则式

表示对该人脸图像进行了正交分解,将矩阵

中主对角线上的奇异值元素连同中剩余的(ri-k)个0组合构成一个n维列向量

由于任何实矩阵A对应唯一的奇异值对角阵

,因此,一幅人脸图像对应于唯一的奇异值特征向量。

(1)从人脸数据库选择人脸作为识别训练集;

(2)将被选入训练集的人脸图像几何归一化处理;将被选入训练集的人脸图像灰度归一处理;

(3)将预处理过的人脸图像划分成大小为的子块;

(4)将每一幅图像变为一个列向量(先分别将每一个子块所有向量排成一列,再将所有子块按顺序排成一列);然后以子块为单位进行;

基于面部骨骼特征、眼睛的分布、鼻子的形状等结构特征,是鉴别人脸的主要依据。将每一幅人脸图像所形成的矩阵划分成…等个二维矩阵分别降维为一维列向量。求训练集中所有对应子块的平均值,

;再对每一类样本中的所有对应子块求平均,

;对应子块进行样本规范化,

并求协方差矩阵:

从中取 m 个较大特征值对应的特征向量,构成对应子块的特征脸空间 W1 ,即W1 =[w11,w12,…,w1 m ]T 。再对训练样本进行规范化处理

 ,投影到特征脸空间,获得投影特征为:

 

。对任一测试样本对应子块进行规范化处理,即

,然后得到投影特征,即

 

 用上述方法逐一对每个子块进行处理。得到

 

 

 。

基于特征分块贝叶斯分类器设计

每个基于特征分块的贝叶斯分类器,利用了所对应的图像块包含的判别信息,为得到性能更好的分类器,需要将这些分类器融合给出最终的判别结果。可以有多种办法实现分类器融合,如加权求和、相乘等。本文采取加权求和的方法:

其中

表示两幅图像

的相似度,L是贝叶斯分类器(FBBC)的总数(这里是9),

是与的第b个特征块之间的差值。

是由第b个贝叶斯分类器计算出的类条件概率密度。是第b个贝叶斯分类器对应的权值。

不同的特征块对应的贝叶斯分类器对最终判别结果贡献是不相同的,本文采取的是基于子分类器分类准确率分配权值的方法:将各子分类器重新放回其训练集,计算其在训练集上的识别率,利用这些识别率,采用下式计算第b个子分类器的权值:


图1人脸图像的预处理


图2  RBF神经网络的工作原理

RBF神经网络设计

直接利用matlab工具箱进行,这是一种较简单的设计方法,工具箱中提供了好几个函数可以利用,newrb、newrbe,newpnn,newgrnn,早一些的版本还有solverb等。这几个函数的使用以及参数说明请大家看相关资料。其中,为了看到每一步网络的性能函数变化,建议设置DF参数时设为1。这样每一步的图都可以显示出来,就对生成的网络的过程有一个清楚的认识。要查看设计好的网络的参数,中心采用net.IW{1},输出层权值采用net.LW{2},隐含层的偏置利用bet.b{1},输出层的偏置采用net.b{2}进行察看。当然,修改的时候:例如要修改输出层的偏置,那么,就是net.b{2}=??,就可以了。这种方法网络的初始中心是随机从输入的训练样本中选取的,中心的个数也是由少到多逐步增加的。建议在确定spread参数时不要设计得太小,太小可能影响对测试样本的识别。我自己做的是模式分类,但是对于曲线拟合应该也是一样的。

利用聚类算法确定中心,可以利用的聚类算法较多,最普通的就是K—均值聚类算法,还有最近邻、模糊聚类、支撑向量基等方法,这些方法都是先确定中心,然后输出层权值以及输出层的偏置再采用lms、rls算法等进行确定。在设计时,偏置可以根据自己的需要来设计,可以有也可以没有。


假定∈(1≤j≤r)为输入层神经元,为隐层第 i个神经元的中心,则第j个神经元在第i个隐层节点的输出为: , i =1,2,…,u,式中||||表示欧氏范数。当RBF选用高斯核函数时,其输出为:

式中为隐层第 i 个神经元的宽度。输出层第 k 个节点的输出值  为: ,式中为隐层节点 k 到第 j 个输出节点的连接权值。

RBF神经网络的构建和初始化

RBF神经网络隐层聚类的初始化过程如下[10]:

 (1)隐层节点数u=s。假设每个类收敛于一个聚类中心,再根据情况具体调整。

(2)隐层第 k 个神经元的中心为 k 类特征矢量的均值。,k=1,2,…,u,   

(3)计算从均值 到属于类k 的最远点的欧氏距离

(4)计算各个j聚类中心到k聚类中心的距离,j=1,2,…,s, j≠k

(5) 包含规则:若且,则类k包含于类中,类应被

 

RBF神经网络的算法

网络学习就是通过调整连接权 、隐层中心和宽度,以减小输出误差。

1、连接权值的调整

定义误差函数为:

,其中

是第个训练样本的实际输出值和理想输出值。通过线性最小二乘法求解最佳权值。

2、隐层中心及宽度调整

W固定,采用梯度下降法,经推导可得和的迭代计算公式为:

其中,

分别为隐层中心

宽度的学习速率

,m为迭代次数。

实验结果及分析

利用Yale人脸库中的人脸图像数据进行实验人脸识别实验研究,将人脸图像分块加权重构的奇异值向量X1,X2,…,Xl(其l中为训练样本的数目)矩阵依次输入RBF神经网络训练,当满足误差容限或训练次数,停止训练。在测试过程中,依据竞争选择的办法做出识别判断。
本文重点研究人脸图像的32子块权值选取情况如下:

表1  人脸图像划分不同子块数的识别结果

表2  赋予人脸图像32子块不同权值的识别结果

实验结果表明,基于人脸面部骨骼特征、以及眼睛分布、鼻子形状等结构特征,是鉴别人脸的主要依据。通过子块权值的合理分布,突出人脸骨骼特征,而对嘴部和皮肤折皱等表情变化部分特征给予弱化或剔除,这与人类识别人脸时的模式相近,识别效果较好。但是,子块不宜过多,否则增加RBF神经网络计算负担,识别率也会有所下降。

结论

本文提出了基于图像分块奇异值压缩,融合RBF神经网络和贝叶斯分类器的人脸识别方法,模拟人类识别人脸时剔除同一人脸变化部位的差异能力,采用不同子块单独进行人脸识别,根据RBF神经网络识别效果进行权值分配,通过实验证明,本文方法在降维和识别率方面均取得良好的效果,在正面人脸部位(尤其是下颚部)变化较大时,具有良好的识别精度和识别速度。
 

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭