基于人脸形状特征的精确定位解析方案
扫描二维码
随时随地手机看文章
1研究背景
生物识别技术是目前最为方便与安全的识别系统。生物识别是依靠人体的身体特征来进行身份验证的一种解决方案。由于与传统的生物识别技术相比,人脸识别因具有更为简便、准确、经济及可扩展性良好等众多优势而普遍为人们所看好,被广泛应用于安全验证、监控、控制等各个方面。但到目前为止,能够满足人们需求的理想系统尚未出现[1]。
根据FERET’97 测试报告[2],目前的人脸识别算法对于不同的摄像机、不同的光照条件和年龄变化的适应能力非常差。FRVT’2000评测[3]结果表明,人脸识别系统的性能与FERET’97的测试相比有了一定的进步,但其识别性能对各种条件,如光照、老化、距离、姿态等,仍然离人们的期望值较远。
2问题的提出
本文仅考虑单人正面静态灰度图像,着重考虑人脸图像的检测和定位,不考虑头部的俯仰、旋转以及穿戴、遮蔽的情况,而且头部的倾斜不超过15°。
本文的研究工作主要是提出了结合人脸模板和人脸特征进行人脸检测的方法,对现有的人脸检测与定位的方法提出了改进,进而提取脸部特征,并在此基础上实现了一个智能识别系统演示软件。本文所采用的方法,主要是基于参数化的椭圆型人脸模板与基于眼睛及嘴巴几何特征相结合的人脸定位方法,以及根据其眼睛、鼻部及嘴部的几何特征参数,对实验人脸库进行监督下的分类和统计的人脸识别方法。所采用的人脸数据库是BioID人脸库。
3基于人脸识别技术的智能系统设计方案
人脸自动识别系统包括下列主要技术环节[4],首先是人脸检测和定位,即从输入图像中找到人脸及人脸存在的位置,并将人脸从背景中分割出来,然后才是对归一化的人脸图像进行特征提取与识别。这两个环节的研究独立性很强。由于在很多特定情况下,人脸检测与定位的工作比较简单,因此“特征提取与识别”环节得到了更为广泛和深入的研究;而近几年来随着人们越来越关心各种复杂情形下的人脸自动识别系统,人脸检测与定位才得到了较多的重视。
评价一个人脸自动识别系统的标准,一个是误识率即将某人错识别为其他人,另一个是虚警率即将其他人识别为这个人。这二者之间是存在矛盾的,所以在实际问题中往往需要进行某种折衷。这一点同样适用于特征提取与识别环节,但是对于人脸检测与定位,我们一般则要求误识率要尽可能低,因为这样才可以保证所要识别的人不会在这一步就丢失。
常用的人脸识别实验库以美国军方的FERET 库最为权威。另外如MIT、ORL 等库也可以用来验证算法在某些方面的能力。目前尚没有专门测试人脸检测和定位算法的图像库。
4基于人脸形状特征的精确定位方法
4.1 人脸特征的检测
特征检测是人脸识别智能系统中的关键环节,因为眼睛、鼻子和嘴巴等特征集中了人脸的人部分信息。对于人脸建模来说,不仅要检测出这些特征,而且要准确地加以定位。
假设人脸的姿态比较正,那么人脸上的特征是水平边缘集中的区域。我们可以在低分辨率下提取水平边缘,然后找到人脸区域内富含这些边缘的连通区,作为人脸特征的候选区域。这些区域的位置和大小并不准确,因为边缘检测本身容易出现位置偏移,连通区的大小也随阈值而变化。所以还需要进一步修正上面的结果。对正面的人脸来说,眼睛、嘴巴等特征和整个人脸的尺寸之间存在先验的约束关系,这就是人脸结构的恒常性,因此我们利用这些约束关系确定特征区域的大小。
图1 眼睛轮廓模型
评价函数的选择是关键。眼睛本身不具有—致的颜色信息,而边缘信息比较丰富。因此,先对图像进行边缘提取,然后作适当尺度的闭运算,就可以使眼睛内部形成单一的高亮度区。在处理过的图像中,眼睛内部是高亮度区,外部是低亮度区。因此可以定义评价函数如式(1)所示。其中D表示眼睛区域, 表示眼睛轮廓之外的带状区域, 表示轮廓之内的带状区域。根据4段曲线表达式得到的眼睛区域可以初始化眼睛的轮廓,然后用最陡下降法迭代直至该轮廓收敛。
(1)
嘴巴轮廓的模型如图2所示。由两段四次曲线组成,曲线的参数有7个:嘴巴的中心(x0,y0)、连接两嘴角的直线倾角θ、上下半嘴的高度h1和h2、嘴角到嘴巴中心的距离w,以及上下半嘴的四次项系数q1和q2。
图2 嘴巴轮廓的模型
嘴巴的评价函数比较容易确定,可以通过唇色和肤色的分割将嘴巴区分出来。评价函数的表达式如式(2)所示。各符号的含义与眼睛模型相似。
4.2 双眼和嘴巴的定位
可以充分利用先验知识,把眼睛和嘴巴表示为分段多项式曲线,然后用变形模板得到准确的轮廓。眼睛轮廓的模型如图1所示,由四段二次曲线组成,曲线的参数有8个:上半眼的中心(x0,y0)、连接内外眼角的直线的倾角θ、上下半眼的高度h1和h2、内眼角到上半眼中心的距离wl,外眼角到上半眼中心的距离w2,内眼角到下半眼中心的距离w3。
(2)
5人脸检测与定位软件系统的实现
5.1 系统工作流程
本系统的工作流程如下:在图片输入后,首先进行图象预处理,再利用椭圆模板匹配初步定位人脸。在对人脸方向进行校正后,再基于外形特征寻找眼睛和嘴巴,并基于相关性进行人脸区域验证,最后输出检测与定位结果。
在人脸识别阶段,先对检测定位输出的图片进行特征提取,再在人工监督下进行特征值统计。然后根据模板参数与特征统计值构造判据。对输入的待识别图象,经检测、定位并计算模板参数和特征值,再由判据进行判别分类后输出识别结果。
5.2 脸部检测与定位结果
经边界检测,脸部检测与定位的结果如图3所示。
图3 同时考虑脸型、眼睛和嘴特征时的脸部定位结果
5.3 检测与识别结果
本文利用BioID 人脸库中的100幅静止灰度图片(BioID_0000.pgm- BioID_0099.pgm)作为素材进行了实验。实验结果如表1所示。
表1 检测与识别结果
检测与定位方法正确率(%)参数改变时的适应性主要错检原因
肤色分割初步定位21较好背景复杂、光照影响
椭圆模板定位43较差边缘提取后,背景复杂
椭圆模板的适应性不足
加入眼、眉和嘴特征87较好倾斜、附属物干扰等
5.4 结果分析
在上述3种方法中,参数椭圆模板结合眼睛、眉毛和嘴巴特征的定位方法显示出较好的性能。
在采用基于肤色进行图像分割,进而定位人脸的方法时,由于肤色受环境光照、背景中近似肤色物体的存在的影响,导致定位结果较差。在改变阈值大小时, 对判断的结果影响不大,这表明:第一,肤色与背景色混杂,以及强烈的光照的影响,是造成误判的主要因素;第二,在一种上述问题不太严重的比较“理想”的状态下,肤色模型也的确能有效地发挥作用,以抵消来自于外形姿态等方面的影响。对肤色模型的改进应该集中在对于光照的处理和与背景的分离上,利用模板进行检测与定位即是有效分离背景干扰的一种方法。
在单纯采用椭圆模板进行检测与定位时,检测的正确率得到了一定的提高,但总的来说还是很难令人满意的。在通过改变椭圆的参数试验其性能时,其对参数变化的适应性把高。经分析,可以认为是复杂的背景直接影响了椭圆模板的有效性。而对参数变化的适应性差,主要是因为图像库中的人脸外形多为长椭圆形,表现在参数上差别不大。因而,仅仅通过椭圆模板进行人脸的检测与定位,其效果是难以令人满意的。
在参数椭圆模板的基础上,加入对眼睛、眉毛和嘴巴特征的参数描述,进而利用改进的模板进行检测与定位,取得了较好的结果。并且,在通过调节参数区分目标人物时,也有较好的表现。经分析,检测与定位成功率的提高得益于对脸部器官外形参数的有效地描述,使其过滤了大多数的背景中的干扰,取得了较好的效果。在调节面部器官的外形参数时,模型取得了较好的区分效果,这可以认为是各目标人物的个人特征的真实反应。其中仍然存在的问题是,在人脸倾斜,或有眼镜、大片头发遮盖等情况发生时,将对检测与定位的效果产生严重的影响。
6 结论
人脸检测与识别研究的趋势是利用多种线索(头发、肤色、器官、轮廓、模板等),综合多种分类方法(混合高斯模型、概率模型、神经网与支持向量机等),启发式信息与统计学习方法相结合。总之,由于人脸对象的非刚体性,以及姿态、光照、遮挡等各种变化因素的影响和实时性要求,高性能的人脸检测仍是一个困难的问题。
7本文作者创新点:
1采用基于参数化的椭圆型人脸模板与基于眼睛及嘴巴几何特征相结合的人脸定位方法,根据其眼睛、鼻部及嘴部的几何特征参数,对实验人脸库进行监督下的分类。
2提出了结合人脸模板和人脸特征进行人脸检测的方法,并对现有的人脸检测与定位的方法提出了改进,进而提取脸部特征,并在此基础上实现了一个智能识别系统,经检验,模型取得了较好的区分效果。
3.本项目为作者所在学院智能机器人研究课题之子课题,该课题目前已初步实用化,产生经济效益累计达110万元。本项目实验数据,如FERET’97及FRVT 2000,以及BioID人脸库等,均为互联网上公开资料,所采用的研究方法为实验法。