基于数学形态学的人脸检测研究
扫描二维码
随时随地手机看文章
O 引言
计算机人脸识别是模式识别和人工智能领域的一个前沿课题,有着十分广泛的应用前景。人脸自动识别系统主要包括人脸检测和定位,人脸特征的提取和识别两个主要部分。
数学形态学是一种基于集合论的非线性理论,是格理论在空间结构上的应用,其基本思想是基于像素间的逻辑关系而非代数关系。这种处理方式有利于对图像的几何描述,不同于其它基于代数的线性图像处理理论,具有不模糊图像边界及细节的特点,是一种用于图像处理的新理论和新方法。
1 肤色区域检测
一般情况下图像是以RGB形式存放的,但是RGB表示方法不适合于皮肤模型。在RGB空问,三基色(r,g,b)不仅代表了颜色,还表示了亮度。由于周围环境光照的改变,亮度可能使人脸的检测变的更加复杂,在皮肤的分割过程中是不可靠的。为了利用肤色在色度空间的聚类性,需要把颜色表达式中的色度信息与亮度信息分开。将RGB转换为色度与亮度分开的色彩表达空间就可以达到这个目的。在实验中选用YCbCr空间经行肤色区域检测。Cb和Cr分量分别表示蓝色和红色的色度,这两种色度在光照改变时是稳定的,Y代表容易被改变的亮度信息。该颜色空间可以从RGB格式线性变换得到,转换公式为
亚洲人和欧美人的人脸肤色的色调一般介于红和黄之间。为了确定人脸肤色在各个颜色分量上具有较强代表性的取值范围,Douglas Chai在实验中选取脸上除去眼睛、嘴唇、等区域,并且选取分别在不同光照、环境、分辨率下得到的人脸,最终得到的肤色分布范围如图(1)所示在左边的Cb图中,可以看出肤色信息集中分布在横坐标[112,133]内;右边的Cr图中,肤色信息集中分布在[140,175]内,所以可以得到人脸肤色的判断公式:
在我们的研究中使用这个门限进行肤色分割,从而得到人脸区域的二值化图像。
2 肤色区域处理
2.1 数学形态学基本定义
数学形态学中二值图像的形态变换是针对集合的处理,其形态学算子的实质是表达物体或形态的集合与结构元素间的相互作用,因此结构元素的形态就决定了这种运算所提前的信号的形状信息,形态学图像处理是在图像中移动一个结构元素,然后将结构元素与二值图像进行交、并等集合运算,其基本的形态运算是腐蚀(erodeoperator)和膨胀(flilate)。令B(x)代表结构元素,对工作空间E中的每一点,腐蚀和膨胀的定义分别为:
腐蚀具有使目标缩小、目标内孔增大,以及外部孤立噪声消除的效果;膨胀是将图像中与目标物体接触的所有背景点合并到物体中的过程,结果是使目标增大、空洞缩小,可填补目标中的空洞,使其形成连通域。
在数学形态学图像处理中,除了腐蚀和膨胀这两种基本运算外,还有两种非常重要的运算方法,即开运算和闭运算,其定义如下:[!--empirenews.page--]
2.4 眼睛和嘴唇的检测
由以上工作,我们确定了人脸的位置,这为我们下一步人眼和嘴唇的检测缩小了范围。
本文从形态学的角度进行眼睛和嘴唇的检测。设人脸区域为A,构造一个半径为r的圆盘形结构元素B。用结构元素B对人脸区域A做闭运算
[!--empirenews.page--]
经实验证明,圆盘结构元素的半径r取值为8或9达到最佳效果。检测出的眼睛和嘴唇的效果如图(4)和图(5)由上图我们可以看出,结构元素B对人脸区域A做闭运算后,人脸区域保持完整,而且人眼和嘴唇也被保存了下来,接下来我们可以通过找白色小区域中心的方法来定位眼睛和嘴唇。
3 分析与结论
本方法实验照片来自互联网和数码相机所拍摄照片,部分实验检测结果如图(6)所示。
本文算法利用YCbCr颜色空间进行肤色区域分割,分割的肤色区域简洁、独立性好,减少了背景的干扰,又利用数学形态学平滑了边界以利于人脸区域的提取;在对人眼和嘴的检测中,充分利于了数学形态学模板大小和形状的灵活定义和计算快速的特点,加快了检测速度,提高了检测的准确性,节约了时间。结果表明,本文的算法对正面人脸、具有一定旋转角度的人脸和复杂背景下的人脸都可以进行精确的识别和检测。