车牌识别系统中车牌定位方法的研究
扫描二维码
随时随地手机看文章
1 引言
随着国民经济的高速发展,高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高,智能交通系统its(intelligent traffic system) 已成为世界交通领域研究的前沿课题。在此基础上发展的车牌照识别lpr(license plate recognition)
系统是智能交通系统的重要组成部分,在交通管理中占有重要地位。lpr系统主要由三部分组成:车牌定位、字符分割、字符识别,其中车牌定位的成功与否直接影响是否能够进入车牌识别以及车牌识别的准确率。主要的车牌定位方法:基于灰度图像的车牌定位方法[1]、基于小波变换的车牌定位方法[3]、基于形态学的车牌定位方法[4]、基于神经网络的车牌定位方法[7]、基于支持向量机的车牌定位方法[8]等。虽然这些算法在某些特定条件下识别效果较好,但综合一些诸如天气、背景、车牌磨损和图像倾斜等干扰因素的影响,暂时还不能完全满足实际应用的要求,有必要进行进一步的研究。
2 车牌定位方法
2.1 基于灰度图像的车牌定位方法
灰度数字图像是每个像素只有一个采样颜色的图像。这类图像通常显示为从黑色到白色的灰度。为了便于车牌定位,将该图像转换成二值图像,即只有黑色和白色两种颜色的图像。
此方法是应用车牌的如下特点:车牌牌照的字符和背景的对比度比较大,对应于车牌区域的水平灰度变化比较频繁;再者车牌一般挂在汽车的缓冲器上或附近,并靠近图像的下部,干扰一般比较少。根据以上特点,使用靠近水平方向的一阶差分运算,以突出灰度变化频繁的区域。其一阶差分运算的算式为:
从车牌照是一个矩形这一特点,我们可以判断它所对应的水平投影图与车牌的形状相仿,是一块较为独立的矩形区域,从水平投影图中可以看车牌位置基本对应于图中从下到上的第一个较大的波峰,车牌投影值区域大致对应于上述波峰值上、下邻域的波谷之间所包含的投影值区域,且这两个波谷大致对称于波峰,波峰和波谷的变化率较大。在这个过程中最重要的是确定选择哪个波峰,如果这个波峰的两个波谷之间的值的高度都大于某一个设定的值,并且两个波谷之间的宽度大致等于车牌照的高度,就认定它所确定的区域就是车牌的水平位置。对于车牌垂直方向的定位算法:一般情况下,车牌的底色和字符的颜色的对比度很大,而且在一个相对范围较小的范围内变化比较频繁,通过这个特征确定车牌垂直方向。该方法对质量较高的图像有很好的定位,不过对于图像中车前和车牌附近的车辆背景过多,容易导致错误的车牌定位。
2.2 基于小波变换的车牌定位方法
小波变换是20世纪80年代中后期在傅里叶分析的基础上发展起来的一个重要的应用数学分支。与傅里叶变换相比,小波变换具有较强的时、频域局部分析能力。通过伸缩和平移等运算功能对信号进行多尺度细化分析,在高频处取窄的时(空)间窗,在低频处取宽的时(空) 间窗,克服了傅里叶分析无法同时在时域和频域上取得良好局部特性的局限性,近年来这一方法在很多工程领域得到广泛应用。小波分析的核心是多分辨率分解,其良好的时—频特性使其成为研究精细结构的理想工具。在车牌图像处理方面,经过基于小波变换的高通滤波,车牌区域的横、竖、撇、捺笔划变得十分简洁、明晰,与传统算法中通过中值滤波等方法来滤除图片中的噪声干扰相比较,小波变换增强了处理的针对性,在降噪的同时增强了有用信息,便于在后续程序中获取车牌区域的细节信息。南京航天航空的马永一、宋铮等人将小波变换直接应用于车牌定位,提出了一种直接对灰度图像进行除噪处理的方法。
该方法是首先设计一个基于小波变换的滤波器,然后对图片进行x层小波变换之后对低频部分llx进行衰减,再进行小波反变换即可实现高通滤波,滤除图片中由于光照不均等多种因素造成的噪声干扰突出车牌区域。在传统的车牌定位算法中,都是先对图像进行二值化处理。对于原始的灰度图像中存在很明显的由光照不均引起的亮度差别,汽车的左半部分的亮度因建筑物遮挡比右半部分的亮度暗,同时右半部分也存在着局部的光线不足的情况下,如果直接进行平均灰度整体阈值二值化,很容易出现由于阈值选取过高而造成车牌区域的不可辨识的情况,假如在程序中刻意降低阈值又会引入很多噪声,失去了二值化的使用意义。如果使用局部阈值二值化,一方面增加了计算阈值的工作量,增加了处理时间,同时也可能会因为区域划分的原因引发新的边界噪声干扰。使用基于小波变换的高通滤波处理后,图片效果十分理想,不仅完全消除了光照不均造成的影响,而且使车牌区域更加突出,大大提高了定位查找的准确率。但是降噪预处理时的重构信号会丢失原有的时域特征。
2.3 基于形态学的车牌定位方法
数学形态学是由一组形态学的代数运算子组成的,它的基本运算有4个:
膨胀、腐蚀、开启和闭合,它们在二值图像和灰度图像中各有特点。基于这些基本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理,包括图像分割、特征抽取、边界检测、图像滤波、图像增强和恢复等。数学形态学方法利用一个称作结构元素的“探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部分之间的相互关系,从而了解图像的结构特征。上海大学的卢雅琴、邬凌超基于形态学的思想提出了一种基于形态学的车牌定位方法。
该方法的具体步骤如下:首先对原始图像进行二值化处理,然后采用4×1的结构元素对已二值化的图像进行滤波,去除图像的噪声。采用16×9的结构元素再对去噪后的图像进行膨胀,然后再用同样大小的结构元素做腐蚀运算,使车牌所在的区域形成连通的区域。然后标记出图像中所有的连通的区域,并计算出每个连通区域的外接矩形框,利用车牌的先验知识,确定车牌的位置。上述基于形态学处理的车牌定位方法,可以较好地确定图像中车牌的位置,且算法简单、实时性强。但是使用过大过小的结构元素,都无法使车牌区域形成闭合的连通区域。因此结构元素的选取非常重要。
2.4 基于神经网络的车牌定位方法
bp 神经网络是目前人工神经网络中研究最深入、应用最为广泛的一种模型,是bp(back propagation)学习算法在多层前馈网络中的一种应用模型。
bp网络的实质就是多层感知器(multi-layer perceptron,mlp),对于常用的三层(含有输入层、隐含层和输出层)网络来说,第一层属于输入层,接受输入向量;第二层属于隐含层,用于记忆,增加网络的可调参数,使网络输出更加精确;第三层属于输出层,输出网络结果。相邻层之间的节点属于全连接,相同层之间的节点没有连接。理论上,对于三层bp网络只要使得对隐含层的节点增大到一定的范围就可以拟合任何非线性函数。bp算法由正向传播和反向传播组成。正向传播是输入信号从输入层经隐含层传向输出层,若输出层得到期望的输出,则算法结束;否则,转至反向传播。反向传播就是将误差信号(样本输出与网络输出之差)按原连接通路反向计算,由梯度下降法调整各层神经元的权值,使误差信号减小,直至误差达到期望的误差。
该方法主要利用神经网络进行模式识别的一些优势:其一,它允许对问题的了解较少;其二,它可以实现特征空间中比较复杂的划分。基于神经网络的车牌定位方法主要分以下步骤,首先对bp网络进行训练,选取各种情况下的车牌图像,将其转换成灰度图像,每一幅图像的全部灰度值作为网络的一组输入向量,如果是含牌照的汽车图像,则设定其网络输出为高(0.9),否则为低(0.1),反复训练直至达到理想的效果。然后对实际图像进行预处理:灰度化,直方图化,滤波器滤波,增强图像并去除图像的噪声。最后用一个m×n的滑动窗口(m×n根据实际车牌的宽高比例设定)逐个像素地遍历预处理后的图像,窗口内子图像的数据经过归一化后送到神经网络的输入端作为输入向量,如果神经网络输出为高,则可判断此滑窗所在位置有车牌,否则无车牌。利用神经网络进行车牌的定位,其优点在于可以充分利用神经网络的自适应性,但这种方法也存在缺点,即需要花费一些时间进行网络的训练。如何缩短神经网络的训练时间,即提高其收敛速度是一个研究的难点。
2.5 基于支持向量机的定位方法
支持向量机(svm) 是20 世纪90年代初由vap2nik等人提出的一类新型机器学习方法,主要用于解决有限样本情况下的模式识别问题。此方法能够在训练样本很少的情况下达到很好的分类推广能力。由于车牌区域有着的纹理,寻找一种良好性能的分类器,凸现这种纹理特征,使它与其它区域区别开来。支持向量机(support vector machine,svm) 正是这样一种分类学习机制。
所以对车牌定位的研究,提出一种基于支持向量机的定位方法。首先将图像分割为n×n大小的子块,提出每个子块的灰度特征,训练svm分类器;然后用训练好的分类器进行牌照子块和非牌照子块的分类,再使用数学形态学滤波和区域合并;最后运用投影方法定位牌照区域。实验结果表明,该方法能比较好地定位牌照区域,但是由于svm算法对大规模训练样本难以实施,并且用svm解决多分类问题也存在困难,如果能解决这个问题车牌定位将会更精确。
3 结束语
本文在现有的车牌照识别系统的基础上,对近年来国内出现的车牌定位方法进行了全面的综述,车牌定位是车牌识别中的关键。上述车牌定位方法在理想条件下很好,但是由于车牌背景的复杂性与车牌特征的多样性,研究更实用的车牌定位方法是下一步要做的。如果将上述某些方法的特点相结合,集各家所长,有可能研究一种更好的车牌定位方法。