当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]: 针对车牌汉字识别提出了一种基于二值图形变动分析的模糊模板匹配的车牌汉字识别方案。介绍了该方法的具体实现算法和实验流程及结果。字符识别是指对文本资料进行扫描,然

: 针对车牌汉字识别提出了一种基于二值图形变动分析的模糊模板匹配的车牌汉字识别方案。介绍了该方法的具体实现算法和实验流程及结果。

字符识别是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。在识别并保留字体、字号、风格、版面信息,实现版面恢复所见所得;可识别和恢复表格;自动判别和纠正文件的放置方向,便于成批处理和盲人操作;带有图像管理,允许用户观查、标记和注解文件图像。

人类的视觉感知系统是一个鲁棒性很强的、能抵御实际中可能遇到的各种变形和噪声干扰的文字识别系统。人们的认字过程实际上是对汉字整体形象的把握,是对汉字图像全局的处理过程[1]。因而,汉字的整体信息在无笔顺识别中起着无法替代的重要作用。

统计模式识别借助概率论的知识,判断或决策对象的特征类别,使得决策的错误率达到最小。基于统计特征的识别方法先抽取识别对象的稳定特征,组成特征矢量,然后在字符集的特征空间中进行特征匹配。基于以上认识,在分析汽车牌照中汉字字符的特点后,采用了有别于结构分析的一种基于字符图像特征统计的模式识别方法进行汉字识别。同时针对统计方法无法区分的相似汉字,提取其微结构信息进行特殊的校正识别。

1 特征统计匹配

统计决策论其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决。汉字的统计模式识别是将字符点阵看作一个整体,从该整体上经过大量统计得到所用特征,用尽可能少的特征模式来描述尽可能多的信息。所采用的方法有:特征统计的方法、整体变换分析法[3]、几何矩特征、笔划密度特征、字符投影特征、外围特征、微结构特征和特征点特征等。网格特征实际是结构模式识别和统计模式识别相结合的产物。字符图像被均匀或非均匀地划分为若干区域,称之为“网格”。具体应用:将尺寸为34×66象素的汉字二值图均匀分成32个正方形的小区域(不考虑外边框的1个象素),统计每个8×8的小区域内目标象素(白色)所占的面积比例,就得到了归一化的32维特征矢量。统计多幅相同汉字的32维特征矢量,取均值作为该汉字的标准网格特征模板。识别时,计算待识别汉字的32维网格特征矢量与模板矢量之间的Euclid距离,求得最小距离值,其对应的汉字即为识别结果。在具体应用中,由于外部原因常常会出现字符模糊、字符倾斜的情况,而网格特征匹配方法对字符模糊和倾斜较敏感,因此鲁棒性不是很强,不适合实际应用。

2 模板匹配

模板匹配是数字图像处理的重要组成部分之一。把不同传感器或同一传感器在不同时间、

不同成像条件下对同一景物获取的两幅或多幅图像在空间上对准,或根据已知模式到另一幅

图中寻找相应模式的处理方法就叫做模板匹配。简单而言,模板就是一幅已知的小图像。模板匹配就是在一幅大图像中搜寻目标,已知该图中有要找的目标,且该目标同模板有相同的尺寸、方向和图像,通过一定的算法可以

在图中找到目标,确定其坐标位置。以8 位图像(其1 个像素由1 个字节描述)为例,模板T( m × n 个像素)叠放在被搜索图S( W × H 个像素)上平移,模板覆盖被搜索图的那块区域叫子图Sij。i,j为子图左上角在被搜索图S 上的坐标。而灰度模板由于色彩、光照等因素影响,难以找到普遍适用的模板形式实现直接的匹配计算。综合以上二方面的问题,在引入统计模式识别思想的基础上,提出了基于二值图形变动分析的模糊模板匹配方案。

2.1 基于二值图形变动分析的模糊模板匹配

在含有汽车牌照的图像中,将汉字定位并提取出来以后,还要完成规格化、二值化等操作。即使是相同的汉字,由于车牌倾斜、模糊,特别是由于每次定位不可能完全精确一致等诸多因素的影响,导致在二值图中字体的形状、大小都会不同,字体位置也会发生不同程度的偏移。提出了求图形整体变动量的统计方法,其优点是不需要参照标准图形,可以进行客观评价,并构造出用于匹配识别的模糊模板。

对每一个车牌的汉字字符,选取n幅质量较好的参考图。将这n幅参考图规格化为17×33的标准大小后进行二值化处理,得到标准参考图fi(x,y)。因此每个车牌汉字字符都有n幅由0、1所组成的二值图像。将这n幅二值图像对齐后叠加,再进行归一化。得到的模糊图形F(x,y)。四个汉字的模糊图形模板(不同方向的视觉效果)如图1所示。

同的应用环境下,对匹配区域和实时性要求也不尽相同。光电探测设备需要在视频图像采集周期内(20ms)完成数据实时处理。由于目标在两场视频图像之间的移动量较小、特征变化不大,匹配区域可以大大缩小。匹配区域太小会导致目标动态特性变差,过大又会导致计算量大幅度增加,具体选择需要权衡设备参数来决定。由于CCIR制式视频信号是隔行扫描,系统出于实时性考虑,数据以场为单位处理,导致图像比例为2:1状态。为了保持水平、垂直方向的动态特性一致,图像匹配区域也按2:1比例选择。

该模糊图形上每一象素点实际上都对应着一个概率值,该概率值代表白色目标(汉字笔划)在该点出现的可能性。例如在模糊模板中若某一点值为1,表明在所有参加统计的二值图形上汉字笔划都经过该点,其为白色目标象素的可能性是100%,为黑色背景象素的可能性是0;反之亦然。进行匹配识别时,对一幅切分后的待识别汉字灰度图,将其规格化、二值化,然后计算每一象素点与模板的吻合程度,即每一象素点正确匹配的置信度con(x,y)。引入置信度的公式:

f(x,y)为得到的二值化后的待识别图像,把所有点的置信度平均后得到总的置信度con作为判别依据。最大置信度con所对应的模板汉字作为匹配识别输出的结果。

公式中的width和height分别是归一化后标准图像的长和宽。通过对实验结果的分析发现,识别错误的图像,往往严重变形、模糊,二值化效果差。

2.2 基于二值图形变动分析的模糊模板匹配的改进算法

针对以上问题,提出了一种简单的改进算法。将切分后不同大小的灰度字符图像规格化为17×33的标准尺寸以后,将各象素点的灰度值线性变换到[0,1]区间,再与模糊图形模板匹配,计算Euclid距离,其最小距离值对应的模板汉字作为匹配识别输出的结果。该方法的优点是不用对灰度图像作二值化处理,避免了由于二值化操作带来的图像信息损失。特别是对一些模糊图像,若直接采用二值化效果较差,影响匹配准确度。因此使用该方法在一定程度上提高了识别正确率。

实验中发现,对少数明暗程度变化大或对比度不强的模糊图像,该方法也产生了少量识别错误。这是由于将待识别图像的各点灰度值线性拉伸到[0,1]区间后,原始图像明暗程度不同导致其平均值与对应模板的平均值并不一致,直接用Euclid距离进行匹配,带来了计算误差。因此引入了归一化相关性度量公式:

3 试验结果的进一步校正

模板匹配表现的主要是汉字的整体特征,但是有些汉字存在着一定程度上整体的相似性,因此必须对相似的字符进行进一步的校正才能提高识别的正确率。对相似汉字的区分,往往是寻找其特有的笔划结构,这也是在统计模式识别中引入结构方法的必要之处。例如在车牌汉字识别中,“粤”字与其他省份汉字的最大区别是底部的钩状结构。为此对预处理后的17×33二值图像的底部1/4部分作水平和垂直方向的投影,水平投影17个特征值,垂直投影33个特征值,形成50维的微结构投影特征矢量。“粤”字微结构特征及其统计41幅图像后的微结构投影特征直方图如图2所示。经统计平均后作为区分相似汉字的依据。实际校正时,计算微结构特征的匹配距离。若小于预先设定的阈值,则直接返回该汉字作为识别结果。

4 实验流程及结果

对识别300幅切分后的质量较好的汉字灰度图进行识别,实验流程如图3所示。实验结果表明,外围面积特征匹配法正确率达88%,网格特征匹配法86%,简单模板匹配法91%,改进算法的正确率达到了93%。如果对识别结果进一步校正,正确率将提高到95%。若再进一步增加训练集,完善模板,相信正确率还可以继续提高。



LIDY

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭