当前位置:首页 > 嵌入式 > 嵌入式硬件

随着现代电子技术在汽车系统中的不断应用,越来越多的车载电器加入到车身电子行列中,使得汽车的各种性能都得到了极大的改善,但汽车驾驶室的开关也越来越多, 这就为驾驶员行车中对车载电器的操作提出了更高的要求,同时也给行车过程带来了不安全的隐患。随着语音识别算法的改进和新一代Soc专用语音处理芯片的问世,使用语音命令控制汽车电器的操作能够部分用口代替手的功能,从而减轻驾驶员操作负担,提高行车安全系数。

目前我国的车身电子语音控制主要集中在汽车导航系统的应用上,没有充分发挥语音识别技术在车身电子中的应用价值。本文提出了一种的以专用语音处理芯片UniSpeech-SDA80D51为核心控制车载音响操作的设计方案,并在SL1102C1型车载音响上实现了对非特定人的语音识别与控制。

语音控制器硬件

车载语音控制器系统由定向拾音器、语音识别模块、控制模块和音响模块组成。系统的功能是:由拾音器采集驾驶员发出的语音命令,利用语音识别模块将拾音器输出的语音物理声音信号转变成语音数字信号,并识别出语音命令对应的汉字或词语,之后由控制模块产生与之对应的词条编码指令,通过系统I/O口线将控制命令传达给音响,车载音响接收到控制指令产生动作,响应驾驶员的语音命令,比如快进、快退或音量调节等。系统结构及原理框图如图1 所示:



语音识别模块主要由UniSpeech-SDA80D51芯片及外围电路组成。本模块主要实现对输入的非特定人语音信号的识别和处理功能,输出与语音命令对应的词条编码。

SDA80D51是Infineon公司专为语音识别和语音处理应用领域新推出的专用芯片,采用高集成度的Soc系统结构以0.18μm半导体工艺制造,拥有8位高速增强型M8051核心(25MIPS)和16位定点DSP核心OAK(100MIPS)的双核架构,片内集成了直接双访问快速SRAM、2路ADC和2路DAC(有效精度为12Bit)、多种通信接口和通用GPIO等设备,外部只需扩展Flash存储器等少量外围电路即可构成完整应用系统。

控制模块由MCU和模拟开关电路构成,本模块主要完成对语音识别模块输出的识别结果--词条编码信号进行逻辑分析和处理,通过模拟开关电路产生对应功能的控制信号输出到音响,控制音响的操作。其中MCU选用美国ATMEL公司产品AT89S51,由于车载音响SL1102C1上的按键控制面板为电阻式分流键盘电路,采用电压采样识别模式,对不同键值进行识别,综合SDA80D51芯片输出的I/O电压特性,确定使用继电器模拟SL1102C1控制面板按键的闭合和断开动作。

本设计是基于安徽森力公司的SL1102C1汽车音响。SL1102C1是专门为中档轿车设计的汽车音响,具有MP3播放、收音机和显示时间等功能,目前大量使用在江淮同悦轿车上。SL1102C1前板共有15个按键和一个用来调节音量的编码开关。分别为开关机/静音、音效设置、6个台位、播放/暂停、随机播放、重复播放、浏览播放、选择下曲(快进)、选择上曲(快退)、向下搜台/上一曲、向上锁台/下一曲、模式转换、电台浏览/自动存储台、波段切换、显示时间/时间设置和复位等功能。

音响前板上的按键为电压采样识别方式,按键包含短按(延时小于0.2s)和长按(延时大于1s)两种动作,控制模块MCU(AT89S51)的输出电压为TTL电平,直接采用MCU信号驱动音响按键动作容易引起误识别,造成系统误操作,因此本文采用模拟开关电路,很好地解决了上述问题。当AT89S51接收到语音模块输出的一个语音命令识别结果编码信号后,立即进行逻辑分析并输出对应的控制信号驱动相应继电器吸合模拟按键动作,按键的短按和长按功能是通过软件实现的。

系统软件设计

系统的软件包括:非特定人语音识别模块和逻辑控制模块。

非特定人语音识别模块基于HMM 模型算法。该算法通过对大量语音数据进行数据统计,建立识别词条的统计模型语音库,然后从待识别语音中提取特征,与模型库进行匹配,由比较匹配分数得到识别结果,并通过SDA80D51的GPIO口输出识别结果对应的词条编码信号。语音识别模块主要由信号预处理、特征参数提取、模型匹配和Viterbi算法部分组成。

信号预处理部分主要完成输入语音信号的采样、 模/数转换功能。A/D变换由SDA80D51内嵌12位A/D变换器实现,采样频率固定为8 kHz.

特征参数提取基于语音帧,采用分帧提取特片。先对语音信号进行重叠分帧,前一帧和后一帧重叠一半(帧信号重叠是体现相邻两帧数据之间的相关性),帧长为25ms,对每帧提取一次语音特片。

MFCC参数属于感知频域倒谱参数,反映了语音信号短时幅度谱的特征。p维MFCC参数的提取过程如图1所示。

其中:m是帧号,N是单位帧内的采样点数。

HMM是描述语音信号的一种概率统计模型,使用 MarKov链来模拟语音信号统计特性的变化,HMM模型是在Markov链的基础上发展起来的。

Viterbi算法是一种帧同步动态规整算法,在给定观察值序列和模型时,Viterbi算法给出了一个概率密度P(Q,O | λ)最大的状态序列。

控制模块的主要功能是:在单片机查询到语音模块输出的语音词条信号后,查表获得词条编码,根据编码判断对应按键是长按或短按,分别进入相应的子程序处理,长按子程序延时1s,短按子程序延时0.2s.在子程序中,输出语音命令所对应的I/O控制信号驱动继电器吸合模拟按键或编码开关动作,并及时复位I/O口。为了避免语音控制和手动控制之间冲突,语音控制模块可以完全兼容于手动控制,在语音控制操作时,同时可以进行手动控制。

实验结果及结论

本系统的样机实验主要是测试非特定人的语音识别率和模拟开关动作的准确率。由于汽车音响的语音词条为2~4个字,语音识别率实验内容为车载音响常用2字词条指令18条、3字词条指令12条、4字词条指令10条,实验对象为6人4男、2女(普通话和方言),实验环境为噪声干扰环境和相对安静环境,样机测试结果如表1所示。



由表1可知,系统的识别率与语音指令词条字数、麦克接收距离、说话人方言及环境有关。4字词识别率高于2字词,相对安静环境下识别率可以达到90%以上,男声和女声的识别率接近。有噪声干扰环境中识别率下降。为了提高系统的识别率,系统样机采用奥林巴斯 ME52定向麦克(在表中没有反映),提高了麦克接收范围,使系统总体的识别率上升到95%.

在系统样机控制电路实验中,模拟开关动作达到了较高的准确率,测试结果为98%以上,只要控制程序运行正常,各路继电器就能按照程序安排执行闭合和断开模拟手动开关操作。

实现汽车电器的语音控制是未来车载电器的发展趋势,越来越多的解决方案在不断的被提出和验证。本文提出的设计是在SL1102C1型车载音响上使用SDA80D51芯片,实现了车载音响非特定人的语音识别与控制。由于该芯片集成度高,需要外围模块少,设计的硬件电路简单,便于调试检测。该设计得到的样机,有较高的识别率、工作稳定、可扩展性强,达到预期的设计目标,整个设计方案和实现方法是可行的。由于语音识别率随着环境,说话人不同而变化,虽然HMM在噪声很少的环境下可以获得很高的识别率,但当测试语音或者环境中含有不同程度的噪声污染时,语音识别系统的性能会很快地下降。提高系统的抗噪性和鲁棒性是语音识别系统走向实用化的关键之一。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭