智能手机及平板电脑的语音辨识应用
扫描二维码
随时随地手机看文章
近年来,智能手机和笔记本电脑等移动/便携设备市场持续快速发展。这些产品在不断集成更多新功能以增强用户体验的同时,在基本语音通信功能的用户体验方面仍有充足提升空间,特别是在嘈杂环境下提升语音清晰度,同时保持语音自然逼真度。例如,用户在拥挤的商业街区行走时,周围环境中可能充斥着汽车喇叭、发动机轰鸣、建筑施工噪声、嘈杂人群噪声、脚步声甚至是风噪等,此时用手机进行语音通话时,传统技术难以提供清晰的语音通信效果。此外,制造商也在为新兴的平板电脑等增加视频通话功能。在利用这些移动/便携设备用于电话会议时,周围环境中同样可能包括多种噪声,如办公室嘈杂人声、周围谈话声、电脑噪声、笔划噪声及玻璃器皿碰击声等,要提供清晰的通话效果同样不易。
在这些应用中,要降低或滤除环境噪声,提升语音通信效果,可以采用不同的方法,如专门降噪麦克风、模拟电路降噪或数字电路降噪等(见表1)。这些方法各有其特点,相比较而言,采用数字电路降噪的方法灵活,声学设计复杂度较低,且降噪效果优越。当然,便携设备设计人员除了要提供良好的降噪效果,还面临着多种设计约束及挑战,如尺寸、能耗、物理声学设计、音频保真度及成本等。
表1:不同降噪技术比较。
<center sizset="4" sizcache="5">
先进的双麦克风实时自适应噪声消减技术
安森美半导体最新推出了基于数字电路降噪技术的BelaSigna R261高性能语音捕获系统级芯片(SoC)。该器件采用先进的双麦克风噪声消减技术,能够帮助设计提供优异的噪声消减效果(参见图1)。这种先进的信号处理技术接受两个麦克风的信号,能够区分不同类型的信号,提取有效的语音信息并抑制环境噪声,从而提升语音辨识度。
图1:BelaSigna R261采用先进的实时自适应噪声消减算法。
BelaSigna R261在其集成的ROM存储器中内置了语音提取算法。这种算法利用一个或多个传感器来提取波形传播信号,而不需要预先知道声源或传感器位置。这种方案利用全局优化准则,同时工作在频域、时域和空域,对声源的数量及传感器的数量没有限制,与信噪比(SNR)无关,即在低SNR和高SNR环境下能够同样优化地工作,非常适合于需要从不同噪声域中提取有用语音信号的手机和便携计算机等应用。
这种自适应噪声抑制算法提供25 dB的噪声抑制能力,能够实时地分离需要的语音与环境噪声,适合于各种语音源和各种位置下的语音,同时能够保证音质自然(其它方案处理后声音不自然、不饱满),可以有效配合各种品质的麦克风工作。
BelaSigna R261关键特性解析
BelaSigna R261是一款高性能的语音捕获SoC,集成了数字信号处理器(DSP)、稳压器、锁相环(PLL)、电平转换器及ROM存储器,如此高的集成度与其它方案相比,能够降低物料单(BOM)。如图2所示,这器件支持双麦克风直接输入,噪声消减算法内置于集成的ROM存储器中,基于DSP结构的应用控制器提供高性能及超低能耗,提供双通模拟输出,并支持数字麦克风输出。此外,内置的电源管理模块支持1.8 V至3.3 V的供电电压,内置的片上PLL提供多种频率选择,还提供I2C接口。
图2:BelaSigna R261 高性能语音捕获SoC功能架构图。
[!--empirenews.page--]
特别值得一提的是,BelaSigna R261采用的双麦克风实时自适应噪声消减算法提供两种基本的算法模式,分别是远距离拾音模式(算法模式0)和近距离拾音模式(算法模式1)。算法模式0针对远距离拾音而优化,可以拾取多达6米远的语音,同时抑制噪声,并支持360度全方位拾音,适合于笔记本电脑、免提电话/会议或手机免提通话模式。在这种模式下,即使用户没有对准麦克风,甚至是远离麦克风,都能提供极佳的语音清晰度,从而增强用户使用的自由度。算法模式1针对近距离拾音而优化,这时用户离麦克风极近(距离小于5厘米),即在近距离内拾取语音,有效抑制各种环境噪声,适用于手机、学习机、对讲机等在强噪声环境中工作的设备。
除了这两种基本算法模式,BelaSigna R261还提供定制算法模式,帮助制造商满足特定应用需求。这种算法模式支持特殊配置,并能够通过外部EEPROM或I2C控制接口加载新的算法参数来调整。算法效果能够根据特定应用、麦克风类型、位置及其它系统参数来优化。
表2:BelaSigna R261支持远距离拾音、近距离拾音及定制等不同模式。
如上所述,BelaSigna R261提供高集成度,内置自适应噪声消减算法,能够直接连接至数字麦克风接口或主芯片(基带处理器)的麦克风输入端。故除了支持多种拾音模式,这器件的另一项重要优势就是便于集成到设计之中,可将设计入选(design-in)所须的时间和工程工作减至最少,因为设计团队不须开发或获取算法,也不须设计复杂的支援及接口电路。
这器件也使关注成本的原设备制造商(OEM)能够在设计中采用便宜的两个(不一定匹配的)全向麦克风,令麦克风的布设更灵活,且生产线上不须调试麦克风,进一步节省时间及成本。这SoC采用极紧凑的5.3 mm2 WLCSP封装(包括26球和30球两种版本),占用的电路板空间比其它可选方案小得多,即使空间最受限的便携消费电子产品外形因数也用得上。此外,这器件在3.3 V电压时的电流消耗为15 mA,能耗极低。
BelaSigna R261应用设计要点
由于BelaSigna R261基于ROM的噪声消减算法非常灵活,麦克风布局(物理声学设计)就存在多种可能的选择,但默认算法只有麦克风以下述方式布局时才能最优工作:1)两个麦克风面向用户的嘴;2)两个麦克风的中间点位于距离各个麦克风10至25 mm范围内。当然,使用定制模式时也能使用其它麦克风布局配置。
在电路设计方面,BelaSigna R261的设计针对的是在单个系统中同时支持数字及模拟处理。由于这种混合信号电路属性,要维持高音频保真度,审慎设计印制电路板(PCB)布线就至关重要。为了避免耦合噪声进入音频信号路径,要使数字信号走线(trace)远离模拟信号走线。为了避免电气反馈耦合,还需要将输入走线与输出走线隔离。
在接地设计方面,接地层应该分为两部分,分别是模拟接地层(VSSA)和数字接地层(VSSD)。这两个接地层应当通过单个点(即星形连接点)连接在一起。星形连接点应当位于电源稳压器输出端电容的接地端。当然,这些只是设计人员在应用BelaSigna R261设计时需要注意的部分问题。详细的设计要点参见参考资料2。
总结:
便携设备音频系统设计人员需要易于集成到其系统中的高性能语音捕获方案,同时满足其对尺寸、能耗及成本等方面的要求。安森美半导体身为应用于高能效电子产品的首要高性能硅方案供应商,以BelaSigna R261高性能语音捕获SoC为设计人员提供简便的选择。这器件具备高集成度,内置先进的自适应噪声消减算法,支持多种语音拾取模式,使智能手机、对讲机、笔记本及平板电脑等应用都能够提供清晰舒适的语音通信,具有极高的设计灵活度,同时尺寸小、功耗低,便于选用低成本的麦克风,使各类便携消费电子产品制造商都能大幅提升语音辨识度及客户满意度,并加快产品上市进程。