当前位置:首页 > 消费电子 > 消费电子
[导读]其次,传统方案里面有多个模块和多个环节,但他们并不都是以降低识别率为优化目标,这就让降噪、信号增强和最后的识别可能会出现不适配的情况,使得系统虽然降了噪,但没有得到想要的识别率的提升。

根据 ReportLinker的预测,到2024年,全球智能语音市场规模将跃升到215亿美元,而在当中AI语音芯片就扮演了一个关键角色。不同于过往的芯片只考虑PPA,开发者在选择语音芯片的时候更多是考虑其体验,但这是很多过往的硬件解决方案所不具备的。这就吸引了众多传统厂商或者初创企业开始纷纷涌入AI语音芯片这个赛道,用MCU、DSP或者ASIC的方案来解决现有,有些厂商甚至还推出了颠覆传统的新架构去抢占市场。

但在行业专家看来,这些方案或多或少都存在一些问题。要了解这一点,就必须从语音识别行业的一些现状说起。

语音识别面临的几大挑战

以智能音箱为例,现在的语音识别产品在厂商的智能家居规划蓝图中是扮演一个人与机器交流的桥梁,那在实际应用中就要求音箱能够听得到人说的话,同时还要求它听得清晰和听得准。这就提出了第一个挑战——那就是信噪比。

所谓信噪比,就是目标信号与干扰信号强度比值的对数,我们需要一定的信噪比,才能让机器听得清楚。但根据声音的传播特性,它在空气中衰减会非常大,但人在与智能音箱交流的过程中,可能会处在不同的位置和距离。这就给相关的方案提供商提出了一个难题,这也是语音识别所面临的最大挑战。

第二个问题是非稳态的噪声影响。如果我们面对的是规律的噪声,应对的办法无疑会简单很多。但在实际的使用环境中,我们经常会面对的是带有突发性和不可预见性的噪音,这给供应商也带来了不小的挑战。

第三,多声源的问题。智能音箱在使用的过程中,只会听从一个声源的指令,但在人机交流的过程中,必然会出现干扰源。如何处理这个干扰的问题,也困扰着相关供应商和开发者。

而其实面对这些问题,产业链已经想了不少应对之法。例如麦克风阵列、波束成形和降噪的引入,更强的人工智能芯片加持,但这依然没有能彻底解决问题。

如上图所示,在传统方案中,系统最后识别的信号是在波束成形之后做的,因为波束成形依赖于声源定位(即DOA),但DOA一般用单MIC信号来做检测。换而言之,我们这样设计的目的原本是为了提升唤醒率和识别率,但依赖于单MIC信号的检测之后,两者之间就存在相互依赖的关系,这就会给设备的唤醒率造成影响。

其次,传统方案里面有多个模块和多个环节,但他们并不都是以降低识别率为优化目标,这就让降噪、信号增强和最后的识别可能会出现不适配的情况,使得系统虽然降了噪,但没有得到想要的识别率的提升。

再者,传统的流程对硬件要求非常高,对MIC的一致性以及电容元器件的一致性要求非常高。这就节能会导致大家在实验室和在量产线上取得不同的结果。量产场景下的识别率非常差。这主要与波束成形和声源定位要求高,一旦出现波动会影响识别效果有关。

此外,波束成形算法原理是增强设定波束内的信号强度,衰减波束外的信号幅度。那就意味着当干扰声源和目标声源方向非常接近的时候,信号和噪声是会同时增强,这是传统波束成形算法也不能解决的问题。

单从芯片的角度看,也有不少的困难要面对。如算力问题、冯诺依曼架构带来的内存墙问题,还有基于浮点训练出来的模型与定点推理之间的不匹配引致的重新训练和精度丢失等问题。其他如对神经网络支持不够、功耗过高和开发复杂等也是当下很多语音识别芯片的掣肘所在。

市场渴求更好的解决方案。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭