未来语音芯片在AIoT道路上的发展情况如何
扫描二维码
随时随地手机看文章
(文章来源:亿欧网)
所谓语音芯片,或者叫语音IC,是指一台电子设备中负责发出声音、收录声音的处理模块。事实上,这东西在你的家中可谓无处不在。大到电视、电脑、音响,小到手机、录音笔、音乐播放器,甚至电磁炉、冰箱、洗衣机发出的那一声“滴”,背后也都需要专门的语音芯片来进行控制。
这个领域听上去没什么技术含量,毕竟今天哪个设备还不会响呢?但事实上,其背后的设计技术和定制化生产能力,加上庞大的应用数量附带的低成本要求,多种因素导致了今天中国的语音芯片市场还是主要依靠进口。目前,国内语音芯片市场需求中,只有16%左右可以由国内厂商来满足。我国每年要进口超过2000亿美元的语音芯片产品,这个数字超过了我国每年原油进口总额。
如果我们把这个情况带入今天的中美贸易争端大背景中,不难发现这又是一个并不安全的“卡脖子”产业。由于大量依赖进口,缺乏底层设计技术和大规模量产能力,语音芯片一旦被卷入贸易莫测,很可能对半导体行业,甚至整个电子产业带来连锁反应。为了摆脱产业链下游的地位,这些年来中国相关产业也在进行一系列行动。比如大规模收购美国和欧洲的语音芯片企业与专利技术,但类似收购经常被各种因素打断,流产率远大于成功率。
另一方面,今天大陆市场购买的语音芯片,其实大部分产自日本、韩国和中国台湾地区。在中美贸易战的大背景下, 稳固和发展与这些国家和地区的产业联动关系,也就变得相对重要。这一领域人才的流动,近些年也成为大陆发展语音芯片的新动向。比如随着台湾地区经济发展放缓,大量台湾的语音芯片人才选择来大陆工作,客观上成为推动大陆发展自身产业链的推助剂。
然而在众多因素中,目前最有可能改变语音芯片全球贸易结构的,其实还是新技术的崛起。从AI到5G,这些我们耳熟能详的名字背后,语音芯片迎来了不小的“变数”。我们知道,传统意义上的语音芯片只负责录音和播放声音,其主要难度在于传输准确率、信号稳定性等方面。而这两年一个新崛起的市场,却让“古老”的语音芯片,看到了变化的可能。
一般来说,芯片厂商的优势在于AI语音芯片其实并不需要特别难的技术门槛,而且对量产能力和成本把控能力具有相当强的要求,这些都是芯片企业的强势。而对于新技术的理解,尤其是对AI算法的融合,则成为了芯片厂商的短板,因此与AI公司的合作往往成为了今天的主流。
但是AI公司在芯片上的弱势也是显而易见的。AI语音芯片并不是个高净值产品,往往必须依赖大量生产和大规模出货才有可能盈利。而在集成化和工程能力上,AI公司显然处于弱势。目前AI独角兽们的语音芯片计划,更多还停留在对量产的肯定与承诺中。
而这里需要注意的是,AI+5G+IoT的组合,虽然打开了语音芯片的新想象力。但是在这个逻辑里,未来能占据广泛市场的芯片模式,绝不是今天智能音箱芯片的模样。语音芯片本身,变化才刚刚开始。基于上文描述的逻辑,未来语音芯片的变革机会,将基于新网络条件下的大批量、全场景设备拥抱AI。那么符合这样逻辑的语音芯片产品事实上还没有出现。而从这个角度看,行业的准入证依旧没有停止发放。
所谓三低,是指低成本、低功耗,低时延。5G时代的物联网设备,理论上来说应该是可以长时间待机,尽量贴近可移动化的。因为设备将部署在海量并发场景,这也就让语音芯片的基础要求是足够省电和足够便宜。理想中下一个阶段的语音芯片,是能够随时保持等待唤醒,但在等待唤醒状态下极低能耗的。未来的物联网芯片、语音芯片、视频处理芯片,其实很大一部分竞争将围绕三低展开。
在AI技术向产业化的发展中,今天一个很明显的趋势在于,多模态AI能力正在明显提速。尤其是将语音识别、语义理解,与机器视觉任务相结合的AI模型。如果想要让类似任务计算效率达成最优,那么在芯片端对多模态的加速就变得十分重要。也许未来我们需要的,是机器感官芯片,而非语音芯片或者多媒体芯片。
这些发展逻辑,各自对应了新的技术挑战与变化机遇。毫无疑问,今天中国的AI语音虽然看起来红火,但距离大规模量产应用,以及部分替代目前芯片进口需求还有十分漫长的路要走。类似语音芯片的产业,在中国还有千千万万。我们只能勉励发展、聚拢人才,并谋求在新的技术剧变中发现调换座椅的机会。