超低价语音识别芯片能否颠覆人工智能
扫描二维码
随时随地手机看文章
Google 工程师 Pete Warden 在英国 ARM 研究高峰论坛表示,他希望打造超便宜的语音识别产品,搭载只要 50 美分的超低价芯片,一个硬币大小的电池,足以维持一年的电力,再搭配简单的人工智能算法, 就可以让语音识别产品快速普及。
麻省理工科技评论(MIT Technology Review)报导,这种超便宜的语音识别芯片可用来生产便宜的对话玩偶,或是简单的家用电器,如可被语音驱动的灯。 在工业环境应用,这种芯片可辨识不寻常的声响,或是农田里的蟋蟀。
Warden 为 Google 的云端人工智能工具开发行动和嵌入式应用,称为 TensorFlow,他在开发过程中发现亚马逊的 AI 助手 Alexa 透过电池供电的简单芯片运作,频率只有几百兆赫是不够的,原因是 Alexa 必须辨识许多不同的声音,而且因为大多数语音识别 AI 工具使用的神经网络资源匮乏,这就是为什么 Alexa 必须将处理任务交给云端的原因。
为改善上述问题,Warden 限制问题的问法,譬如只能使用开、关、启动、停止等字眼,并舍弃一般语音识别算法,他拿一个音频将其切成短片段,然后计算每个片段的频率内容,接着一个接一个排列每个频率图, 以建立一个频率内容与时间的二维图像,并应用视觉辨识算法来辨识单词的独特记号。
第一次尝试分析音频的 1 秒钟片段需要 800 万次计算,准确度为 89%,这可用现代智能手机运作,并且互动速度也够快,这种方式比将运算过程送到云端更好,但是在低功耗芯片上性能不佳。
后来开发团队借鉴一些帮助 Android 手机辨识短语的算法技巧后,系统只需执行 75 万次计算,就能达到 85% 的分析准确率,研究团队已经在 TensorFlow 网站发表代码供他人使用,他们打算应用在类似单芯片微控制器 Arduino 搭载的更小芯片。
但英国剑桥大学前 AI 研究员 Tony Robinson 认为,低成本策略可能可以帮助语音识别产品普及,不过用户不太可能按表操课,大多数人没有耐心使用高度限制性的指令,认为功率稍微高一点,可以处理更多语言能力的芯片, 可能更适合消费者应用。