阿里发表新AI语音识别算法,嘈杂环境中准确率高达95%
扫描二维码
随时随地手机看文章
据报导,中国电商大厂阿里巴巴涉足了许多AI事业,而在今年的神经网络信息处理系统会议 (NeurIPS)中,阿里巴巴发布了一项最新的跨公司合作成果,能够在嘈杂的环境中进行语音辨认,准确率甚至高达94%至95%。
为了要能准确辨认语音,阿里巴巴利用了远场麦克风阵列以及复杂的深度学习算法隔离人群中的声音,大幅减少错误率。过去最好的声音识别技术使用麦克风阵列,有着84%的准确率,但阿里巴巴宣称他们的模型准确率更高,且就算说话者口音较重也能准确识别。目前该技术已经被用于上海地铁语音售票系统,预期未来能将该技术应用于更多的城市。
阿里巴巴数据科学与技术研究院院长金榕表示,他们试图解决无法衡量的困难,并利用AI结合创新来突破一些有趣的挑战。
在2017年3月,阿里巴巴推出了AI医疗及制造部门,而在今年9月时,阿里云服务推出新计划,建立专门的子公司,自行开发可用于自驾车的AI推论芯片。
除此之外,阿里巴巴还做了许多AI相关的研究。阿里云服务使用自然语言处理(Natural Language Processing)技术,提供实时自动翻译服务,让俄罗斯或马来西亚的零售客户能透过母语与客服对谈。
在旗下的闲鱼闲置交易平台中,阿里巴巴设置了议价机器人与顾客讨论商品价格。要开发这种机器人并不容易,需要让机器人学会谈判技巧,且要产生许多不同的文字,才能进行有来有往的谈判,不过成果非常惊艳,透过这种机器人成交的机会比一般卖家还要提高了20%。
在2017年7月时阿里巴巴推出了AI语音助理天猫精灵,自推出以来销量已超过500万个,不久后便创立了负责研究机器学习、网络安全等新兴科技的调查组织达摩院,根据阿里巴巴在2017年告诉《Quartz》的消息,在2020年以前,阿里巴巴预计将花费超过150亿美元投入研究及发展。