百度发布AI输入法:语音识别精度提升15%支持凌空手写
扫描二维码
随时随地手机看文章
1月16日,百度召开新品发布会,宣布百度输入法AI探索版正式发布,这是一款默认输入方式为全语音输入,并调动表情、肢体等全感官输入的产品。
据了解,百度首先宣布了在语音技术方面取得的突破,流式截断的多层注意力建模(SMLTA)已经将在线语音识别精度提升了15%,这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题。
在离线语音识别方面,百度优化了Deep Peak 2系统,让离线语音输入相对准确率得以高于行业平均水平。此外,中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入等百度AI输入法都针对性进行了优化。
在新玩法方面,百度输入法AI探索版推出了拍立活、秀场、凌空手写等新功能,“拍立活”功能可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用了图像分割技术,用户可以“穿越”到不同的虚拟场景之中;凌空手写,可以让在空中书写也能被识别。
本次发布会,百度还介绍了百度海外输入法的相关情况,展示了日语识别、印地语识别和印英混输功能。据第三方数据显示,百度日文输入法Simeji的语音识别结果用户可接受度占比90%;在文盲率高达30%的印度地区,百度海外输入法推出的印英混输识别功能使用率21%。
据悉,截至2018年底,百度输入法月活跃人数为5亿,语音日请求量峰值5.5亿,AR表情使用次数1亿。海外输入法全球安装量1亿,支持120种语言。