语音识别技术带你感受不一样的语音交互
扫描二维码
随时随地手机看文章
(文章来源:百度智能云)
万物互联的时代,语音识别被视为人机交互的新入口,人与机器通过自然语言交互成为可能。近年来,语音识别在智能终端、智能家居等领域的运用也日渐深入。然而,如何让机器更好地“听懂”人类语言,更快速地进行交互,一直是各家攻坚克难的技术高地。百度智能云支持下的明星产品——语音识别极速版,很好地解决了这些难题。
百度输入法探索版发布会上,首次发布了领先国际的语音技术:在线语音领域全球首创的流式多级截断注意力模型SMLTA「Streaming trancated multi-layer attenTIon」,这是首次在大规模语音识别工业界采用注意力模型,在百度输入法产品发布后,惊艳的语音输入体验得到了业界的一致好评。
基于以上成果,百度智能云持续进行更多创新,提升识别率的同时又大幅优化解码速度。百度智能云语音方向首次将这一系列技术创新整合为语音能力对外开放——“语音识别极速版”,拥有更快的响应速度,相对识别准确度提升15%,为开发者带来更极致的识别体验。
语音识别极速版在API调用方式下,实时率小于0.1,意味着5s的音频不到500ms即可完成识别过程,极大减少了识别音频所需时间,提升了语音交互的响应体验。在近距离安静环境下,识别准确率可达到98%,同时支持略带口音、童声、耳语的识别,使语音识别应用更加广泛。
百度智能云ABC智能语音技术,致力于不断为开发者提供业界优质的语音服务:高精准语音识别,1米内普通话识别率为98%;支持中文、英文识别。高精度语音唤醒,安静唤醒精度100%;ACE打断唤醒精度97%。智能意图理解,包含200+个垂类;50+场景。
流畅自然的语音合成,中英混读;提供多音色发音人,支持语速、音调设置。这次推出的语音识别极速版拥有专有的GPU服务集群,可以提供99.99%企业级稳定保障服务。未来,多平台的SDK也即将推出,使APP、服务器端也可应用这一领先技术。