科大讯飞关注语音技术前瞻性应用
扫描二维码
随时随地手机看文章
作为全国唯一以语音为主要产业化方向
的“国家863计划成果产业化基地”,科大讯飞公司近日在“国家8 63计划十五周年成就
展”上向观众展出了代表着国内最高水平的中文语音合成系统、全系列行业和桌面应用产品,以及
虚拟主持人、机器人足球赛虚拟评论员等代表未来语音技术发展方向的前瞻性应用形式。
有听和讲能力的口语系统,使电脑具有类似于一样的说话和听懂人说话所必须的关键技术,也是2
1世纪国际信息产业竞争的重要阵地。中国科技大学在国家863计划的支持下,开发成功了可实
用化的KD汉语文语转换系统。科大讯飞在中国科大长期积累的语音技术和人才的基础上进行产业
化运作,目前,已经成功开发出KD2000、KB2000和KM2000等中文语音合成系列
产品。同时,根据不同应用平台和行业应用需求,开发了电话语音平台、有声电子邮件系统等多种
行业语音信息服务解决方案,以及包括畅言2000、听网、开口上网在内的桌面语音交互环境等
多系列应用产品,大大推动了语音技术在国民经济各行各业和社会生活中的应用,创造了良好的经
济和社会效益。
本次展会上,“虚拟主持人”和“机器人足球赛虚拟
评论员系统”引起了很多参观者的强烈兴趣,成为本次展会的两个“明星”。科大讯飞展出的虚拟
主持人是首个面向内容的中文虚拟主持人。因为这一系统中应用了科大讯飞的最新开发出的大语料
库语音合成技术,使得虚拟主持人可以将来自于不同信息源的内容以虚拟人物实时发音的形式,更
加自然地表现给观众。此外,通过对多模态用户界面和头部建模技术、唇形同步技术以及表情挠动
技术方面的深入研究,科大讯飞使得这一虚拟人物对人的表情、动作模仿得更加逼真。据悉,这一
系统将国内多模态输出技术的研究首次提升到实用化的层面,使得人们获取信息更加富有人性化。
作为对人工智能领域的积极探索,“机器人足球赛虚拟评论员系统”是
围绕Action-to-Speech的概念、深入形势分析与决策、自然语言生成、超表现力
特定领域语音合成等方向的研究而最终实现的。这一系统对于未来跨模态信息提取和转化方面的研
究具有重要的示范作用。
据业内人士介绍,目前国内语音技术已经发展
到比较成熟的阶段,其广阔的产业前景已经被业界认同。智能、高效、自然、和谐的人性化沟通环
境在不久的将来将成为现实。(新华网)