冲电气推出语音合成软件 真实再现自己原音
扫描二维码
随时随地手机看文章
冲电气工业株式会社(OKI)日前宣布,推出连语气、语调等特征也非常接近自然嗓音进行发声朗读,能再现自己声音的软件“Polluxstar®”。通过个人电脑等使用“Polluxstar”,可以避免用无个性的机械合成音发声,实现用具有本人讲话气氛、个性的“自己的声音”进行交流沟通。
冲电气长期以来积极研究开发为语音通信提供后盾的技术,在VoIP、CTI市场占据相当高的份额,拥有骄人业绩。在将文本数据转换成语音数据的语音合成技术(TTS:Text-To-Speech)领域也进一步超越了以往技术,积极进行既实现清晰易听,同时还能体现本人个性的语音技术开发。
语音是最基本的交流沟通手段之一,不单纯是用语言表达意思,还承担着传递“非此人莫属”(本人性)的重要责任。冲电气以一般人按普通发声规律不一定完全正确的语音数据,在不勉为其难的收录量下也能再现“自己的声音”为目标积极推进研究开发工作。该项研究成果表明,可以构筑高效稳定的语音数据库,成功实用化了再现“自己的声音”的技术。
大阪艺术大学执教于信息工学的牧泉教授因病必须摘除声带,冲电气在牧教授手术前,收录了他的语音数据,并将这些语音数据编入自己的声音软件“Polluxstar”提供牧教授使用。牧教授从2008年4月开始使用本软件上的“自己的声音”,在大学里重新开始授课。结果证明“Polluxstar”软件已经达到了在普通人的日常生活中也能有效使用的水平。而且,在向普通人提供该软件之前进一步完善了功能。
冲电气对于因疾病等原因失声的人士,作为代替这些人发声,支援其本人及家庭成员生活的工具,开始销售“Polluxstar”软件。本公司认准运用个人特性的声音必将发挥重要作用,准备通过在各个领域扩大该软件的应用范围,积极推进不断丰富语音交流的语音合成技术的开发。
【主要特点】
以合理的成本制作能再现自己声音的语音数据库
为了完美再现本人的语调?气氛,必须高效收集充足的语音数据,并且将之数据库化。用于语音合成的语料库TTS技术,是在国际电气通信基础技术研究所(ATR)开发的面向大规模语料库的语音合成技术中,结合了冲电气自主开发的面向小规模语料库的数据库技术的技术,既能保持非常逼真的自然嗓音感,又能以合理的成本提供再现“自己的声音”的Polluxstar软件。包括收录语音在内,构筑语音数据库所需时间约为1个月。
广泛支持日常生活用语
日常生活中使用的言词、语调因人而异。在预先准备的讲稿中加入客户固有的原稿,可以加强该客户特有的语调气氛。而且,可以事先登录客套话、对亲朋好友的称呼等最能表现此人特点的特定词组语音数据。从输入的文字串中识别已登录的词组,原样输出此语音数据。通过这些方法,可以消除与合成音的音质差距,再现能体现本人个性的自然而微妙的语气。
在日常生活中方便实用的用户界面
以大量验证试验等获得的经验为基础,实现了在日常生活中切实可用的语音合成用户界面。加上以聊天软件为特点的能实时从键盘输入文章的功能,只要预先登录经常使用的语言技巧、事先决定了内容的文章,根据文本列表(Text Feeder),只需单击就能实现语音输出。还能支持一对一的对话、众人前的演讲等不同使用情况。