智能语音成下一金矿 微软、谷歌加速跑马圈地
扫描二维码
随时随地手机看文章
21ic通信网讯,随着移动互联网发展,语音交互的重要性尤为突出,语音市场已经成为兵家必争之地,市场上掀起“圈地运动”。苹果的Siri已经广为人知;谷歌日前发布的“O K G oogle”,语音控制命令就成为一大亮点。而微软则在实时翻译领域另辟蹊径。
日前,在微软亚洲研究院举办的“创新日”活动上,微软也亮出其智能语音技术的最新成果:“实时语音翻译系统”和“基于K inect的手语翻译系统”。微软亚洲研究院院长洪小文表示,跨语种沟通,以及聋哑患者与正常人之间的沟通,目前还处于初级的靠人翻译的阶段,沟通成本极高。如果能从技术上解决这一问题,不但能极大地便利人们的生产生活,也有着巨大的商业潜力。
微软发力“智能语音”
智能语音市场被视为IT界的下一个金矿,苹果、谷歌等IT巨头早已在这个领域布局卡位,国内的科大讯飞、云知声也在觊觎这块市场。对于微软来说,自然不会对这个市场无动于衷。
在日前微软亚洲研究院举办的“创新日2013”活动上,本报记者见证了精彩一幕:借助微软的“实时语音翻译系统”,微软亚洲研究院院长洪小文以中文和其说英语的同事、来自纽约长岛的麦特实现了顺畅的交流。更让人叫绝的是,这套系统还能够将洪小文讲中文的发音、语调,转换成英文的发音、语调,个性十足,而不是想象中或者科幻影视剧中干巴巴的机器人语言。
除了实时语音翻译系统”之外,微软另一项“基于K inect的手语翻译系统”技术也备受关注。据悉,该系统由微软亚洲研究院与中国科学院和北京联合大学合作开发,借助K inect设备对手语进行识别和翻译,同时支持对汉语手语和英语手语的识别与翻译,并能将文本信息反向翻译为手语,可帮助不同文化和语言背景的听障人士实现“发声”梦想。
基础性研究亟待商业化
洪小文告诉南都记者,这次展示的“实时语音翻译系统”和“基于K inect的手语翻译系统”,都是微软与合作伙伴一起,在大量基础性研究基础上,推出的应用成果。不过,洪小文也承认,由于技术还在研发过程中,有些翻译会出点错误。但随着技术的逐步成熟,人们将不会再面临因为语言不通而无法沟通的困境。“这些成果一旦技术成熟,就将产业化,为消费者服务。”
作为微软在美国本土以外规模最大的基础研究机构,微软亚洲研究院一直致力于从事计算机基础研究。截至目前,微软亚洲研究院拥有360多项技术转化,孵化出微软亚洲工程院、微软亚洲搜索技术中心等重要机构。洪小文表示,信息技术的革命对人类生活方式的影响堪称深刻和神奇,飞速进化的计算能力、不断降低的计算体验成本让人们能够通过智能终端和互联网达成工作、娱乐、沟通等各种目的。人机界面、云计算、大数据、机器学习、人工智能……许许多多新型设备之所以能够问世,能够为人们所接受和喜爱,其实都离不开计算机基础科学在背后的支撑。