国内类Siri应用频出 存智能化程度不够高问题
扫描二维码
随时随地手机看文章
搭载Siri功能的iPhone4s一经推出便在市场上掀起了不小的波澜。
与以往不同的是,iPhone4s本身并没有给广大“果粉”带来太多的惊喜,反而是嵌入iPhone4s的叫做“Siri”的语音助手火了起来。在iPhone4s还未推出之际,江湖中关于“Siri”的传说和猜想就从未间断过。
Siri是苹果公司在其产品iPhone4S内嵌入的一项语音控制功能,它可以令iPhone4S变身为一台智能化机器人,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
但是苹果公司极力宣传的这一功能并没有得到广大“果粉”们的认可,纽约的一位iPhone4s用户弗兰克·法齐奥(FrankM.Fazio)甚至在加州联邦法院提起诉讼,指控苹果发布的广告中对Siri功能的描述存在“误导性和欺骗性信息”。
Siri的稍显不“成熟”并没有阻碍语音智能应用盛行的趋势,反而其商业上的成功使众多国内外商家蠢蠢欲动,摩拳擦掌起来。
国内“类Siri”应用大量涌现
据小编的不完全统计,目前在市场上出现的类Siri的语音助手已经有十多种,这其中包括国外的iris、Assistant、Evi、cluzee等英文版软件,也包括国内应用市场上出现的虫洞、语点、智能360、Ciriis等中文版的语音助手。
实际上,Siri也并不是手机上出现的第一个智能语音助手。据悉,最早出现的语音助手是Speaktoit、Vlingo这类工具,但它们的弊端在于只能听话,不能说话,这在一定程度上桎梏了他们的发展速度。被苹果公司收购之后,Siri让越来越多的智能手机用户关注语音助手,它的兴起让人们真正意义上了解到语音助手这项技术。iPhone4S搭载的Siri则听、说功能兼具,在一定程度上弥补了前者的不足,也让人们开始关注这一领域的发展。
而市场上出现的类Siri应用,给小编的一个最大的感受是智能化程度不够高。对于一些关于日常的衣食住行或是相对简单的问题,这些语音助手基本上都能够给予相对明确的答复,但是对于一些稍微复杂的问题,尽管与其交流的时候“鸡同鸭讲”得挺热闹,但通常给出的答案都是模糊两可或者干脆打起了太极。
“你有男朋友吗?”“目前智能360想的最多的不是个人问题,而是努力工作。”这是智能360给出的回答。同样的问题虫洞给出的回答则显得很应景,“男朋友??我说有的,至于你信不信,反正我是不信。”当小编继续问道:“美国为什么攻打伊拉克?”虫洞给出的回答显得有些装傻卖萌:“不懂!呜呜呜,我怀疑你是故意欺负我,我准备告诉我妈妈。”
技术壁垒:语音识别+语义分析
对于中国用户来讲,Siri给国内用户带来的最大困扰就是其不支持中文。据了解,目前Siri共支持四种语音,即英文、法文、德文和日文。其中英文部分只支持美国、英国和澳大利亚的口音,对于其他国家和地区的英语口音在识别上还存在困难。
有分析认为,声调和地方口音庞杂,或许是Siri中文版迟迟未推出的主要原因。一家国外媒体表示,对于语音识别来说,中文极具挑战性,因为普通话只有400个单音节声音,根据声调予以区别,而且中国还拥有很多种方言和数不尽的地方口音。
国际巨头苹果的劣势,对本土创业企业而言却是机遇所在,是本土研发类似Siri产品的最大优势。
小编从智能360这款应用的“机器人的声音”设置一项了解到,单是机器人的声音就有12中语音可供选择,除了传统意义上的男女普通话和男女童及老人普通话之外,其中还包括台湾普通话、女生东北话、男声河南话和女声陕西话等多种带有地方特色方言的各式普通话可供选择。同类中虫洞在这方面也表现优异,它给提供的语音选择多达18种,小编尝试了一下,的确很精准的抓住了各个地方的发音技巧和规律。这个小细节或许在一定程度上解释了中文在韵律上的复杂性和Siri迟迟没有推出中文版的原因吧。
此外,基于语音的人机交互智能应用,构成整个语音系统框架的是两部分,即语音识别和语义识别。前者是诠释说话的人说的内容是什么,后者则是对话的内容进行进一步的诠释,要想达到理想的语音输出效果,需要二者的完美配合才可以,否则答非所问的窘境仍然无法彻底避免。
通过对目前市面上出现的类Siri语音助手的试验小编也验证了“听懂其音,不解其意”的现状。这些Siri的效仿者普遍面临一个共同的问题是,它通常能听得懂你在说什么,却不理解你在说什么。换而言之,其实就是它能够识别到人的语音功能,却无法准确的诠释语义的含义,这也让很多用户在用的时候经常出现“所问非所答”的令人啼笑皆非的情景。要想达到理想的人机互动效果,语音和语义上的有机完美结合才是避免尴尬的最终要做的事情。
专家观点:不适合创业公司?
对于国内不少开发者开始拓土这一领域,创新工场CEO李开复(微博)在微博中称:“中国Siri或安卓Siri的计划不太适合创业公司,因为投入大、风险高、技术难以实现。”对于语音控制这项技术研究多年为何依然有较大的屏障,李开复认为:“过去30年,总说语音要改变世界,为什么没有改?有几个理由,第一是语音识别的精确度不够,第二是语音应用在哪里,靠一小批的语音专家拍脑袋想,不是办法。”
著名天使投资人薛蛮子(微博)在微博评论:“中国Siri从头开始创业难,但有积累有实力的中国企业还是存在的,关键是要有可持续发展性。”
对于语音控制的前景,微软的创始人盖茨也曾说过,五年后语音会改变世界。只是,这样的论调,盖茨每隔五年都要再说一遍。
也许我们还不清楚实现真正意义上的人机交互还有多远的路要走,但是“调戏类Siri”已经成为某类青年的调侃标配,因为它们也的确够萌、够2、够天真。
国内类Siri精选:
1.智能360
应用名称:智能360
平台:Android
应用类型:语音助手
优势:
1语音识别度较高,语义解析相对同类算是不错。
2.数据库涉猎较广,对当下的热点话题能够很快做出反应。对于其不太熟悉的领域,它能很快从互联网上查到相应信息,呈现在用户面前。
3.机器人声音划分较细,共有12种带有地方特色的普通话可供用户选择。
4.加入了换肤功能,用户可以选择自己喜欢的界面。
5.支持语音手写双重输入方式。
改进:
1.对于稍快的语速识别程度较差,需要放慢说话速度。
2.语音识别的反应速度有点慢。
3.需联网才可以用,耗费流量。
2.讯飞语点
应用名称:讯飞语点
平台:Android
应用类别:语音助手
优势:
1.界面根据用户的试用频次分为六个板块,用起来很方便,省去查找的烦恼。
2.语音识别度在同类里算是佼佼者,且反应速度相对较快。
3.语音输出清新自然,不生涩。
改进:
1.需要联网才可以用,耗费流量。
2.需加强对稍微复杂的问题的把握度,避免鸡同鸭语的窘境。
3.页面显示较呆板,可以适当加些换肤功能。
3.虫洞
应用名称:虫洞
平台:Android
应用类别:语音助手
优势:
1.发音系统强大,共有18种带有不同地域特点或年龄段的特色语音。
2.嵌入了当下流行的LBS定位功能,接入互联网后用户可以很方便的定位到自己所在的地理位置,非常方便。
3.支持语音和手动输入双重输入模式。
改进:
1.语音和语义准确度的把握还有待提高和完善。
2.需联网后才可以使用,耗费流量太大。
3.界面略显单调,可适当增加换肤功能。