语音识别声控导航和后台服务声控导航之争
扫描二维码
随时随地手机看文章
从科幻到现实,声控渐行渐近
多年前,在科幻作家和未来学家想象的文章中以及科幻大师的电影中,人们可以用声音来控制生活中的设备。多年后的今天,这种理念正在试图改变我们的生活。
2012年春,苹果Siri的流行带火了语音控制的概念。而在车载导航领域,2011年6月,好帮手电子旗下翼卡车联网公司在郑州首次发布了语音控制类的车联网产品:领航服务,首次将语音控制的概念在车联网领域内实现。在短短的半年之后的2012年广州AAITF展上,声控导航的概念和产品遍地开花。从“声控导航升级风暴”的翼卡车联网,“智驾云”的天缘电子,“声控更安全”的卡仕达,以APP应用为主打的凯立德等车载导航行内的新贵和大佬们都开启导航的“声控”之路。
乍看之下,声控技术来势汹汹,大有欲“革”前些年热火的专车专用手写导航“命”的势头,目前,行业内的声控导航出现了纯语音识别的智能声控和以后台服务为支撑的声控导航两种实现方式。前者在行业内还鲜有落地产品,而后者以卡仕达领航系列、翼卡车联网公司声控导航·智能升级系统为代表的声控导航已经落地商用。不过就目前两种技术的成熟度而言,在车载终端上,谁也不具有压倒性的优势,但毫无疑问的是,智能声控和后台服务声控之间的暗战已经拉开帷幕。
谁主沉浮?智能声控与后台服务声控之争
现今市面上抢占“声控”概念的导航大略能分两类:一是无需后台支持的智能声控,一是由服务后台支持的声控导航。
智能声控通常以应用软件形式出现,它专注增强导航功能,能识别用户的日常用语,很酷很炫,但精准度及客户体验成为大规模应用的考验。智能声控在取得突飞猛进的发展时,也还有不少瓶颈需要突破。第一,软件兼容性,智能声控软件使用范围狭窄。智能声控软件一般只能兼容一种或是几种终端系统,也就是说用户只能选择特定的手机系统或是车载导航系统,才能运用声控导航软件,能享受声控导航带来方便的客户范围受到很大的限制。第二,智能声控软件没有属于自己的后台,能实现的功能单一,提供的服务有限。现在的车主对车联网服务需求越来越多,安全、方便、娱乐等都成为选择的标准,显而易见,单一的功能不能满足客户对车联网服务的期望。第三,在进行声控时,为了减少周围噪声对软件的影响,用户要把手机拿到嘴边让软件接收声音,并且需要使用标准的普通话,软件才能进行准确的语音识别。也就是说在导航过程中不能彻底解放双手,甚至可能会出现不能识别用户方言的情况,语义识别就更谈不上了。智能声控的进一步推广和普及,都要先解决包括但不限于以上瓶颈。不过我们有信心期待,假以时日,三五年后,智能声控能更上新台阶,步入寻常百姓家。
另一种拥有服务后台支撑的声控导航,是以“产品+服务”的产品模式出现,产品和服务提供商建立起自己的服务后台,除了能够实现声控导航功能,同时能为用户提供机票酒店预订、餐饮租车预订、全国道路救援等服务。服务后台的客服人员能灵活识别用户的语言。不过此种模式的主要瓶颈在于人工服务需要新增使用成本,同时,各品牌产品之间的后台兼容及服务的标准化有很多功课尚待弥补,目前尚未有车联网行业的服务化标准出现。虽然目前有第三方积极运作兼容各家产品平台的应用,但距离实际的大规模应用上,还有一定距离。
目前,以智能声控为代表的是华阳和凯立德,华阳的智能声控导航已在其官方微博发布体验式视频,凯立德声控APP已经在AAITF上亮相,相信不久之后都将面向消费者,接受消费者的全面考验。以后台服务为主的声控导航以好帮手电子旗下卡仕达、车友互联、智成DOD以及翼卡车联网公司等的导航为主。好帮手电子旗下卡仕达导航以及翼卡车联网公司针对手写导航升级为声控导航的“声控导航·智能升级系统”已经大规模面市。智能声控还是后台服务声控谁主沉浮?需要交给消费者来检验,我们拭目以待。
从语音技术在业界以外范围的应用看,iPhone4S推出后,最大的变化是语音技术,语音技术好几年前就在手机上有应用,之前制约语音技术发展的瓶颈之一就是命令过少,且识别率较低,而随着云技术的开发成熟,具有云技术的声控技术将大大提高终端设备的识别能力。科大讯飞总经理方奇认为,在众多的功能实际应用中,语音互动是车联网发展的一个关键点,从安全角度和便利性考虑,语音识别应用都是未来车联网发展的主流方向。他认为,语音互动实际上解放了人的双手,让行车变得更加安全。笔者体验过一段时间科大飞讯语音输入法,在识别率方面,这个输入法整体表现基本满意,当然,那是在体验用该输入法发短信,如果将此技术适用到车载主机上,用于识别功能操控,其识别效率和正确率应该会有大幅提高。
在国外,福特SYNC的车载主机就是通过语音技术突破车载智能平台的难题,而在国内市场,很多企业也意识到了这个问题,多家企业都在语音控制上“闷头大发财”,更将语音控制技术用自己的理解向前推动,如华阳在推出了语音控制基础上,进一步增加了手势控制功能主机,天缘、凯越等厂家推出的声控主机已经可以辨识具体功能项目中的功能细目,如进入iPod界面后,可以用语音选择曲目,在导航界面下实现本地化语音导航,据传,好帮手电子以及旗下翼卡车联网公司也已经投入语音控制研发多年,2011年发布概念性产品,可能因为尚未大面积推广的原因,目前对外界保持低调和神秘。
可以预想一下,声控技术应用于车载主机后,人机对话将会变得更轻松,很可能会变得像开启按钮一样司空见惯。虽然语音控制在软硬件之上还离大规模应用有比较长的距离,在短期内,后台服务将作为主导,但曲线前进,并最终成为车联网发展趋势的大局已经明朗化。
总结陈词
iPhone4S中的Siri语音控制系统自发布以后就掀起了语音系统开发的热潮,语音技术是未来的发展的趋势,但是目前而言还是困难重重,尤其是面对博大精深的中文,语义理解更是困难。语音识别技术成熟运用在车联网中还有很长的路要走,故在短期内,以自主后台,自建呼叫中心实现声控导航的车联网企业将抢占先机,率先占有市场。
目前,以后台服务为支撑的车联网服务的客户体验、灵活度、服务延展性等方面略占优势,将成为短期(未来1到3年)的主流和热点,尤其是即满足消费者使用需求,又结合当下经济、绿色、环保热点,能实现将使用过的手写导航直接通过较为简单的方式升级为声控导航的产品。但也期待,假以时日,伴随科技的发展,智能声控能带来更好的应用和体验。