Cerence自动驾驶与新型交互模式等黑科技亮相
扫描二维码
随时随地手机看文章
让Cerence在展会现场迎来高光时刻的,是其展示如何结合语音识别和头部跟踪技术以实现车内控制功能。
当车舱按键变成声音、视线、手势甚至是情感,你会更爱你的汽车吗?
对于这种新型交互模式,Cerence将其称为“人性化、多感官组合的多模态交互体验”。该公司还将一套基于Cerence Drive平台的全新高阶解决方案搬到了2020 CES现场,直指无按键交互体验,并喊出了“打造迄今为止最自然、最人性化的车载体验”的口号。
公司CEO Sanjay Dhawan提及:“我们认为,最引人入胜的车载体验就是尽可能接近人与人之间互动的体验:一种多感官、对话式的体验,包括了由语音、眼动及手势构成的全程交互。我们在CES上展示的创新技术,尤其是基于手势的交互,就是为了提升车载体验,并创造一个安全、高效、愉悦的环境——这是目前、L3级别及以上自动驾驶汽车及未来车载体验的核心所在。”
让Cerence在展会现场迎来高光时刻的,是其展示如何结合语音识别和头部跟踪技术以实现车内控制功能。
除了通过将驾驶者和乘客的凝视结合语音进行识别的多模态互动之外,现场演示还包括:智能语音交通通知、运用自然语言输出帮助驾驶者选择行车路线、全新Cerence EVD应急车辆检测、首度亮相的Cerence Car Life解决方案套件,以及通过挡风玻璃用户界面进行基于手势的交互。
e.GO Mover自动驾驶电动巴士
而这几项黑科技,都集中在一台名为“e.GO Mover”的革命性自动驾驶电动巴士之上。
该车聚焦于未来自动驾驶、电动和共享汽车的用户体验,并结合Cerence和Saint-Gobain Sekurit多项核心技术。具体而言:
多语言自动语音识别(ASR)和自然语言理解(NLU):支持乘客和在车外的人们使用母语与汽车进行对话式的互动。
语音合成(TTS)和自然语言响应:使这辆车能够与乘客和车外的人们进行流畅的、类人化的沟通,情感TTS可以根据内容和情境使汽车改变说话方式。
语音信号增强(SSE):屏蔽麦克风输入的噪音并区分不同的发声区域,可以只识别一个说话人的声音——这对于共享汽车使用场景和在外部与巴士进行交互至关重要。
透明屏幕技术:实现将信息投影在车内和车外。
与诸多业内人士主张的“自动驾驶汽车的交互将由智能手机引领”不同,Cerence相信多模态、多语言交互体验在建立用户信任及信心方面远超智能手机,并有机会加快消费者对于自动驾驶汽车的接受和使用。
事实上,影响消费市场信心的远不止于此。安全,始终是眼下摆在自动驾驶汽车面前的最大挑战。
于是,Cerence同期推出了应急车辆检测,为Cerence Drive引入行车安全保障功能。当应急车辆临近时,集成了Cerence EVD功能的车载助理将主动提醒驾驶者,以便他们作出相应的驾驶调整。由于声学回声消除技术能够有效消除麦克风信号中的音乐回放,因此即便驾驶者收听的歌曲包含应急车辆的警笛声或其它声音,系统也能检测警笛声并及时发出通知。
据悉,Cerence最近对1500多名美国消费者进行了调研,以了解他们如何使用车载功能在周边搜索。当被问及未来车载技术如何能够最大程度的改善他们的驾驶体验时,近一半(44%)的受访者表示,他们希望能够在压力较大的驾驶情况下获得更多的帮助。
Cerence DRIVE实验室也贡献出了一组研究数据。他们调查了驾驶者对警笛声检测的使用预期和观点。发现驾驶者对这一创新功能十分买单。67%的受访者期望一旦检测到警笛声,系统能够立即发出通知,并将车内所有其它音频的音量调低。这些用户表示,当他们在交通繁忙的情况下以及在郊区/城市的环境中,因受到车内或车外嘈杂声音的影响,警笛声检测将是最有价值的功能。他们同时也给出了一些反馈意见:希望知道警笛声的相对位置,包括应急车辆行驶的方向,以及距离等信息。
Cerence Drive多模态互动演示
当然,严格意义上来说,以上几种应用都仅仅是在产品本身“动手脚”。为了颠覆传统汽车模式,Cerence充分运用人工智能技术,开始在众多解决方案之中寻求驾驶者与汽车之间建立亲密关系的突破点。
同期,公司宣布推出人工智能SaaS产品套件Car Life,支持消费者使用语音访问智能汽车手册,助力驾驶者与其爱车互动并进行相关操作。按照官方介绍,自购买汽车开始,用户可以获得支持全新SaaS应用的升级用户体验。驾驶者只需要使用语音以及车载信息娱乐触摸屏便可以了解汽车信息和访问人工智能汽车手册,以及通过集成经销商管理系统(DMS)预约汽车保养等服务。
随着汽车的复杂性日益增加,用户的使用门槛也在潜移默化中提高,需要掌握车内太多功能,通知、警示灯等一系列传统操作也愈加困难。套件的SaaS应用模式支持针对每辆汽车、具体的汽车配置及逐渐了解驾驶者的偏好后进行定制 ,并通过配套应用程序,汽车助理语音以及车载信息娱乐系统图像化显示提供信息。Cerence Car Life将包含在Cerence Drive解决方案中,并可与谷歌、亚马逊、百度、阿里巴巴、Yandex等其他全球语音助理集成运行。
在产品背后,是团队自己对于未来“人与车”关系的理解:“与发展其他长期关系一样,驾驶者与汽车的关系都是建立于对汽车的深刻理解和欣赏,从首次进入这辆车开始,一直贯穿整个汽车生命周期。”Cerence联合创始人、执行副总裁兼核心车载业务总经理Stefan Ortmanns说道。
从商业利益的角度考虑,对于主机厂来说,如果未来智能汽车能够像智能手机等电子产品一样,与日常生活紧密相连,难以分割,不仅能提升出行体验,更是对建立品牌忠诚度的有力支撑。
Cerence ARK 演示
当然,除了销售端,汽车制造商们更关心的还有生产端。
针对中国市场,Cerence打造了语音AI交钥匙解决方案ARK,提供快速开发、部署和管理本地化的汽车语音助理,试图借此大幅缩短产品开发周期。
展开来说,Cerence ARK集成了核心语音助理功能,包括唤醒词、声纹验证、自动语音识别、自然语言理解和文字转语音,并具有开放、灵活和快速部署的优势,是投入成本最低、开发时间最短、系统性能最优的选择。按照官方介绍,OEMs可以为客户打造个性化的驾乘体验 ,通过系统自带的人工智能学习能力,帮助驾驶者和乘客定制音乐、导航、兴趣点、新闻推送等内容访问。
在公司中国创始人兼总裁蒯文瑞看来,Cerence ARK是颠覆汽车行业的创新解决方案。车云菌获悉,该方案现已在中国推出,计划于2020年发布全球版本。其提供三个服务级别 --轻量、标准和高级,并附带三个关键组件——ARK Edge、ARK Client和ARK Cloud,客户可以灵活选择组件和部署选项。
单就ARK方案而言,Cerence对中国市场的重视可见一斑。
这家公司3个月前刚刚从Nuance通讯公司完成拆分,成为一家独立的纳斯达克上市公司。成立后,Cerence在国内拥有研发基地、世界级的设计中心、创新中心及UI实验室搬到了国内。同时出于对本土化需求的考量,公司为中国客户提供软件开发工具包(SDK),用以创建能够在Cerence Drive平台上运行的可定制化的、提供开箱即用型应用程序,更快地向OEM和供应商提供仅需要小量自定义及可交付的整体解决方案等。
借助Nuance 汽车业务20年的行业经验加持,Cerence目前已完成近3.25亿辆汽车的部署,其中包括奥迪、宝马、戴姆勒、丰田、福特、吉利、上汽、通用等主流汽车制造商配备的人工智能出行语音助理。
综合本届CES现场Cerence对外展示的几项能力来看,其方案恰如其分地演绎了品牌含义。正如公司首席营销和传播官Richard Mack此前所言:Cerence充分体现了力量(strength), 优雅(elegance), 自信(confidence)以及管控(control)的平衡。