当前位置:首页 > 汽车电子 > 汽车电子
[导读]一些语音识别技术供应商会为移动设备的第三方开发者们提供语音识别的API,让其自行开发具备语音识别能力的应用,比如科大讯飞、百度等。而Speaktoit旗下的开放平台Api.ai,

一些语音识别技术供应商会为移动设备的第三方开发者们提供语音识别的API,让其自行开发具备语音识别能力的应用,比如科大讯飞、百度等。而Speaktoit旗下的开放平台Api.ai,这次是将API开放到了车载平台上。具体是个什么玩法捏?

 

让开发者自行开发的开放平台

Speaktoit于五年前在加州成立,提供语音识别服务。Api.ai是Speaktoit公司的第二款产品,是允许开发者们自行为智能互联设备开发语音交互能力的一个平台。最近这个平台开放了车载应用的API,让汽车制造商、第三方开发者都能够借此平台自行进行语音交互能力的开发与定制,平台仅提供技术支持。除了汽车之外,还可以进行移动设备、智能手表、智能家居、智能电视以及机器人的语音交互的开发。

 

与其说Api.ai是一个平台,倒不如说这是一个只要注册了就能使用的开发工具。开发者可以按照Api.ai上的流程,对语音交互的应用场景、识别内容、交互界面等等进行定义,Api.ai则会根据你的定义,给出相关代码等,便于开发者增加到App之中。

Api.ai运行在Speaktoit的自然语音处理引擎之上,能够理解自然语言,进行语音识别、声音识别,并提供语音转文字等服务。而且,根据官网介绍,Api.ai使用的是深度学习技术,能够在使用过程中学习并提升能力。

与任何操作系统兼容,支持中文

那么,对于车企来说,要使用Api.ai,需要做点什么呢?主要的工作是定义出语音交互的应用场景,按照Api.ai的规则,是定义出每个场景的Entity、Intent以及Context。

所谓Entity,指的是能够描述出这一应用场景的特定短语。比如说你要知道天气,Entity就可以是城市,便于程序进行定位并获取天气信息,而想听歌,Entity则可以是音乐的流派,或者是歌手的名字,便于程序进行查找。

 

如何定义Entity

以天气为例,在选择城市作为Entity之后,接下来的工作就是输出城市名字所对应的语音指令。比如纽约,可以是New York,也可以是NY,或者Big Apple。

现在的Api.ai上对应一个应用场景,只允许一个Entity作为识别对象,不过未来会开放多个Entity识别功能。开发者可以使用平台已经定义好的Entity,也可以自行定义。

Intent可以理解为对交互过程的定义,在这里,开发者需要定义用户如何表达才能被程序识别、识别之后要做什么。

 

如何定义Intent

如上图所示,User says是程序能够识别的语音指令,这里给出的案例是询问天气,Action则是程序识别之后给出的回应,根据获取的城市返回天气信息。

而User says的内容可以说是一个语音交互中最为重要的部分,俺们都知道,好的语音识别能力是让用户使用自然语音,而并非条码式指令。所以,这里涵盖的表达方式越多,最后的用户体验效果自然会越好。

Api.ai提供在网页上直接输入的方式来增加,也允许开发者直接提交JSON、XML和CSV样式。

至于最后一个Context,则是对Intent中用户所下发的指令定义一个语义环境。同样的语音指令,尤其是越简单的,可以被理解的意思就越多。要如何确保识别出呢?Api.ai就是通过Context来定义Intent。

这样,当用户指令与某个Intent中所设定的内容相符合的时候,程序会读取Intent对应的Context,然后在之后的五分钟之内,或者是之后的五项语音指令,都会是在这一Context下的内容。假设定义的Context是音乐,那么在开启音乐之后,五分钟或五个指令之内,所相关的语音指令都会与 “音乐”所对应的Intent下去对应,然后再执行相关命令。也就是开始播放音乐之后,如果你又不想听了,发出关闭的指令,那么关闭的也会是音乐,而不会是导航。

虽然每一个Context对应的时间是五分钟或者五个语音指令,但是当新的指令发出时,系统识别后会自动更新时间和指令次数。

以上关于Entity、Intent以及Context的定义都是在一个特定的Agent下完成,Api.ai上面的Agent相当于一个App。

所以,我们知道,在Api.ai平台之上,汽车制造商或者车载系统的开发者所需要完成的是对语音交互的应用场景和使用逻辑进行完整的定义,以便于程序能够更好地理解用户发出的指令并做出反应。

据Api.ai上介绍,这套平台属于中立平台,能够兼容任一操作系统。对应车载应用,目前已经开放的场景包括车载第三方应用、地图、导航、兴趣点推荐、聊天、社交、智能家居、天气、浏览网络、查询信息、时间&日期、预定等功能。

现在一些车载系统语音交互功能的强大是依靠云端的语音识别,不过Api.ai提供了云端、本地以及嵌入式三种不同方案来进行部署。本地与嵌入式两种方式不需要连接网络,也不需要向云端发送数据,相较于云端方案来说更为安全。

不过,最难得的还是在Api.ai的支持语音列表上,明晃晃地写着支持中文。

目前Api.ai上,非商用应用、免费项目与开源项目可以免费使用,如果是商业应用,有两种交费方式:按照一条指令0.0003美元(相当于不到0.002元人民币),或者是与Api.ai进行商业分成。

车云小结

这种提供技术支持让汽车制造商可以自行开发应用的方式想必会受“保守”的车企所欢迎。毕竟俺们都知道,汽车制造商对苹果、谷歌大开方便之门是迫于形势,并不代表他们愿意被制掣。君不见,奥迪、丰田、福特都开始采取措施应对了么?

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭