灵云支持打造“能说会听、能思考、会判断”的智能终端
扫描二维码
随时随地手机看文章
自去年十月捷通华声推出灵云远场语音识别技术解决方案以来,成功解决了远距离、复杂声源环境下的语音识别技术问题,突破了长期以来各种智能终端远场语音交互瓶颈,获得了软、硬件厂商的一致好评,已被广泛的应用于各类车载、电视、家居、机器人等智能终端设备上。捷通华声在此基础之上,再接再厉,推出了最新版灵云远场语音识别技术解决方案,各项性能指标全面提升,远超市场上同品类各项产品,成为迄今为止国内市场上推出的最完整、实用化程度最高的远场智能语音交互解决方案。
灵云远场语音识别解决方案全面整合了最新灵云远场语音识别、语音唤醒、声源定向、降噪、回声消除、端点检测等实用化语音、信号处理技术,能够有效抑制拾音波束之外的噪声和反射声,可在嘈杂环境下识别5到6米外的语音,识别率不低于90%,完全能够满足智能终端设备在车辆驾驶、家居生活、办公营业厅等复杂声源环境下的语音交互需求,全力推动智能语音交互在车载、家居、机器人等领域进入实用化阶段。
为了让智能设备方便地集成灵云远场智能语音交互能力,捷通华声将整合了灵云平台全方位人工智能技术能力的灵云种子与灵云远场语音识别解决方案相结合,为智能终端设备一“键”提供远场智能语音交互、智能图像识别、生物特征识别等多种人机交互能力,彻底打破了目前智能设备仍需APP、触屏、遥控控制的局限,受到了智能车载、智能家居、家电、机器人等领域广大合作伙伴的欢迎。
在噪音环境中准确识别司机语音命令 让车载设备操控更轻松、更安全
在智能车载设备领域,目前主要是依靠按键和触屏操控设备,要求驾驶者视线转移至操作界面,手脱离方向盘去按键,当驾驶者想寻找一曲歌或操作某一深层目录命令时,经常会出现一手把握方向盘,一手操作选台按钮“找啊找”,导致“手忙脚乱”的状况,给行车安全带来了极大隐患。
灵云远场语音识别技术解决方案,可以对车内空调声、车外胎噪、马达声等环境噪音进行降噪处理,并能够准确识别司机和其他座位乘客的语音命令,实现打电话、收发短信、听音乐、听广播、地图导航、车况查询、天气查询、服务查询、设备控制、交通制度问答等多种功能,真正实现车载设备的语音控制,把司机的双手还给方向盘。
当引擎发动,司机说出目的地,车载设备便会自动搜索目标地点并规划路线,在语音导航过程中还会不断提示司机道路状况,绕开拥堵路段。驾车途中,如果需要打电话,可以直接说“给李总打电话”,电话便会自动拨出,当车内有点闷,想吹吹风时,可说“打开窗户”,车窗便会全部打开,空调会关闭。如果想缓解一下驾驶疲劳,可随口说出想听的音乐、电台,播放器便会自动搜索并进行播放,当车辆需要加油时,只要直接说“帮我找找附近的加油站”,车载设备会说“已为您搜索到最近的加油站,是否开始路线导航”,如此全面、便捷的服务肯定会驾驶者倍感温馨。
灵云语音技术已在长安、现代、吉利、比亚迪、众鸿、航盛、日产等众多车载厂商的设备上得到了广泛应用,让智能车载设备的操作不再复杂与艰难,给驾驶者舒适、便捷、安全的驾驶体验。
摆脱触屏/APP控制 让智能家居“听”你指挥
在智能家居领域,灵云远场语音识别技术解决方案一样可以大显身手。通过将灵云种子集成到某一家电设备上,可将该家电作为中央控制器代替传统的中央微处理机,将各个智能家电连接到一体,通过灵云远场语音识别技术解决方案,能准确识别家庭范围内所有家庭成员的语音命令,实现对家电、照明、暖通等设备的语音控制,让智能家电摆脱按键、触屏、遥控与APP的控制。
当主人回到家,说声“我到家了”,中央控制器便会自动打开灯光,并回复“欢迎主人,按照您的习惯,空调已经调到25度,热水器调到42度”。洗完澡躺在沙发上,说一声“小灵,打开电视”,便会唤醒处于待机状态的电视机并开始播放节目,此时,电视所播放的节目声音会与语音操控指令发生冲突,而有了灵云回声消除技术,电视节目声音将被自动“屏蔽”,麦克风只接收说话人的语音命令,因此如果想换频道,比如说声“换到体育台”,电视就会自动切换到所CCTV5频道。可以想象,用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的电视、空调、冰箱等所有设备。
此外,灵云种子还整合了灵云人脸识别、声纹识别、指纹识别等技术,可以在门上安装摄像头、麦克风和指纹采集设备,通过生物识别技术对访问者的人脸、指纹、声纹信息进行验证,确保进入者为家庭成员,有效增强家居生活的安全性,让电影中的智能化生活变成现实。
助力中国机器人厂商打造真正“能听会说、能写会看、能思考、会判断”的智能机器人
伴随近一两年机器人产业的高速成长,大众对机器人走进日常生活充满幻想与期待,虽然机器人制造水平相比过去有非常大的进步,机器人生产成本的降低也能够让更多机器人走进大众工作、生活场景,但实际上与家电、车载设备语音控制不同,机器人将面对更加复杂多样的声音环境,因此,机器人能否与人轻松、准确进行语音交流将决定机器人的实用化程度。
灵云远场语音识别技术解决方案,能够通过远场识别、降噪、回音消除等技术,处理银行营业厅、电力办公厅、商场等复杂声源环境下的噪音,让机器人能够准确识别用户话语。此外,灵云种子全面整合了灵云平台多项人工智能技术能力,能给机器人赋予听、说、写、看以及思考的能力,与灵云远场语音识别技术解决方案相结合,全面助力中国机器人产业打造真正“能听会说、能写会看、能思考、会判断”的智能机器人。
捷通华声与新松联合推出的华夏银行大堂助理机器人,在银行营业厅嘈杂的环境下,能够准确回答客户业务咨询。如当储户说“我要存活期款8万”时,大堂助理机器人会说“8万还是建议您取号到柜台办理。因为钱太多了,土豪!”如此幽默风趣的回答,给储户和大厅等号的人带来了阵阵笑声。除了业务咨询,大堂助理机器人还能在储户排队苦闷之时,为储户讲故事、讲笑话,甚至转圈儿跳舞,让储户排队等号的焦急情绪瞬间烟消云散。当人们准备离开营业厅,问及天气情况或道路状况时,大堂助理机器人也能给予准确回答,让人倍感温馨,受到了广大储户的一致喜爱。
伴随人工智能产业的爆发性增长,捷通华声凭借人工智能技术深厚功底与对机器人产业发展的准确预见,凭借合作共赢的理念,不与机器人厂商争利,更不会与机器人厂商争市场的合作意识,赢得了国内机器人厂商的广泛支持,目前已与绝大多数国内主要机器人厂商建立了稳固的合作伙伴关系,灵云人工智能已在中国机器人产业独树一帜,几乎无处不在!
相信随着车载、家电、家居、机器人等智能终端设备的普及,搭载了灵云远场语音交互解决方案的灵云种子将会得到更广泛的应用,一个曾经充满神奇与幻想的智能生活时代,从此距离我们将不再遥远!
灵云平台坚持合作共赢 与产业界携手共创未来
灵云平台是捷通华声于2011年推出的首个全方位人工智能开放平台。历经四年发展,已成为国内提供人工智能能力最多、服务用户最广的人工智能开放平台。灵云平台自推出以来面向产业全面开放,包括个人开发者在内的所有合作伙伴,都可以通过灵云平台获取智能语音、智能图像、智能语义、生物特征等技术能力。
2014年,为让国内车载、家居、家电、机器人等智能终端设备厂商、集成商、开发商更方便地使用灵云平台全方位人工智能能力,捷通华声推出了企业级开发商专用的灵云智能终端交互方案:灵云种子。灵云种子全面整合了灵云平台多项人工智能技术能力,包括灵云语音识别、语音合成、语义理解、声纹识别、人脸识别、指纹识别、光学字符识别等能力,并为开发商提供简单易用的开发接口。开发商通过应用灵云种子,可以轻松实现智能语音交互、语音唤醒、语音导航、文字与证照图像识别、声纹解锁、人脸识别等多种人机交互功能,全方位、多角度满足家居、车载、家电、机器人对人工智能技术能力多样化的市场需求。
一花开放不是春,捷通华声将坚持 “合作共赢”的发展理念,与广大合作伙伴共同分享人工智能产业机遇,共同创建良好的人工智能产业生态。为更好服务全国智能终端设备合作伙伴,捷通华声将进一步加快在全国各地建立分公司与办事处的进程,比如在中国华南地区,智能车载、智能家居、机器人开发与生产厂商云集,并拥有创新力强、科技水平高等独特优势。为做好合作伙伴的技术支持,2015年捷通华声相继在深圳、厦门等地成立了分公司,为合作伙伴提供更及时、更完善的技术支持。
未来发展,捷通华声将继续以清华大学人工智能研究力量为依托,更加专注智能语音等人工智能技术研究与产业化的推广与应用,通过与产业内合作伙伴的精诚合作,共同推动中国智能终端设备全面服务社会大众,共同加快智能化生活时代到来的步伐!