科大讯飞人工智能的用户交互界面AIUI
扫描二维码
随时随地手机看文章
科大讯飞在北京国家会议中心举行了“人工智能+ 共创新世界——2016科大讯飞年度发布会”。此次发布会展示了科大讯飞人工智能的用户交互界面AIUI在产品和市场方面的推进。
AIUI是科大讯飞研发的以语音识别为主,结合图像、视觉及手势识别的人机交互产品,它的集成包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务,并能够与众多人工智能产品结合,使得人工智能产品都能在AIUI的界面下进行操作。
AIUI自2015年上线以来,在人机交互方面的应用涉及教育、政府、交通等领域。目前,科大讯飞给出的数据显示,AIUI的用户数量达到8.9亿,日均使用量30亿次。在未来,人机交互依然是科大讯飞在语音识别技术上的重点。
此次发布会介绍的主要产品和市场情况如下:
1. 语音听写
AIUI的语音听写功能已经能做到直接用语音进行修改、翻译、加标点,同时可以记忆人名,响应速度在200毫秒以内,在噪音环境下的错误率低至2.24%,并能更加准确地识别方言和口音。另外,该语音识别系统还有针对涉密场景的加密功能。
目前,AIUI的语音识别主要运用于会议纪要的即时成稿。今年,该语音识别系统还与最高法深度合作,主要运用于庭审记录。科大讯飞方面的数据显示,最高法处理普通案件庭审记录的时间,由原先的3小时加快至5分钟。
2. 实时互译
科大讯飞的实时互译系统可在网站使用,或下载app,它可以识别语音,进行实时翻译并外放,主要用于同不同语种的人进行交流。目前,中维实时翻译系统已经出现,并在援疆工作中发挥作用,用于援疆工作人员与新疆少数民族的人群进行交流。
科大讯飞表示,目前公司在汉英互译领域处于世界领先水平,在未来还将开发世界主要语言的语音实时翻译系统,用于解决不同语种的人交流时的障碍。
3. 智能家居的人机交互
科大讯飞与智能家居方面的合作目前集中在电视领域,产品为讯飞电视助理。科大讯飞将自己的语音交互系统植入遥控器,用户只要对遥控器说出指令,电视就会做出相应的反应,例如筛选影片、调整音量等。该产品目前已经能够支持更深度的人机交互,例如一些更随意的指令,如“片尾音乐很好听,这是什么歌”,系统便会显示歌曲的歌名。
目前科大讯飞在智能家居领域已经与3000多家厂商进行合作,今年已经推出了1000多款产品。在未来,科大讯飞的语音交互系统还将植入更多的智能家居,人们可以用语音控制更多的家电,而不仅限于电视。
4. 车载语音交互系统
科大讯飞车载语音识别系统的最新产品为飞鱼助手,它仅靠语音对话就能完成导航、寻找餐厅、播放音乐、接打电话等功能。这与AIUI的语音识别支持语音修改、学习人名有关。即便在打电话时,系统根据语音找到了错误的通讯录好友,也可以直接通过语音进行修改。利用飞鱼助手导航时,系统可以识别地名的简称、别称等。
未来,科大讯飞希望在自动驾驶方向有所进展,希望能够将自动驾驶环境营造得更加人性化,这就要求在人机交互方面更加自然,机器能够与人类进行更深层次的对话。
5. 金融服务机器人
科大讯飞推出的“晓曼机器人”目前已经运用于银行服务中。这款金融服务机器人能够识别用户的语音指令,并在屏幕上推送相关的金融服务。另外,“晓曼机器人”还可以在银行大厅内为用户指路,带着用户到相应窗口办理业务。
6个性化教育
科大讯飞研发的自动作文评阅系统已经运用于四六级考试的阅卷中,能够给试卷打分,并提出修改意见。另外,科大讯飞的数字个性化推荐教育系统,能够分析考试中各个题目的错误率,并列出典型错误,根据不同学生不同的出错情况,推送不同的错题讲解,提供个性化的学习内容,并节省了教师统一讲解的时间。目前该系统已经运用于北师大二附中、黄冈中学广州分校等学校的教育中。
科大讯飞在2014年的12月宣布“讯飞超脑”计划,目标为让机器人在3~5年内考上大学。科大讯飞在教育方面推广的人工智能技术,除了上述功能外,还有一个目的即是机器学习。通过汇总所有用户的知识和错误,使机器不断认知、学习、迭代,达到比人类更高的学习效率。至于最终能否完成“3至5年考上大学”的目标,目前依然没有结论。
7. 语音模仿
“讯飞配音阁”是科大讯飞在语音模仿领域的主要产品之一,目前手机app已经开放下载。这款产品能够模仿不同人物的声音,包括音调音色和说话时的语调习惯。科大讯飞的语音模仿系统主要运用方向为电影配音,即省去演员后期配音的工作,直接让机器来代替演员完成配音工作。另外,普通用户也可以利用语音模仿系统,设置智能设备的声音,例如将手机讲故事的声音设置为父母,情侣间设置对方的声音为其路况导航等