语音识别成智能家居新星的三个关键因素
扫描二维码
随时随地手机看文章
语音操作跃居智能家庭人机接口新星。亚马逊(Amazon)语音助手Alexa无孔不入穿梭于2017年国际消费电子展(CES)大展,随处可见的电视、冰箱、空调和洗衣机等智慧家电,甚至是陪伴型机器人皆已导入语音操作功能,堪称智能家庭的杀手级应用。
工研院通讯系统研究部经理叶恒芬表示,相较于2016年的CES展会,大多智慧家庭还是围绕着以手机作为控制中枢,遥控家中大小各种智能装置的局面。继Amazon于2016年开放出Alexa应用程序编程接口(API)后,吸引各大厂商相继导入语音识别功能。至今,Alexa已具备七千项技能,一百八十家供货商在此平台开发出商品,极可能成为跨平台统一的呼叫方式。
叶恒芬分析,语音接口成长的驱动因素主要有三点,一、语音识别错误率的下降,语音识别若在85%以下,则不符合导入产品的标准,语音识别率需达95%以上才具备应用于终端终置资格,以现阶段来说,目前的语音识别率已高达97~98%以上,与人类辨识语言的准确率相似;二、行动语音助理使用量提高,现在很多的语音请求来自于行动装置,以美国用户而言,目前已有20%的手机用户以语音型式发起数据服务的请求,举例来说,Google Now的语音搜寻成长达35倍之多;三、语音平台的API开放,设备、内容与应用程序相继导入,使得语音计算将有机会成为物联网装置主流的输入型态。
事实上,在智慧家庭领域已陆续出现以人工智能(AI)芯片为基础,结合语音和影像辨识技术的功能,以提高物与物之间沟通(Device to Device)的创新,例如乐金(LG)已有多项家电产品导入语音、影像辨识为基础的深度学习算法,并与开放网络基金会(ONF)、Google和Amazon策略合作,以提高产品互操作性。
然而,当前的语音识别系统大多还会受到背景噪音的干扰,说话的腔调、方式甚至是不同品牌设备连结等因素,也会影响语音识别的准确率。有鉴于此,叶恒芬认为,下一阶段语音识别精进的方向,可朝降低背景噪音干扰、自然辨识说话者语调和某些专用术语(Lingo)的辨识与学习发展。
工研院产经中心电子与系统研究组零组件研究部经理林泽民补充,除了语音识别功能之外,NVIDIA CO-Pilot具备语音、脸部识别与唇形辨识三合一的多重辨识能力,可更加精准辨别用户表达的指令,这种多重辨识的人机接口技术,强化识别的准确性与安全性,将成为未来人机接口发展的趋势。