迎接人类与机器开口对话的新时代
扫描二维码
随时随地手机看文章
语音接口将为智能家居领域带来全新的面貌,以往智能家居很大的一个问题就在于功能操作上不方便,而AI将改变人机互动的模式…
一直以来我们熟悉的“人机接口”都是着重于视觉──我们与机器之间的互动主要是透过功能选单、图形化接口,需要眼、手并用,透过操作遥控器或是触控屏幕,才能顺利对机器下指令,启动正确的功能;尽管已经习惯这样的模式,这与人类所追求的“直观接口”仍然相去甚远,而随着语音识别、音讯技术的不断演进,现在我们只要开口就能与机器沟通。
从内建于苹果(Apple)操作系统iOS的语音助理软件Siri,到近两年来蔚为风潮、由亚马逊(Amazon)推出的Echo智能喇叭(smart speaker)所带动的各种智能语音助理装置,新一代的电子装置不但能听得懂人类指令启动相对应的正确功能,结合云端的人工智能(AI)与机器学习等技术,它们甚至能主动提醒日常生活重要事项,或是陪着人们聊天解闷。
对全球智慧家庭市场有多年深刻观察的Dialog Semiconductor产品营销经理同伟,在今年台北国际计算机展(Computex 2017)期间接受媒体团访时就表示,他认为语音接口将为智能家居领域带来全新的面貌,以往智能家居很大的一个问题就在于功能操作上不方便,而AI将改变人机互动的模式;美高森美(Microsemi)语音业务部门营销暨应用总监Shahin Sedeghi也认为,未来在智能家居应用情境中,人们不再需要用手触碰任何开关或屏幕。
Sedeghi引述市场研究机构ABI Research在2016年发布的预测报告指出,估计到2022年,支持语音控制的装置出货量将达到7,500万台,其中智能喇叭/数字语音助理将占据其中的三分之二(约4,700万台),而预期Amazon (Alexa)与Google的智能语音助理软件会成为市场主流;他并认为智能语音助理市场的主要推手,会是支持较复杂语音控制指令的电视机/机顶盒(STB)以及智能喇叭。
ABI Research预测,到2022年,全球语音控制装置出货量将达7,500万台
音频芯片设计大厂瑞昱(Realtek)在Computex 2017期间就展示了结合Google语音助理功能的机顶盒与电视机解决方案;借助语音指令,用户在搜寻在线内容或是本地储存影音档案时,不必再透过遥控器操作层层迭迭的功能选单或是费力输入搜寻关键词,而是只要对着电视机/机顶盒说出想看的频道或是影片、节目名称,就能找到相对应的内容。
瑞昱在Computex展示支持语音控制接口的机顶盒与电视机
软件以及云端服务可说是智能语音助理应用的灵魂所在,但智能语音助理装置硬件性能的优劣,也对于语音控制接口的表现至关重要,机器必须要能清楚地听见、听懂用户发出的语音指令;而在这方面扮演要角的,就是收音麦克风以及音频处理器。
以Amazon智能喇叭Echo为例,该装置采用以7个MEMS麦克风组成的数组,以支持更高质量的收音;而Microsemi的Timberwolf系列音频处理器(ZL38063)则是能支持多麦克风数组智能语音助理装置的方案,搭配其AcuEdge固件,支持波束成形、指向性收音以及降低噪声等功能,号称能实现360度的收音以及5公尺以上的语音识别,即使是在同时播放音乐的情况下也能清楚听见触发关键词(例如:Alexa),然后中断音乐执行语音指令。
总之随着语音控制技术不断演进,我们已经能用自然的说话方式跟机器互动,但对于已经习惯了传统人机接口的大多数人来说,可能需要先克服的是“开口问机器问题”的心理障碍──就像很多人打电话一听到那头是录音机或是语音信箱就会不知所措──能不别扭地与机器顺畅沟通,或许会是我们迎接未来世界得先学习的一门“技能”?