语音识别下的智能家居发展
扫描二维码
随时随地手机看文章
物联网 (IoT) 改变生活的每一个角落,特别是在家庭中——家电物联网装置让我们更智能地控制门锁、灯光和电器,串连个人生活与外在系统和环境。而当进一步加入目前最热门的语音助理功能后,智能家居在 2018 年的发展可望更上一层楼。
智能家居(Smart Home)虽然已经是发展很久的议题,但市场发展似乎未成有爆发性的成长,不过,智能家居在加入语音助理之后,2018年的发展可望更上一层楼。2018年消费性电子大展(CES)中,各家大厂如亚马逊(Amazon)、苹果(Apple)、Google、三星(Samsung)、LG、海尔(Haier)…等服务或家电制造业者,纷纷相互结盟,并展出最新智能家居产品。
值得关注的是,智能语音助理结合智能家电,在2017年逐渐发酵后,2018年将可看到更多借助智能语音助理的应用及系统真正出现在生活周遭,为智能家居市场挹注更有力的发展动能。
语音控制为智能家居市场注入活水
从今年CES观察,智能家居依然是相关业者主要的发展目标。根据市调单位调查统计,到2025年,全球将有10%的家庭可以称为智能家居。而智能家居所创造的市场产值,根据GfK报告,2015年达485亿美元,随后成长态势逐渐趋缓,预计仍维持每年约80亿美元的成长速度,预期2018年市场规模将达710亿美元。单就智能家居设备产值来看,若不将家电等大型设备计算在内,到2021年智能家居设备营业额将可成长到95亿美元。
此外,根据智能家居实验室讲师林佑祺引用国外市调机构所做的统计,2015~2020年间,智能家居年复合成长率(CAGR)将达50%。这些成长估算数字,对相关业者来说可能相当具有吸引力,然而要让智能家居持续成长,近年备受瞩目的语音控制可谓功不可没。虽然语音助理的概念是由Apple智能手机中的Siri所开启,但Amazon Echo智能音箱却是最快跳脱手机之外,让语音助理在智能家居发光发热的装置,逼得Google、Apple相继跟进,以强化其在智能家居市场的占有率及地位。
因此可以说,智能家居市场的新一波高潮,是由语音控制所激起。博云智能(Link of Things)执行官张伯维表示,对于老人或非智能装置的重度用户来说,要花时间了解或是操作手机应用程序(App)或是家庭的控制面板,相当有难度。透过语音,可以更直接的下达指令,操作相对简单,因此不仅智能家居相关大厂看好语音控制在智能家居的发展力道,其他应用领域,包括车用、室内定位…等,都已开始导入语音控制这项既有却直至近期才更有发挥空间的技术。
智能家居语音控制运作架构(来源:博云智能)
相对的,也因语音控制直觉、简单易用的特性,刺激消费者对于导入智能家居的意愿更高。再者Amazon透过低价补贴方式,将Echo智能喇叭卖给其电子商务的PRIME会员,虽然是打造新型态的在线购物使用体验,但也同时助长了智能家居的发展。换句话说,无论是Google、Apple或是微软(Microsoft)等平台业者,透过语音控制技术让更多型式的智能装置能在家中的生活空间取得更大的地位,让更多物联网(IoT)装置更容易进入家庭的领域,所以语音助理的应用不仅为家庭生活带来更多的惊奇,也进而带动智能家居在2018年有较明显的进展。
也因此2018年CES已可见到有更多的家电、闹钟或是其他产品不但可连网,并具备可透过Alexa、Google个人助理(Google Assistant)或Siri控制的特性。CEVA营销策略总监Moshe Sheier表示,语音是最自然的人机接口,它可执行触控及手势做不到的免持操作,因此成为控制智能家居装置的理想方式。除此之外,与繁忙的办公室或吵杂的街道相比,家庭是一个相当私人、安静而狭窄的场所,因而也较适合语音控制的使用环境,因此在家庭中采用语音控制可说是顺理成章。
现今最流行的智能家居语音控制设备是智能音箱,例如Amazon Echo或Google Home,以及用于控制智能家居装置的云端虚拟助理。透过连接智能音箱到其他智能家居设备,可以实现多重装置的语音控制,例如提供语音命令,像是“Alexa,请Blink启动我家的安全系统。”因此,以一个聪明的智能音箱可作为私人音讯管家为出发点,智能家居将更为便利,未来也可能更个性化。
不过,即使语音助理可望为智能家居挹注新的发展动能,但单靠语音控制就能让智能家居的发展持续畅旺吗?当然不会那么容易。
标准化至关重要
何以智能家居先前未能显著成长?Nordic Semiconductor区域业务经理陈俊志表示,即使先前业者普遍认为只要将装置加上连网功能,势必能带动智能家居的成长,但事实上,智能家居并非装置连网即能“坐等营收滚滚来”,背后牵涉到许多连网所衍生的相关问题。
Sheier认为,目前的智能家居装置是把智能功能内建到设备本身的单点设备,可称为“边缘计算”(Edge computing)或结合了由云端系统软件提供的智能和分析功能。流行的智能家居设备是连接到因特网的新版本传统家用产品,像是恒温器、照明、车库门遥控器和门锁等等。不过,今天现有的这些设备大多各自分散,尽管它们都身处于相同的无线网络中,但彼此之间没有连接。
也就是说,连网技术百百种,哪一种最合适?各家业者自然有心中“最佳人选”,但连带造成连网技术不同,各家产品无法互通,甚至云端系统也无法共通,“各自为政”的结果导致消费者使用上的不便,进而降低使用意愿。
不仅如此,智能家居整体也并未有共通的云端服务标准可以让业者追寻,终端制造商必须跟着云端服务供货商及网通产品相关制造商的脚步,才能制造出可通用于市场的产品。然而能让业者稍感安慰的是,目前市面上智能家居云端服务仅有Apple、Google、Amaon三大巨头,财力较大的业者可在产品中都支持三大业者的自有智能家居标准,但是财力较小的公司,只能依靠过人的“灵感”,择一押宝。
没有互连为一个完整智能家居网络的装置,没有能够使用单一的网通产品连上单一云端进行控制或是信息分析,消费者可能必须在手机针对不同厂商的品下载一个应用程序,或者是在家中得摆上不同厂牌的遥控器,每次使用就得“猜”是否开对应用程序或拿对遥控器。若是你,这样的智能家居使用环境,能接受吗?
消费者不想用智能家居产品,智能家居的市场发展自然令人无感。不过2018年情况已开始改变。
百花齐放通讯技术标准正在收敛
博云智能技术长王云龙指出,智能家居要能大力发展起来必须天时地利人和,也就是整体生态系统、连网装置与云端服务都要相对成熟,且需要统一标准消除不兼容问题,再加上要克服进入门坎,简易安装步骤,提升消费者使用经验,才能有较好的开展。
在此之前,可透过云端服务将智能家居的家电产品串连起来,但这并非百分之百的解决之道,所幸,已有大厂开始进行标准融合的工作,可望加速解决智能家居连网装置不兼容的问题。陈俊志认为,2018年的智能家居百花齐放的通讯标准,不仅会慢慢收敛为主流的几项技术,如蓝牙(Bluetooth)、Thread、ZigBee或Wi-Fi...等,还会出现能够支持多种标准的单一装置。如此一来,一方面可以降低产品设计复杂度,使各家业者的产品能进一步兼容,还能使装置与云端之间的网关(gateway)消失。
陈俊志解释,所谓的让网关消失,例如,手机并未内建ZigBee,若要透过手机控制家中内建ZigBee的灯具,或是ZigBee灯具的数据要上传导到云端时,都需要透过额外的网关作为中介。若是单一装置支持多重标准,意味着,装置本身可以依据要执行的工作选择相对应的技术,如透过ZigBee下控制、要与手机链接将数据传上云端时切换为使用蓝牙,就不需要再透过网关,使用者在使用上也能更加简便、在建置智能家居系统时也可更为容易。
业者普遍认为,目前灯具控制部分已采用ZigBee为大宗;而若需要透过手机连接则以蓝牙为主。意法半导体(STMicroelectronics)亚太区模拟、微机电与感测组件资深技术营销工程师谢景翔则表示,观察现阶段智能家居连网装置的发展,可发现蓝牙5.0因拥有网状网络(mesh)与低功耗的特性,有后来居上的态势,未来智能家居装置内建蓝牙5.0的比重将逐渐增加。
这并不是说其他的短距低功耗通讯技术会完全被排除,而是在不同的使用环境下会有最适用的通讯技术出现,并逐渐收敛为只剩几项主流无线技术,这正呼应智能家居单一装置支持多重无线标准的发展趋势。且这也显示业者的想法,技术那么多,支持者也众多,押对宝也不容易,更不可能只有一种无线通信技术能够独大,因此将最有可能的几项技术挑出来,在单一芯片中全数支持,或者与第三方进一步合作,将是最佳的方式。
选边站时刻来临
将庞杂的无线技术“理清”后,还有云端辨识与服务系统的问题需要解决。不仅如此,大多数业者都无法做到由上至下的垂直整合,专精的技术可能只占整体生态系统的某一部分,因此得与多方公司进行合作,这将提高产品研发成本与难度,而这也导致业者得面临选边站的时刻。
张伯维说明,目前三大云端服务供货商各自有自己的云端服务平台,且透过语音控制智能家居装置,产品更是需要支持三大业者的云端平台,才能使语音控制系统得以精确辨识语音指令及运作顺畅。但并非所有的厂商皆有能力同时支持不同的云端服务平台,此时厂商仅能依市场发展风向,选择何种语音识别技术与云端平台。
据了解,目前三大巨头势力消长情况,前两年已Apple HomeKit较为热门,今年是Amazon独领风骚。明年是否会换成Google Home热度较高,实在很难说得准,且这三大厂商未来是否会有在智能音箱之外整合其他周边的产品计划,也尚未明朗,这也相对考验厂商对于智能家居产品的设计布局。
而语音控制技术未来是否能够标准化?王云龙认为,因牵涉到利益的问题,大厂是否开放其语音相关关键性技术,也仍在未定之天,也许未来业者彼此间会进一步组成策略联盟,推展某一项智能家居或语音控制技术,但现阶段业者仅能以何种技术使用率较高作为选择的依据。
Sheier亦观察到智能家居产业开始趋向整合的情况。他提到,未来,这些智能家居连网设备将透过中央集线器不断增加彼此的互连,从而实现“深层连接”(deep linking)。深层连接亦即让来自不同供货商和使用各种应用程序编程接口(API)的不同产品彼此互连,以提供更优异的用户体验。例如,一个智能家居系统能于门铃摄影机辨识出主人离开家时降低供热温度、关闭灯光并锁上大门及启动安全系统。最近Amazon以10亿美元收购Ring,即反映智能家居解决方案供货商正在寻求更深度的垂直整合以扩大其产品组合,一方面希望能够主导智能家居生态系统,一方面能够提供更无缝连接的智能家居解决方案予消费者。
技术日新月异 强化语音控制精确度
智能家居或是语音控制标准的收敛之外,还是得考虑现阶段语音控制技术仍有哪些技术上的不足与未来发展,才能使语音控制技术能够更深入到人们的日常生活,发展脚步能更加稳健。
Simple Care开放长照智能系统产品设计林志豪表示,以智能音箱来说,现在大部分的使用者还是用来听音乐为主,用户对于其精准度的要求大约是在对智能音箱下指令时,才较为重视,也就是在使用者说的时候要精准。
林志豪进一步解释“精准”义,例如,透过Echo下达播放音乐的指令时,若是讲了跟播放音乐无关的几句话,Echo可能就无法辨识,而人类却可以透过关键词就可清楚地知道哪些是真正的指令,而那些语句是废话。另外,现今的语音识别技术对于断句不明确、台湾国语或是语义部分的辨识度也有待加强,这不仅对使用者而言会产生困扰,也是当前语音识别需突破的技术面问题。
Sheier则认为,目前自动语音识别(ASR)和前端语音处理的最新发展已使得语音控制相当成熟和有效。ASR引擎可以理解多种语言和口音,而语音生物辨识可用于辨识系统中预先登录的特定用户,以在智能家居环境中提供不同的权限。但是,目前的技术仍然限制在5公尺的范围内,并且难以在多人同时交谈或吵杂的环境中操作。
AI推一把 语音识别更精确
上述的问题在人工智能(AI)进入到语音识别技术后,相信可迎刃而解。林志豪认为,自然语言处理(NLP)渐渐的会解决断句、语义…等问题,因为自然语言处理已渐可做到情感语义分析,肯定可以判断某一些句子是无意义的“噪声”。不过,如何将AI顺利加入到语音控制装置中,这也将考验业者的能力。
不仅如此,现在主流语音识别技术,由于开发者主要的语言使用环境是透过英文,因此许多非英语系国家消费者在使用语音控制时,有时会面临系统突然「听不懂」的状况。不过随着人工智能的导入语音识别软件算法的能力可望不断提升,可预期未来语音识别技术会更加适用于非英语系国家。
MEMS麦克风扮演重要硬件角色
软件算法的精进,也需要配合较佳的硬件麦克风相辅相成,才能提供使用者较佳的使用经验。谢景翔指出,语音控制或是智能音箱对于微机电系统(MEMS)麦克风的要求是,首先是高辨识度、再来则是灵敏度、麦克风的效能与更优异的讯噪比(SNR)。
意法半导体模拟、微机电与感测组件技术营销经理陈建成补充,要让数字或模拟讯号的麦克风更能符合语音控制技术的需求,业者皆致力于在缩小封装、降低功耗、强化声学过载点(AOP)效能,以及更好的讯噪比表现。其中,声学过载点的表现越佳,智能音箱在吵杂的环境中,收到的声音不会过于失真,也能过滤掉背景噪音。
除了辨识软件精确度及硬件产品的加持外,语音控制技术也面临非技术性的挑战。Sheier指出,一些非技术性的挑战例如隐私,可说是消费者主要关心的一个问题。用户也许会思考,“语音控制设备是否一直在记录我的每句说话?”、“我所说的每一句话,会不会透过智能音箱被有心人士听到?”
为了消除使用者的疑虑,相关业者也戮力研发新技术以克服这些挑战。例如把不同用户说的话分离,这就牵涉到利用复杂算法来分离每个用户的语音,且能够理解语音串流方向,知道哪些涉及语音命令,哪些只是背景人声。另一个即将出现的趋势是采用更多的终端设备边缘处理(on-device edge computing)功能,以便在没有云端系统连接的情况下实现语音控制和声音感测,从而改善延迟和隐私。未来几年内将可看到采用这些技术的智能扬声器和其他语音控制设备。
林志豪提醒,非技术面的挑战将以跳脱智能音箱至所有特殊产品上,例如照护上的用户界面,假设是给独居长辈使用,有没有办法串接的很人性化,让老人家在也可“无痛”使用?例如语音对语言的转换、是否要接上网络线、电话线或是插上SIM卡,以保持网络通讯讯号畅通?另外,对外连网的技术也很重要。
对此,陈俊志表示,智能家居中的无线短距网络,在传输语音封包时,会先将封包压缩,以利于其既有的带宽速度可顺利进行传输。上述的一些技术与非技术面考虑皆可透过软件与硬件解决,而用户对语音控制技术较大的非技术面考虑,是否采用该技术的关键,主要为安全性。
安全性为重要考虑
影响语音控制技术进入到智能家居或其他应用领域的原因很多,包括使用者的习惯是否被建立、是否提供更多“控制”功能以外的附加价值、是否有更“特别”的应用出现,以及安全性的问题。其中,安全性可说是消费者最为关注的部分。
陈俊志说明,语音控制因为牵涉到网络传输的部分,因此势必会引发消费者对其安全性的疑虑,不过现在各传输技术都有其独特的加解密方式,也有相关芯片业者专注于安全芯片的研发,应该可以解决消费者的担心。更何况,现今的黑客会选择对其“有用”的内容,做入侵、撷取或破解的动作,一般的家电控制命令语音,对黑客的吸引力可能相对较低。
张伯维补充,不仅黑客令人担忧,智能音箱能否忽略错误的指令,或是识别证确的说话者,如小朋友恶作剧乱下指令、小偷用语音开启家中门锁…等状况,也是让使用者相当头痛的安全性问题。此时即可彰显语音控制结合声纹辨识的重要性,目前仍是得观察大厂的语音识别入口是否会加上声纹辨识功能,才能进一步实现在终端产品上。然而,加入声纹辨识不但可提高安全度,也可以让产品制造商推出更“个性化”的专属产品,因此可预期未来市面上也会出现加入声纹辨识技术的语音控制产品。
跳脱控制领域 未来路更长远
未来智能家居语音控制会如何变化?杀手级应用又会出现在哪里?业者普遍认为,语音控制若不只是被动的收音、下指令,而能转变为双向的沟通,并可提供更多信息,例如针对天气给予使用者穿衣服的建议、提供食谱…等,抑或者不限于单一的智能音箱,而是分散于多个装置,进一步解决控制命令无法“翻墙”传输到另一个房间的问题,这样将可更提高使用者的使用意愿。
林志豪认为,目前语音控制应用的大宗在手机上的就是看天气、行事历、打电话与播放音乐,而在手机以外的装置上,几乎还是以音箱控制为大宗。但目前情况有一点变化,例如从台湾之光阿福宝(AfoBot)与华硕(Asus)Zenbo,可以发现由单一的音箱产品,转变为机器人产品,虽然量还不大,渐渐的可以发现差异化产品的出现。
另外,语音控制在居家照护,以及可“听声辨位”的室内定位也可望有更大的发挥空间;且BMW也宣布将在2018年的车款加装Alexa,协助驾驶应付更多行车状况,开车时将不再手忙脚乱。谢景翔指表示,智能家居在语音控制之外,若能再结合视觉的应用,将有更多发展空间,如门铃如果能结合语音与人脸辨识,即可提供多重的安全保障,可望提高消费者的接受度。
由于智能音箱唯一用途就是担任语音助理,以语音负责中央控制角色,成为家庭中心,因此Consumer Technology Association(CTA)预测,智能音箱仍有1~2年的爆发成长,美国市场约在2020年开始衰退,全球市场可能到2022年才会开始衰退。
为让语音控制技术走的更长远,Amazon 将Alexa云端架构都开放给有兴趣做大语音控制市场的业者使用,让大量低阶连网装置也可以导入Alexa,从个人计算机、智能手机到智能电视,各种装置都能够收听指令。因此,当语音助理大量渗透到其他行动装置,智能音箱将不再是家里唯一的语音入口,即便如此,此举却能让语音助理有机会变成消费者“非用不可”的技术。