智能电视 人机接口将走向何方
扫描二维码
随时随地手机看文章
智能电视被预期可能掀起电视产品新应用。随着电视联网功能不断增加、服务选择列表日益复杂,电视的人机界面预计将从现在起、到未来数年内,发生重大的变革。传统上/下/左/右/ OK键等功能的选单将不敷使用,但如果按键太复杂又会使遥控器操作变得繁琐。因此,不仅电视人机界面的变化正考验整个电视供应链的智能,如何让消费者透过实际操作而感到便利、以刺激购买智能电视的动机,也将是个全新的课题。
目前智能电视的许多作法为纯粹将网站浏览器(Browser)从互联网引进到电视,然而这也衍生新的问题。大多数网站的设计均带有鼠标或指针性记忆,还包含点击和拖动等额外功能,例如在谷歌街景与地图上进行拖曳点击、放大缩小的动作等等,然目前要在电视上进行这些网页功能的操控有相当的难度。
早在2010年底,SONY索尼就推出了谷歌电视(Google TV),可说是智能电视人机界面的大胆尝试,并可说是一个利用复杂的遥控器进行选单控制的例子。但谷歌电视遥控器按键很多,甚至还特别需要两只手操作,这让消费者的使用习惯面临改变。另方面,要在房间的另一侧对电视进行类似触摸输入来控制屏幕,仍有许多困难。
经过许多电视机厂商与电视品牌的努力,目前电视业界已经出现了3个通用的智能电视人机界面解决方案,分别是:语音识别(Speech Recognition)、手势识别 (Gesture Recognition)、动作感应(Motion Sensing)。
其中,语音识别和手势辨识操作界面,系于2012年消费性电子展(CES)上首度展出呈现。尽管手势识别功能早已在市场上存在一段时间,例如Xbox游戏机的微软Kinect手势识别等等,但过去都未被内建于电视机。
NPD DisplaySearch强调,目前尚无法看出上述3种智能电视人机界面何者能胜出、成为明显的主流赢家。但每个方法都有其优缺点,因此,有些电视采取了通通采用的综合方法,而不是押宝在单样技术。这似乎是一个明智的解决办法。
12首先设计的内容必须限定在一套固定的命令集,例如「声音调大」或「下一个频道」,而这些固定的命令集必须要有许多分辨不同语调的弹性。此外,语音识别可以识别「单字」与「词句」,但一般而言,该系统还需要同时开发辨识特定人的声音特色的功能。若利用语音输入的方式可以直接产生文字,为了避免同音字或类似发音的文字造成混淆(例如 there与their),有时必须搭配更复杂的计算机运算功能,同时智能电视也必须有自我学习与训练经验的功能。
添加语音识别的功能、对于电视产品多样性来说,将会产生重大影响。以北美的电视来说,至少需要3种语言(英语、法语、西班牙语),在西欧地区,更需要16种语言。至于亚洲地区也有许多复杂的方言和地方口音。加上许多国家有支持少数民族语言的法律规定,最终可能1台电视必须内建高达80种语言。
手势识别方面,据观察,游戏机已经证明手势识别可以被市场化。其发展的需要则必须着重于易用性,以及在屏幕上如何更加精准。例如,许多网页是不适合手势控制的,尤其是一些网页要求精细鼠标移动。再者,手势识别也不被认为是良好的人体工程学设计,疲劳可能影响手臂伸出的能力与姿势。此外,消费者通常不希望改变自己的坐姿来控制电视机。假设一个消费者手中握有一杯饮料,如何挥手而不溢出饮料,将会是个大挑战。
空中指向(motion capture or remote point)是目前发展快速的技术。在计算机的使用上,一个计算机鼠标,触摸板(Touch Pad),或者是类似在Wii型控制器,都已经被消费者广泛接受且熟悉,因此,空中指向用在电视上的障碍是最小的。然而,这些空中指向的装置也比一般遥控器昂贵许多,高成本可能是其发展一大障碍。
如前所述,没有单一的方法可以满足所有电视人机界面的需求,因此将这些方法做一个结合是一个相对明智的做法。另外,在电视上安装数字相机可以添加人脸识别,这也是一项最新的技术,用以将使用者的档案与脸部识别内建在电视中;并且人脸识别可以跟手势控制和视频通话,以及语音识别等等共同搭配。
然而,消费者其实是智能电视人机界面的最大变量。目前业界尚不清楚使用者将如何应对、挥舞着他们的手,或透过谈话来控制他们的电视。而在不同的文化和国家,手势的意义可能会有天壤之别。在意大利,说话时带着手势通常是必要的,但在日本则表示不礼貌。在欧洲,消费者对隐私非常敏感,因此可能不愿意每天看的电视机上装有数字相机镜头,尤其一台可以连接到互联网的电视。
12