什么样的智能助手才是我们真正想要的?
扫描二维码
随时随地手机看文章
很多人都非常向往科幻作品中未来的日常生活场景 —— 人工智能尽心尽力服务人类,任何事情只要随便招呼一声,机器系统都会马上替你完成。当时我们觉得,这样的生活实在是太轻松,太炫酷了。不过当这样的技术 —— 人工智能和数字助手 —— 开始离我们越来越近的时候,大家倒是冷淡了起来。
其实我们无法接受人工智能和数字助手的原因也很简单,一是“麻烦”,二是“尴尬”。
早前的计算机无法和人进行自然流畅的交流沟通,因此我们只能够用机器能理解的交互语言去让它听从我们的指令。从字符命令到键鼠在图形界面上的菜单操作,再到现在的触摸图标,都是如此。虽说是个不得已而为之的解决方案,但这种思路一直发展了那么多年,经过了无数次优化,人们不仅已经习惯了这种模式,而且十分享受它的精确和快速。
与此相比,语音助手需要你用尽可能规整的语言去告诉它该怎么做,它还有一定的反应时间,还要加上各种各样的出错可能性。那么,人们自然也就会喜欢“该是什么就是什么”的传统交互了。
即使在技术的发展下,出错率的问题得到了有效的控制,多数人也不会选择在公共场合中使用数字助手,其原因自然是因为“尴尬”了。想象一下现在饭局里一群人低头玩手机的场景,比起这个,大家七嘴八舌地对手机下指令似乎要诡异得多。即使是独身一人在家,肯定也有相当一部分人更喜欢默默进行操作,而非什么都要经过一遍自己的嘴。
业界的想法
微软全球执行副总裁,这个软件巨头在人工智能领域的领头人物沈向洋提出了一个有趣的观点:人工智能需要的是情感,它不是工具。
这个说法可能会让人们联想到电影《机械公敌》里的那个机器人,但沈向洋口中的情感似乎还没有到那个地步。他表示,合格的人工智能助手在用户询问天气之后,给出的要不仅仅是具体的天气信息,它还应该能够提醒用户多穿衣服、带上伞。换句话说,人工智能要能理解人类的情感。
沈向洋表示,人类之间的对话有一个特点是,并没有每一句话都有意义,在那些少数的任务性话语外,掺杂有许多许多的闲话和废话。微软希望的是在这种类似的闲聊中,通过一级一级的逐步分析来判断用户的情绪和他们真正的需求,然后完成任务。
正因为有这样的野心,沈向洋并不掩饰自己对 AlphaGo 的“吐槽”。他表示,尽管 AlphaGo 的出现是一个了不起的成就,但它的作用太单一,很难有商业化前景。这位微软高管的意思自然不是指 AlphaGo 只会下围棋,而是说它仅仅是一种弱人工智能,只能凭借筛选过滤求最优解的能力进行大数据分析,而不能真正走进千万家。
我们想要的助手
正如上文所说,数字助手要能真正得到人们的喜爱,“自然”和“善解人意”是不可或缺的。Siri 团队核心成员离开苹果后开发了 Viv 助手,开发者表示它未来能够仅凭用户一句“我醉了”就知道主动叫车将他送回家。这,距离我们理想中的人工智能和数字助手开始接近了。
有一种所谓的“恐怖谷效应”,指的是当一个拟人物体变得越来越像人的时候,人类对它的好感度会突然从一个高点跌至感到诡异可怕的程度。拟人物体那种很像人但明显不是人的状态给人们带来难以言说的恐惧。这种理论挪用到数字助手领域,它现在那种试图模拟人类却一点都不自然的互动方式让人们感到无比生硬和别扭。与此相比,反倒是人去迁就机器的那种交互方式因为和人人交互完全不一样,不会给我们别扭的感觉。
因此,数字助手需要做到的不仅仅只是听懂人类给它的清晰指令,它还需要学会理解人类的情绪,做到在人类那种特有的模糊混乱的表述方式里正确理解其需求,这样才能够达到初步被人类所接受的地步。
那么人工智能要尝试去理解的就不仅仅是话语了,还有用户的身体状态、姿势、步态、面部表情、语气等信息。此外,要理解人类一段话中的上下文联系,人工智能还需要去学习更多的人类对话,把握那些隐藏的东西。还有一点很重要,即使是人和人之间也不总是一直在用语言提出需求的,那么支持一定的文字输入、手势识别、隐蔽的小动作指令,这些都很重要。
未来可期
事实上沈向洋对人工智能技术的发展相当乐观,他认为只需 5 年计算机就能获得比人类更全面的语言理解能力,只需 10 年其视觉处理能力就将胜过人类。
人工智能真的是计算平台的未来吗?应该说答案是肯定的。事实上人类并不排斥和人工智能交流,否则微软小冰这个机器人在国内也就不会那么人气高涨了。在纯粹的“调戏”之外,我们也确实并不讨厌和具有一定信息处理和回馈能力的机器人交流。电影《钢铁侠》里斯塔克和智能管家贾维斯闲聊式的交互,只要技术能够做到这一点,那么尴尬生硬感就会消失 —— 哪怕对方其实本质上并不能明白你的情感,只是深度学习的体现。
可能会有人担忧人工智能给人类带来的威胁,因为没有感情的机器人会选择的完成任务的方式和人类预期的可能并不一样。关于这一点,我们就必须得把控好给予它们的权限范围。