专家:机器人语音会让人们心生厌恶
扫描二维码
随时随地手机看文章
恐怖谷是我们熟悉的:如果一个人形机器人造型逼真,但又达不到足够真实,它会让人感到怪异。
到目前为止,这种说法几乎完全适用于机器人的面容和身形,但人们往往忽略了机器人语音中的恐怖谷现象。
Kozminski大学的机器人专家Aleksandra Przegalinska是个例外,他同时也是麻省理工学院的研究员,关注于聊天机器人和语音助手的蓬勃发展。本周WIRED(《连线》杂志)在SXSW与其共同讨论“机器人复制人类语音中所面临的巨大挑战”,为什么人形机器人的未来可能不会特别明朗?当你让学生教聊天机器人如何说话时,会发生什么?
WIRED:为什么将研究的关注点放在机器人语音方面呢?
Przegalinska:恐怖谷现象不仅存在于机器人的仿真形象上,也存在于语音方面,如其说话的方式。音调本身在这里非常重要。这就是为什么我们对聊天机器人感兴趣,所以我们建立了自己的聊天机器人。
我的学生与聊天机器人交流了整整一年,主要是为了使机器从中学习,然而,最终收集到一些人类羞辱机器的言语,这可能就是恐怖谷的一部分。为什么学生会对聊天机器人心生厌恶?可能是因为聊天机器人只是一个聊天机器人,或者学生因为心中的不安全感而讨厌机器人。
WIRED:这种现象也会发生在物理机器人身上。日本曾进行一项研究,将一个机器人放置于商场中,看看孩子们会对它做什么,最终孩子们踢了它并直呼其名。
Przegalinska:对于孩子来说,他们处在一个受自然本性影响远大于文化的阶段。
WIRED:也许这对他们来说是宣泄,也许就像治疗一样。
Przegalinska:也许这种反应与人们试图处理由恐怖谷现象所产生的情感有关。你会感到厌恶,因为你不确定自己与之互动的对象是什么。我能感受到人与聊天机器人助理的奇怪关系——聊天机器人非常有礼貌,而人们只是向他们扔垃圾,这是是一种怪异的情况,好像他们是一些较低级别的人。
WIRED:聊天机器人可以采取不同的形式,对吗?基于文本或带有虚拟化身。
Przegalinska:我们发现拥有虚拟化身的聊天机器人会使人们感到厌烦。在大多数情况下,它给出了与文本相同的响应,但反应的差异是巨大的。在基于文本与聊天机器人互动的情况下,参与者发现机器人非常有能力谈论各种主题。与之对比的是,当聊天机器人带有虚拟化身时,就情感反应而言,人会感到有压力。人们与基于文本的聊天机器人的对话通常是两倍长。
WIRED:你的聊天机器人表现如何?它如何以一个交谈者的角色而存在?
Przegalinska:无论何时进行对话,聊天机器人都会尝试反映对方的说法。例如,如果你说你讨厌体育,而且谈话时间足够长,聊天机器人会说“我也讨厌体育。”
WIRED:所以它可能骗你。
Przegalinska:当然,这经常出现。它也会经常转变。
WIRED:或者更糟糕的是,它会变得种族主义。
Przegalinska:实际上,这发生了。我认为我们的聊天机器人在很多方面仍然非常可控,我们很惊讶地看到它的转变频率。我们确实策划了它所呈现的一些内容,但随后机器人通过与其他人的互动轻松地与之分道扬镳。
WIRED:除了语义之外,当谈到当前的机器人语音时,究竟是什么让人们失望?
Przegalinska:即使是一个简短的句子,机器人也会以长句的方式来处理。这在某种程度上是如此具有决定性,听起来你期待一个冗长的陈述然后句子结束。因此,理解你所说的语调和语境会存在问题。因此,将语义与语调联系起来,这就是出错的部分。
WIRED:当这种智能体现在索菲亚这样的机器人身上时,复杂程度会更高,大多数人都从她的脱口秀节目中了解到这一点。
Przegalinska:也许问题是如何将语义与语调整合在一起。我们知道像这样的系统是非常模块化的,因为有一个系统负责移动头部而另一个系统负责微笑。所有这些模块有时很难整合。我认为这是恐怖谷,一种响应的延迟。它需要非常大的计算能力。但我毫不怀疑这就是未来。除非人形机器人被彻底抛弃。这也是一种选择。我认为这是可能的。