人工智能正在向具有“高情商”发展
扫描二维码
随时随地手机看文章
目前机器智能领域的成功主要依赖于计算能力,为了做出最佳决策可能搜索数十亿次。如果决策成功的话,往往表明计算能力已经赶上甚至超过人类的智力。人类智能是高度概括的、自适应的和健壮的,即使当前最先进的机器智能系统也无法产生这些特性。例如,即使存在许多未知的变量,人类也能够根据预期的结果提前进行重要的计划。人类的智慧还具有同情心、同理心、善良、有教养,而且重要的是,它能够为了更大的使命而放弃和重新定义一些目标。几乎所有的机器智能研究都集中在“如何”上,但人类智能的特点是能够问“什么”和“为什么”。
假设情商是开启智能机器的关键,他们不仅更普遍、更强大、更高效,而且还符合人类的价值观。人类的情感机制使我们能够完成目前机器无法编程或训练的任务。例如,我们的交感神经和副交感神经反应使我们知道安全,并能意识到危险。我们能够感受到他人的影响,并能设身处地的去想,这有助于我们做出正确的决定和驾驭复杂关系。饥饿、好奇、惊喜和快乐等情感因素使我们能够规范自己的行为,并确定希望实现的目标集。最重要的能力是,我们能够通过与他人沟通表达内心状态,并可能影响他们的决策。
因此,有人假设将这种情商构建到一个计算框架中,它至少需要具备以下能力:
1.感受他人的情感
2.对他人情感做出反应
3.表达情感
4.在决策中管理和利用情感
从研究历史上看,构建高情商机器主要从人机协作的角度出发,集中在前三项功能上。例如,最早关于情感识别的研究始于近30年前,当时人们使用生理传感器、照相机、麦克风等来检测一系列情感反应。虽然人们对于是否一致和在脸上或其他感官上传达信号,以及这些信号是否真实反映了他们内心的感受,存在着很多争论,但研究人员已经成功地建立了算法来识别人类表达的信号,并证明这些信号符合社会文化规范。
根据人的内在认知状态采取适当行动的能力,是具有情商的基本体现。最近在顺序决策方面的研究,如上下文赌博机,正逐步取得进展。例如,饮食情感管理系统如何帮助人们做出正确的决定。
几十年来,情感表达一直处于计算的最前沿。即使是简单的信号(例如,光、色、声)也有能力传达和激起丰富的情感。在将于2019年第七届国际学习代表大会iclr上发表的“Neural TTS Stylization with Adversarial and CollaboraTIve Games”论文中,我们提出了一种新的机器学习方法来合成具有表现力的逼真的人类语音。该体系结构模型生成真实的语音,并通过一个易于控制的拨盘,以独特的方式改变表达的情感。我们的模型在多个任务中达到了预期效果,包括内容转换、情感建模和身份转换。本文提供了一个开源实现。
图1神经模型架构
虽然人工智能系统的识别、表达和干预方面的研究在过去20年已经深入,但还有一种更引人注目的智能形式有效地利用情感机制的系统为了更好地学习和更有效地做出选择。我们希望探索建立这样的情感机制,以帮助计算机实现比目前更多的决策。
最近人工智能在围棋、Pac-Man和基于场景的角色扮演游戏等方面取得了成功,很大程度上依赖于强化学习。在强化学习中,好的行为会得到奖励,坏的行为会受到惩罚。然而,要让计算模型学习一个合理的策略,需要在这样一个行动奖励框架中进行大量的试验。我们可以从人类和其他生物情感中获得灵感如何利用情感机制来更有效地学习。
当人类学会在世界上生存时,身体(神经系统)的反应会对行为选择提供潜在的持续反馈,例如,当接近悬崖边缘或在拐弯处快速行驶时,会变得紧张。生理变化和心理反应会保护自己免受危险。人类对危险情况的预感是心率加快,血液从四肢分流,汗腺扩张。这是身体的“战斗或逃跑”反应。人类已经进化了数百万年来建立这些复杂的系统。如果机器有类似的反馈系统呢?
图2一种新的强化学习方法
在《Visceral Machines: Risk-Aversion in Reinforcement Learning with Intrinsic Physiological Rewards》一书中,我们提出了一种新的强化学习方法,它利用了人类“战斗或逃跑”行为的内在奖励功能。
我们的假设是,这样的奖励函数可以规避强化学习环境中与稀疏和倾斜奖励相关的挑战,并有助于提高样本效率。我们在模拟驾驶环境中进行了测试,结果表明,该方法可以提高学习速度,减少学习过程中的碰撞次数。我们对训练自主系统的潜力感到兴奋,这种系统能够模拟以情感方式感受和响应刺激的能力。
图3 人体在驾驶过程中所记录的生理反应
许多计算机科学家和机器人专家都渴望打造出类似于凯特(KITT)和R2D2等流行科幻小说中令人难忘的机器人形象。然而构建情感计算机制,对我们构建健壮、高效和更有远见的人工智能,提供了大好时机。我们期待这项研究能让人们重新审视情感在人工智能中的应用。