DeepMind：AI智能体具备空间导航能力，学会“抄近路”

时间：2018-05-11 11:41:53

关键字：智能体 deepmindai 空间导航

手机看文章

扫描二维码
随时随地手机看文章

[导读]这次他们又训练出了一个AI智能体，学会了类似哺乳动物一样的“抄近路”能力，这次研究的目的，就是设法模仿人类大脑，用复杂的方式在周围空间里导航。这是一个前所未有的探索，被认为是理解大脑的一次重大进步。

今天凌晨，DeepMind又有新Nature论文发布!

这次他们又训练出了一个AI智能体，学会了类似哺乳动物一样的“抄近路”能力，这次研究的目的，就是设法模仿人类大脑，用复杂的方式在周围空间里导航。这是一个前所未有的探索，被认为是理解大脑的一次重大进步。

空间感知，对已经轻松成为围棋大师的AI来说，还是一件难事。

当你沿着熟悉的街道前进，绕过障碍，找到最快抵达目的地的捷径时，大脑里发生了什么?这是一个非常复杂的事情。

科学家们在动物和人类大脑中找到了三种跟认路相关的细胞，分别是位置细胞、方向细胞和网格细胞。

位置细胞能在主体到达特定地点时放电，从而赋予对过往地点的记忆;方向细胞能感应前进的方向;网格细胞则是最神秘的一种：它们能将整个空间环境划分成蜂窝状的六边形网格，仿佛地图上的坐标系。

发现网格细胞的的莫索尔夫妇因此获得了2014年的诺贝尔生理学或医学奖。不过，网格细胞仅仅是在空间环境中提供GPS定位服务吗?

一些科学家猜测，它们也会参与矢量计算，辅助动物规划路径。

DeepMind团队决定用人工神经网络检验上述猜想。

人工神经网络是一种利用多层处理模拟大脑神经网络的运算结构。团队首先用深度学习算法训练神经网络学习哺乳动物的觅食运动路径，利用线速度、角速度等信号在视觉环境中进行定位。

研究人员随后发现，一种类似于网格细胞活动特征的结构自动诞生了!在此前的训练中，研究人员并未刻意引导神经网络产生此种结构。

DeepMind团队随后利用强化学习检验这种网格结构是否能够进行矢量导航。强化学习被普遍用于训练游戏AI，人类告诉AI一种游戏的得分奖惩机制，但却不教授游戏方法，由AI在反复进行游戏、努力争取更高分的过程中自我进化。

研究人员将之前自动出现的网格结构与一个更大型的神经网络架构结合成了人工智能体，置于虚拟现实的游戏环境中。经历强化学习后，该人工智能在游戏迷宫中向目的地前进的导航能力超越了一般人，达到了职业游戏玩家水平。它能像哺乳动物一样寻找新路线和抄近路。

最关键的是，当研究人员“静默”原来的网格结构后，人工智能体的导航能力就会变弱，判断目标的距离和方向都更不准确了。

论文作者之一Dharshan Kumaran说道：“我们证明了网格细胞远不只是给我们提供GPS定位信号，也是一种大脑赖以计算两个地点间的最短距离的核心导航机制。”

哈萨比斯说，要证明我们能构建出来我们想做的那种通用智能，大脑的存在就是一个证据。所以从神经科学中为新的算法寻找灵感，是很有道理的。但我们同时也相信这种启发应该是双向的，人工智能研究的见解也能为神经科学中的开放问题提供灵感。

“这项工作就是一个很好的例子：通过构建一个能在复杂环境中导航的人工智能体，我们强调了生物网格细胞在哺乳动物导航中的重要性，也拓宽了这方面的理解。”哈萨比斯表示。

DeepMind团队相信，类似的研究方法还可以用来探索大脑听觉和控制四肢的机制。在更远的将来，神经科学家们甚至可以用人工智能代替小白鼠来做实验。

同时也用人工智能体验证了哺乳动物大脑中的“网格细胞”对基于向量的导航有支持作用。

阿维塔、赛力斯已入股！华为引望可能成“中国博世”