人工智能如何从动物上学习

时间：2020-04-27 19:33:01

关键字：人工智能数字表编码器控制策略

手机看文章

扫描二维码
随时随地手机看文章

[导读] 谷歌研究人员开发了一种 AI 系统，该系统可以从动物的动作中进行学习，从而赋予机器人更大的灵活性，该机器人可以完成现实世界中的任务，例如在多层仓库和履行中心之间运输物料。团队

谷歌研究人员开发了一种 AI 系统，该系统可以从动物的动作中进行学习，从而赋予机器人更大的灵活性，该机器人可以完成现实世界中的任务，例如在多层仓库和履行中心之间运输物料。

团队的框架采用了动物（在这种情况下为狗）的运动捕捉剪辑，并使用强化学习（一种训练技术，刺激软件代理通过奖励来完成目标）来训练控制策略。他们说，通过为系统提供不同的参考运动，研究人员可以“教”四腿的 Unitree Laikago 机器人执行一系列行为，从快速行走（每小时最高 2.6 英里的速度）到跳跃。

为了验证他们的方法，研究人员首先汇编了具有各种技能的真狗的数据集。然后，通过在奖励函数中使用不同的运动，研究人员进行了约两亿次训练采样一个模拟机器人来模仿运动技能。

但是模拟器通常仅提供真实世界的粗略近似情况。为了解决这个问题，研究人员采用了一种自适应技术，该技术可以随机化模拟中的动力学，例如改变物理量，机器人的质量和摩擦力。这些值使用编码器映射到数字表示形式（即编码），该数字表示形式作为输入传递到机器人控制策略。在将策略部署到实际的机器人时，研究人员删除了编码器，并直接搜索了一组变量，这些变量使机器人能够成功执行技能。

该团队说，他们能够在大约 50 个试验中使用不到 8 分钟的真实数据来使策略适应实际情况。此外，他们证明了现实世界中的机器人学会了模仿狗的各种动作，包括快跑和慢跑，以及一些关键帧动作。