人工智能如何从动物上学习
扫描二维码
随时随地手机看文章
谷歌研究人员开发了一种 AI 系统,该系统可以从动物的动作中进行学习,从而赋予机器人更大的灵活性,该机器人可以完成现实世界中的任务,例如在多层仓库和履行中心之间运输物料。
团队的框架采用了动物(在这种情况下为狗)的运动捕捉剪辑,并使用强化学习(一种训练技术,刺激软件代理通过奖励来完成目标)来训练控制策略。 他们说,通过为系统提供不同的参考运动,研究人员可以“教”四腿的 Unitree Laikago 机器人执行一系列行为,从快速行走(每小时最高 2.6 英里的速度)到跳跃 。
为了验证他们的方法,研究人员首先汇编了具有各种技能的真狗的数据集。然后,通过在奖励函数中使用不同的运动,研究人员进行了约两亿次训练采样一个模拟机器人来模仿运动技能。
但是模拟器通常仅提供真实世界的粗略近似情况。为了解决这个问题,研究人员采用了一种自适应技术,该技术可以随机化模拟中的动力学,例如改变物理量,机器人的质量和摩擦力。这些值使用编码器映射到数字表示形式(即编码),该数字表示形式作为输入传递到机器人控制策略。 在将策略部署到实际的机器人时,研究人员删除了编码器,并直接搜索了一组变量,这些变量使机器人能够成功执行技能。
该团队说,他们能够在大约 50 个试验中使用不到 8 分钟的真实数据来使策略适应实际情况。此外,他们证明了现实世界中的机器人学会了模仿狗的各种动作,包括快跑和慢跑,以及一些关键帧动作。