谷歌探索机器人向人类学习的方法 让机器人互相传授新技能
扫描二维码
随时随地手机看文章
试想一下,如果你不仅通过学习和练习,而且通过直接接触他人的大脑来获取他们的经验,你还能更好地掌握一些技能呢?
对于人类来说,这仍然是科幻小说,但在人工智能机器人领域,通过让机器人分享他们的经验,缩短训练时间是可能的。谷歌(Google)最近通过抓握机器人手臂展示了这一点。
六年前,谷歌前机器人主管詹姆斯·库夫纳(JamesKuffner)为这种技能的获取创造了一个术语,称之为“云机器人”。它承认由数据中心和更快的网络支持的分布式传感器和处理的影响。库夫纳现在是丰田研究所(ToyotaResearchInstitute)的首席技术官,他专注于云机器人技术,将家庭帮工机器人变成现实。
谷歌的研究、其英国人工智能实验室、Deepad和GoogleX还在继续探索云机器人,以加速机器人的通用技能获取。在周二发布的几个演示视频中,Google展示了使用共享体验来快速学习如何推动对象和打开门的机器人。
两臂好,四臂更好:机器人如何重新定义手术的未来
在世界各地的医院里,外科医生正从新的机器人助手那里得到帮助。
阅读更多
研究人员正在使用的三种多机器人方法之一是强化学习,即尝试和错误,并结合深层神经网络。这也是DeepMind用来训练AI掌握Atari电子游戏和中国棋盘游戏Go的方法。
每个机器人都有自己的神经网络,帮助它决定打开车门的最佳动作。Google通过添加干扰更快地建立数据。中央服务器也在记录机器人动作、行为和最终结果,并使用这些经验建立更好的神经网络,帮助机器人在任务中改进。
正如谷歌在两个视频中展示的一样,经过20分钟的训练后,机器人的机器人手臂正在摸索着寻找手柄,但最终设法打开了门。然而,在三个小时内,机器人可以很干净地到达手柄,扭转它,然后拉开门。
他们正在探索的另一种方法可能会帮助机器人按照指令在房子周围移动物体。在这里,谷歌正在教它的机器人建立心智模型,通过建立像素在某个特定动作后在屏幕上的位置的体验来了解事物是如何对某些行为做出反应的。
这一次,机器人们分享了他们在桌子周围推不同物体的经验,帮助他们预测如果他们采取某种行动的话会发生什么。
最后,研究人员正在探索机器人向人类学习的方法。谷歌的研究人员引导机器人走到门前,并展示了如何打开它们。这些动作被编码成一个深层次的神经网络,将摄像机图像转换为机器人动作。
再一次,后人类训练,机器人分享他们的经验后,试图打开门自己。此外,通过每次尝试逐渐改变门的位置,机器人能够在任务中逐渐提高,帮助他们在几个小时内变得更多。