OpenAI可以宣布自己是世界第一了
扫描二维码
随时随地手机看文章
OpenAIFive在Dota2中以2:0击败了世界冠军团队,人机大战人类最终不敌AI。OpenAIFive在去年输掉比赛后进行了优化,训练时间相当于人类玩了4.5万年。
OpenAI可以宣布自己是世界第一了。
今天凌晨,OpenAIFive在Dota2中以2:0击败了世界冠军团队OG,再次显示出了AI的强大威力,也正式宣告人类在Dota这种高难度游戏中成为AI的手下败将。
这次比赛,OpenAIFive的表现出是迄今为止展示出的最高水平:人类对手去年赢得了世界上最令人垂涎的电子竞技赛事TI8的冠军;OpenAIFive在去年输掉比赛后进行了优化,训练时间相当于人类玩了4.5万年,赢得比赛也并不出乎意料。
人类对手OG团队
2:0,AI战胜人类
在这场人机大战中,每队只有17个英雄可供选择。OpenAI还选择了所谓的“Captain'sDraft”游戏模式。与之前的比赛一样,OpenAI也禁用了召唤和幻觉功能,这两项功能都涉及以英雄副本的形式引入其他变量,以及OpenAI训练系统时未考虑的一些特殊因素和单位。
除此之外,这场比赛与正常的Dota2比赛一样,其最终目标是摧毁敌方队伍的“基地”,即每个团队领土末端的大型塔楼,在敌人的队伍成功摧毁其他小型塔后,基地是很脆弱的,整个比赛过程的中心是对塔的攻防,以及英雄与英雄之间的团战。
在第一场比赛中,OpenAIFive让对手OG大吃一惊,通过一系列激进战术获得了胜利,其中包括对游戏中获取的金币的花费方式,在本方英雄死亡时立即买活,即使在比赛初期也是如此。
对此,OpenAI首席技术官GregBrockman指出,OpenAI喜欢有利于短期收益的战略,说明在长期规划上不如人类,而且DOTA2这种游戏通常要依赖于长期规划才能获胜。然而,在这场比赛中,这种早期的买活策略得到了回报,OpenAIFive获得了优势,当比赛拖入30分钟时,OG顶不住了。
在第二场比赛中,OpenAI表现更好,在最初的几分钟内即获得了对OG的早期优势,然后无情碾压了人类玩家,在第一场比赛时间刚刚过半的时间点上即取得胜利。
值得注意的是,OpenAIFive在第二场比赛中开始玩得异常激进,以及OG在AI全图范围内的推进时有些无力对抗。OpenAIFive能够利用其特定的英雄选择带来的优势。
飞速进化的OpenAIFive:已经训练4.5万年
去年8月,OpenAIFive曾以3:2击败半职业人类玩家,不过当面对职业对手时,OpenAI便输给了paiNGaming战队,帅不过三秒。
根据OpenAI联合创始人兼主席GregBrockman(也是该组织的CTO)的说法,在输掉比赛之后,OpenAIFive是通过在加速的虚拟环境中进行自我改进而变得更加强大的。
OpenAIFive由深度强化学习提供支持,也就是说它的编码目的不是“如何游戏”,而是“如何学习”。Brockman在比赛开始前表示。,AI在10个月中,已经玩了45000年的Dota2游戏,而且,玩了这么长时间也没有觉得无聊。
这场比赛采用三局两胜制,所有bot都使用相同的深度强化学习技术进行训练,并由同一OpenAI系统的不同层独立控制。
OpenAI向公众开放与AI对决,终极目标是实现通用人工智能
对于OpenAI来说,值得庆祝的不仅仅是这次胜利,还因为其证明了对强化学习的态度及其关于AI的普适哲学树立的里程碑。
研究团队将不再公开展示其AI游戏bot,而是致力于开发软件,让人类与OpenAIFive软件实时协作,与机器人一起玩游戏,并学习他们独特的前所未有的战略和行为。
OpenAIFive还发布了一个平台,供公众与OpenAIFive对战,这种模式称为“竞技场”模式,将于4月18日起开放三天。OpenAI表示,协作软件可能永远不会向公众开放,不过大家可以在活动中亲自尝试一下。
OpenAI的联合创始人兼首席执行官SamAltman还表示,此类工作证明了与AI智能体的合作可能会在未来带来巨大的利益。
Altman说:“对于世界如何运作,如何训练这些智能体,令其实现协作上,这次活动是重要的一课。实现人类与AI的合作,是我们对未来世界更积极的愿景之一,人工智能与人类共同努力,使人类变得更好、更有趣、更有影响力。”
OpenAI可能会继续涉足Dota2和其他视频游戏,主要是因为这些游戏是人工智能的良好测试平台,也是衡量AI技术进步的良好基准测试工具。
现在可能还没有一个游戏像OpenAIFive这样,AI系统最终无法具备超出人类能力的水平。对于更广泛的AI行业而言,精通视频游戏可能很快就会变得过时,我们需要简单的方式来证明AI系统可以快速学习,并能够更快速高效地的解决现实世界的困难任务,获得更有意义的好处。
最终,OpenAI希望将其Dota2学习并扩展到游戏之外的新领域,并最终扩展到现实世界中。为此,OpenAI正致力于使用强化学习和其他技术,为机器人手提供更灵巧、更精细、更人性化的动作。
“OpenAI正在努力的方向建立通用人工智能(AGI),并与世界分享这些好处,同时确保其安全性。”Altman说的是建立一个能够执行任何人类任务的多功能AI系统。“我们的目标不是战胜电子游戏,虽然这很有趣。我们的目标是揭开实现AGI道路上的秘密。”