阿尔法元大败阿尔法狗,将AI推入全新阶段

时间：2020-08-06 11:33:02

关键字： AI 深度学习阿尔法狗

手机看文章

扫描二维码
随时随地手机看文章

[导读] 　　去年，在AlphaGo以4：1战胜了李世石之后，AI技术就开始走进了人们的视线，它华丽的出现让人对它更加的追捧。现在机器人阿尔法狗下一代友又引起了关注，将会把AI推入一个全新的阶段。

　　去年，在AlphaGo以4：1战胜了李世石之后，AI技术就开始走进了人们的视线，它华丽的出现让人对它更加的追捧。现在机器人阿尔法狗下一代友又引起了关注，将会把AI推入一个全新的阶段。

　　近日，阿尔法狗的下一代阿尔法元（AlphaZero）的出现再次引起了世人的关注。在此次对弈过程中，阿尔法元以100比0的战绩轻松击败阿尔法狗。阿尔法元的成功让人工智能进入了一个全新的阶段。

　　继今年5月，机器人阿尔法狗（AlphaGo）在世界级三番棋人机大战中战胜了世界排名第一的中国棋手柯洁，近日，阿尔法狗的下一代阿尔法元（AlphaZero）的出现再次引起了世人的关注。在此次对弈过程中，阿尔法元以100比0的战绩轻松击败阿尔法狗。阿尔法元的成功让人工智能进入了一个全新的阶段。

　　我把人和机器的学习特征归分为三个阶段。第一阶段即从外界汲取知识的学习阶段。就像我们人要去学校上课，就是从老师、书本上汲取知识。人工智能机器人在这个阶段也一样。阿尔法狗为了打败人类围棋的世界冠军，训练期长达几个月。在这段时间里，它需要基于上百万种人类专业选手的下棋步骤来进行自我对弈的强化学习。另外一个案例，IBM基于“DeepQA” （深度开放域问答系统工程）技术所开发的医疗辅助机器人Watson，为了能更好地向医生提供可供选择的循证治疗方案，它目前已经“学习”了肿瘤学研究领域的42种医学期刊、临床试验的60多万条医疗证据和200万页文本资料。

　　到了第二阶段，就是人和人工智能的一个自我学习的阶段。就在上周，《自然》杂志发表了一篇名为《Mastering the game of Go without human knowledge》的学术论文。文中提到，与阿尔法狗相比，阿尔法元不需要借助任何人类经验知识，从零开始学习，完全靠自己强化学习和参悟。其中，最大的突破就是无监督的深度学习。这是一个不需要人为干预的学习过程，就像我们小时候学了基础的数学知识后，可以自主地去推理、思考。阿尔法元的这种突破正是对人类固有思维模式的一个突破。

　　而开创这一能力背后的核心技术--深度学习，早在2012年就登上了世界的舞台。这一年，深度学习之父Hinton带领团队在全球最知名的ImageNet机器视觉比赛上成功让人工智能的计算正确率提升至85%，这一数字在2010为72%，2011年为74%。短短三年后，微软研究院用了高达152层的神经网络让正确率提升到了95.06%，跨过了人类视觉94.9%的壁垒。可以看出，人工智能正在不断创造奇迹。

　　人与人工智能学习的最后一个阶段，我把它称之为开创能力的阶段。美国杜克大学人工智能专家陈怡然曾经说过，她觉得人工智能最有趣的地方就是证明了人类经验由于样本空间大小的限制，往往都收敛于局部而不自知，而人工智能学习则可以突破这个限制。

　　今天的人工智能已经进入到了一个自我学习的阶段，这是一个全新的突破。通过阿尔法元的故事，我们得出，人类常常会因为自身的局限性进而影响到机器学习的能力。其次，一个依靠外界学习的人工智能最多类似于一个脑子特别好使的人类，而未来需要的一定是更多具备自我开创能力的人工智能机器。

　　未来的十年是人工智能技术爆发的十年，未来的二十年，人工智能将被应用进更多商业化场景里逐步取代人类的简单繁琐的劳动，同时带人类进入一些人类无法超越的领域，所以这一切都还是刚刚开始，值得我们期待。