AlphaGo首胜柯洁后,AlphaGo之父分享AI愿景
扫描二维码
随时随地手机看文章
北京时间5月24日消息,围棋峰会进入第二天,在今日举行的人工智能高峰论坛上,DeepMind创始人杰米斯.哈萨比斯(Demis Hassabis)发表了演讲,介绍了AlphaGo的研发过程,以及AlphaGo意味着什么。
AlphaGo是DeepMind公司打造了人工智能系统,DeepMind在2010年于伦敦创立,在2014年加入Google。据哈萨比斯介绍,DeepMind参与了谷歌人工智能的“阿波罗计划”,另外还还打造了研发科学的新方式。
“DeepMind的愿景是研究何为AI,然后再用智能解决所有问题,即我们怎样提出有效的建议去解决问题,我们最终希望建立通用人工智能。”哈萨比斯说到。
据哈萨比斯透露,AlphaGo打造的通用学习机器有两个特性,一个是“学习”,即非程序预设,可以自主学习原始材料。另一个是通用性,即同一个系统可以执行多种任务。“一系列的算法和系统能够做系列的任务,这些任务可能是前所未见的。”哈萨比斯表示,通用的强人工智能,与现在弱人工智能不一样,目前弱人工智能都是预设的,其实IBM在上世纪90年代设计的国际象棋程序也是预设的预设的人工智能,“它是通过蛮力搜索,机器被动的接受这个程序,不能自我学习。”哈萨比斯说到。
DeepMind希望打造强化学习框架,哈萨比斯称,强化学习框架就是让“智能体”深处在一个真实/虚拟的环境中,去完成一个特定的目标。为了完成这项任务,智能体可以观察环境,这其中有视觉、听觉、触觉等观察方式。在这个之后,在头脑中设置一个想法,然后采取行动,践行计划。在实时的观察中就可以行动的。“如果能解决这个问题,其实强人工智能就已经实现了,这与人这一智能体观察学习的方式是一样的。”哈萨比斯表示。
哈萨比斯提到了雅达利智能体,这是DeepMind在AlphaGo之前(三年前)研发的AI程序,通过2600测试台,测试百余款八十年代的八位元雅达利游戏。当时的雅达利智能体仅仅输入原始像素(~30),目标是利用深度强化学习,玩好雅达利游戏。
AlphaGo目前成为DeepMind最新的人工智能系统。哈萨比斯称,虽然AlphaGo是玩围棋的,但是它也可以做其他东西。
为什么计算机下围棋非常困难?这是因为其复杂程度让穷举搜索都难以解决,这个难题包括两个方面,一是“不可能”写出评估程序以决定输赢,另一个是搜索空间太过庞大。
在哈萨比斯看来,更困难的是围棋不像象棋等游戏靠计算,而是靠直觉。“围棋中没有等级概念,所有棋子都一样,围棋是筑防游戏,因此需要盘算未来。你在下棋的过程中,是棋盘在心中,必须要预测未来。小小一个棋子可撼动全局,牵一发动全身。围棋'妙手'如受天启。”哈萨比斯如此解释围棋中的直觉。
在技术上,AlphaGo用到了两种网络:策略网络和估值网络,这些技术去年在《Nature》上发表,并启发了很多研究者设计自己的人工智能系统。
哈萨比斯回忆到,此后我们进行了测试,2016年我们让AlphaGo与李世石对弈,最后AlphaGo以4:1战胜了李世石,“这一刻我们等了十年,真的是十年磨一剑。”李世石感慨到。
AlphaGo吸引了2.8亿的观众,3.5万篇的报道,棋盘销售在西方增加了10倍。哈萨比斯回忆了其中(AlphaGo对弈李世石)的精彩之处,分别是第二局第37步棋令人惊叹,它让我们思考:几千年来,你人类都低估了第5条线下子的价值。另外,还有第四局绝伦的第78着,他赢得了一盘。李世石说,“我认为这给围棋引入了新思路,我感觉找到了继续玩围棋的新理由。”
哈萨比斯称,很多艺术都是主观,AlphaGo把围棋看做了一个客观的艺术,每一步都会分析有什么影响。“因此,我给直觉的定义是,通过体验获得初步感知,无法表达出来,可通过行为确认其存在和正误。”哈萨比斯表示,AlphaGo已经可以模仿人的直觉,而且具备创造力,通过组合已有知识或独特想法的能力。所以AlphaGo已经有了直觉和创造力,不过这些能力目前仅仅局限在围棋上。
在这之后,DeepMind希望弥补AlphaGo知识的空白,之后便发布了新的版本“Master”,在网上进行对局,也获得了很大的胜利。柯洁在与Master对弈后感叹到,人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。哈萨比斯称,“20世纪三四十年代,吴清源给围棋带来了革命性的力量。我相信AlphaGo也能开启一个围棋新时代。棋类程序讲战术,AlphaGo讲战略。”
“我们离最优还有多远,怎样才是完美的棋局?3000年的对弈不足以找到最佳棋局。AlphaGo让我们可探寻这些奥秘。”哈萨比斯说到。
围棋之外,哈萨比斯希望将人工智能运用到各种各样的领域。哈萨比斯称,“人机合作可以达到1+1>2的效果,人类的智慧将被人工智能放大。人工智能和AlphaGo都是工具,就像哈勃望远镜一样,可以推进人类文明的进步。”哈萨比斯称,无数其他领域也将遭到组合轰炸,强人工智能也是我们探索的最好工具,比如将AI用到材料设计、新药研制上,还有现实生活中的应用,如医疗、智能手机、教育等。
目前,DeepMind已经非常成功的将AlphaGo用到了数据中心的优化中,结果显示可以节省50%的电能。
最后,哈萨比斯总结到,信息过载和系统冗余是巨大挑战,我们希望利用AI找到元解决方案。“我们的目标是实现人工智能科学,或人工智能辅助科学,当然AI要有伦理和责任的约束。总之,人工智能技术可以帮助我们更好的探索人脑的奥秘。