诞生AlphaGo的DeepMind回顾2016年,提出三大发展方向
扫描二维码
随时随地手机看文章
谷歌旗下DeepMind团队本周在官方网站上撰文,回顾了2016年所取得的进展。展望2017年,DeepMind提出了三大发展方向,包括算法突破、社会影响,以及道德伦理的最佳行为。以下为文章全文:
在当前世界中,无论是天气还是征服疾病,我们都面临着非常复杂、紧急、难于掌握的系统。我们认为,智能程序将有助于挖掘新的科学知识,给社会带来帮助。为了实现这一目标,我们需要通用的学习系统,从头开始建立起对问题的理解,并利用这些去识别模式,取得其他方式无法获得的突破。在DeepMind,这是我们长期研究使命的焦点。
尽管距离我们设想的智能还有很远的距离,但2016年是重要的一年。对于多项核心挑战,我们取得了令人兴奋的进展,而我们也首次看到了人工智能对现实世界可能的积极影响。
我们的程序AlphaGo挑战并击败了世界围棋冠军李世石,而相关论文很幸运地让我们第二次登上了《自然》杂志的封面。许多专家认为,这一成就比预期中提前了几十年。对我们以及全球围棋社区来说,最令人兴奋的是,AlphaGo展示了赢得比赛的创造性,在某些情况下甚至找到了挑战数千年围棋智慧的下法。
对于史上最复杂的游戏之一,AlphaGo探索并分享了新思路,这表明了人工智能未来某天可能带来的价值。我们期待2017年能去完成更多游戏。
我们在生成模型领域也取得了有意义的进展,这样的软件能自主想象新的结构和场景。在发表关于图像生成的PixelCNN论文之后,我们发表至WaveNet的论文展示了生成音频的有效性。我们通过原始的波形合成了全球最近似真人的语音,而不是将语音样本简单地拼接在一起。我们计划与谷歌合作将这项技术产品化,并且很高兴这项技术能给数千万人使用的产品带来优化。
另一个重要研究领域是记忆和存储,尤其是如何将神经网络的决策能力与复杂结构化数据的存储和推理能力结合在一起。我们凭借“可微分神经计算机”在18个月内发表了第三篇《自然》论文。
这种模型能同时像神经网络一样学习,以及像计算机一样记忆数据。这样的模型能学习如何回答关于数据结构的问题,无论是族谱还是地铁线路图。这意味着我们更接近利用人工智能通过复杂数据集完成科学发现的目标。
除了推动这类系统用于更多场合,我们还投入了大量时间,优化系统的学习方式。一篇题为“无监督辅助任务的增强学习”论文描述了将某些任务学习速度提升多个数量级的方法。考虑到高质量训练环境的重要性,我们向整个社区开源了旗舰的DeepMind Lab研究环境。我们也在与暴雪合作,开发用于《星际争霸2》的人工智能训练环境。
当然,这些只是冰山一角。通过我们今年在顶级刊物,例如《Neuron》和《PNAS》,以及主流机器学习会议,例如ICLR和NIPS上发表的论文,你可以了解到我们的更多工作。我们很高兴看到,社区中的其他参与者正在这些论文成果的基础上积极部署和开发,例如2016年晚些时候围棋程序的再次兴起,以及人工智能和机器学习在更广泛的领域快速发展。
我们也很高兴看到,这类工作对现实世界的初步影响。我们与谷歌数据中心团队展开了合作,利用类似AlphaGo的技术发现创造性的新方法管理散热,使楼宇能效大幅提升了15%。
如果这类技术可以被用于其他大规模工业系统,那么将很可能给全球环境和成本带来帮助。这只是我们与谷歌多支团队合作,将先进研究用于全球产品和基础设施的一个案例。
与此同时,我们也在积极参与与英国两家NHS(全国医疗系统)医院的机器学习研究合作,探索我们的技术如何带来更有效的诊断,以及对影响全球数百万人的症状的治疗。
我们还与另两家医院集团就移动应用,以及基础性设施展开合作,给医疗带来优化。
当然,这类技术对社会的积极影响不仅仅是我们正试图解决的现实世界问题,也包括算法和模型的设计、训练和部署方式。我们很自豪,能参与创立Partnership on AI项目。
这一项目将领先的研究实验室、非营利的民间社会团体,以及学术机构联合在一起,在算法透明度和安全性等方面制定最佳行为规范。
通过体验和信息的多样化,我们希望能协助解决这些挑战,找到方法将社会目标置于全球人工智能社区的中心。
我们仍是一家年轻的公司,处于使命的早期。但如果2017年我们可以进一步在这三大领域,包括算法突破、社会影响,以及道德伦理的最佳行为,取得同时的进展,那么将可以更好地对科学社区和全世界做出贡献。