神经网络处理器打破了人工智能发展的瓶颈
扫描二维码
随时随地手机看文章
如果AlphaGo采用寒武纪处理器的架构,只需要一台个人电脑大小的主机,就可以运行起来,而且运行速度应该会更快。
如何能让一张普通的图片具有艺术性呢?现在,借助一款应用了人工智能算法的手机修图软件 Prisma,你可以将任何照片变成名画风格(比如梵高、莫奈、毕加索或宫崎骏风格),且极具艺术品质。连俄罗斯总理梅德韦杰夫都忍不住在社交网站上晒出了一张用Prisma处理过的、有着浓郁铅笔画风格的风景照——滤镜里的莫斯科夜晚。
与普通滤镜不同,Prisma采用深度学习算法,能够利用复杂的人工神经网络,抽象出给定绘画作品里一些高级的隐藏特征,学习画家的绘画风格,再把这个风格“智能”地应用到一张新图片上,是第一款人工智能的平民化应用。不过,美中不足的是,因为人工智能算法计算量极大,用户需要把照片发送到远程的服务器,几十秒后才能看到预览效果。
人工智能算法运算量到底有多大?想像一下,同样采用了人工智能算法的AlphaGo,需要用到上千块传统处理器(CPU)和上百块图形处理器(GPU)。
很显然,在人工智能迎来新一波复兴的今天,传统处理器正成为阻碍人工智能普及的瓶颈。如果没有一款专门为神经网络设计的芯片,既高效、低耗、体积小,还能够嵌入智能终端设备,我们就无法与人工智能真正“亲密接触”。好消息是,今年3月,一家刚刚成立的芯片设计公司——寒武纪公司(中国科学院计算技术研究所下属的产业化公司),已经发布了世界上第一款神经网络处理器指令集(Cambricon),而且正走在商业化的路上。
值得一提的是,寒武纪公司的首席执行官陈天石和首席科学家陈云霁,是一对亲兄弟。哥哥陈云霁是计算机体系结构专家,弟弟陈天石是人工智能专家。兄弟两人的合作始于用人工智能技术支持通用处理器的研发,而后又转向用处理器技术来支持人工智能的发展。
2014年,陈天石、陈云霁与法国信息与自动化研究所(INRIA)的奥利维耶·泰蒙(Olivier Temam)博士共同发表的学术论文《DianNao:一种小尺度的高吞吐率机器学习加速器》(DianNao: A Small-Footprint High-ThroughputAccelerator for Ubiquitous Machine-Learning ),获得了ASPLOS(Architectural Support for Programming Languages and OperaTIng Systems ,编程语言和操作系统的体系结构支持)国际会议最佳论文,吸引了国际同行的目光。随后发表的几篇论文,更是奠定了他们在神经网络处理器这个领域的国际领跑地位。
传统处理器指令集是为进行通用计算发展起来的,基本操作为算术运算和逻辑运算。而深度学习算法,基本操作是对人工神经网络中的虚拟神经元和突触进行处理。作为一款神经网络处理器,寒武纪处理器指令集的一条指令即可完成多个神经元的并行处理,而传统处理器需要数百甚至上千条指令才能完成一个神经元的处理。这也就解释了,为什么传统处理器运行深度学习算法时效率会如此低下。
“如果把深度学习看作切肉,传统的处理器就是瑞士军刀,我们的专用神经网络处理器则相当于菜刀。瑞士军刀通用性很好,什么都可以干,但干得不快,菜刀是专门用来切菜的,在切肉这件事情上,效率当然更高,”接受《环球科学》采访时,寒武纪公司首席执行官陈天石形象地比喻,“在运行人工智能算法方面,寒武纪处理器比通用处理器好百倍到千倍,如果AlphaGo采用寒武纪处理器的架构,只需要一台个人电脑大小的主机,就可以运行起来,而且运行速度应该会更快”。
武纪公司与中国科学院计算技术研究所又共同发布了国际上首个稀疏深度学习处理器(Cambricon-X),性能更好,功耗更低。在65nm工艺下,Cambricon-X芯片面积仅为6.38平方毫米,最高每秒能进行5000亿次神经网络基本运算,性能是高端GPU的10倍,能耗却仅为其3.4%。
目前,寒武纪公司正紧锣密鼓地将自己的芯片推向产业化。陈天石介绍说,“芯片从研发、量产到商用,是一个以年为单位的周期,所以最快明年,大家应该可以在市面上看到使用寒武纪技术的芯片产品,比如在智能终端、智能机器人、手机、安防监控或云端服务器上”。
神经网络处理器的诞生,或许会将人工智能推到一个全新的高度。“我们要让人工智能的门槛更低,让研究人员可以自由地尝试规模更大、更复杂的算法。这也是我们给公司取名‘寒武纪’的寓意所在”,陈天石说,“像地质年代中的寒武纪迎来生命大爆发一样,我们希望,寒武纪芯片也能开启人工智能的新纪元”。