巨兽的细胞,超级计算机为何使用平板处理器核心?
扫描二维码
随时随地手机看文章
日前有消息称,Intel将在代号为“Knights Landing”的下一代Xeon Phi协处理器中配备多达60个核心,而Intel最新公布的资料显示,Knights Landing的核心数量最多是72个!Xeon Phi是用来搭配Xeon、面向高性能计算领域的专用协处理器,目前这种架构已经在很多超级计算机中得到应用。
Intel透露说,Knights Landing的核心架构是Silvermont,是的,你没看错。这个Silvermont就是平板机和迷你机上的Bay Trail处理器的核心,虽然这种核心规模不大,本身性能不是很强悍,但是通过多达72个核心288个线程,以及针对高性能计算的各种优化,双精度浮点性能可以超过3TFlops,堪称怪兽。
为什么我们平板,手机上用的Bay Trail处理器核心会成为超级计算机的核心呢?
一、超级计算机之路
其实,计算机最早的需求就是从超级计算机开始的,无论是实际上第一台机械计算机(英国巴贝奇爵士设计,未最终完成),还是第一台电子计算机eniac,都是做科学计算用的。
计算机发展到PC反而是苹果公司和Wintel联盟出现以后的事情,发展到今天的智能手机则是上个世纪90年代以后了。
计算机性能的扩展有两条道路,一条的不断改进制造工艺,提升芯片设计水平,把单个芯片设计的很强悍,提升性能。还有一条道路是尽可能用比较多的机器并行,用多机机器一起运算来提升性能。
自从计算机出现以来,就一直沿着这两条道路在前进。在这个发展过程中,以深蓝1997年战胜国际象棋大师卡斯帕罗夫为标志,代表了人类智能被机器超越。
二、从高大上到平民化
早期,超级计算机都是昂贵的高级货,处理器是专门设计的,芯片组是配套的,甚至每根连接线都是定制的。这个成本极高。
而随着PC和网络的发展,人们发现追求强大的计算能力可以不那么昂贵。于是,人们开始尝试用大批量生产的PC或者工作站来攒超级计算机。
若干台PC或者工作站通过网络连接起来,把任务分给这些机器并行,然后返回,计算能力丝毫不弱于昂贵的专用超级计算机,于是传统的超级计算机开始没落。
这个时代出现了很多平民化的超级计算机,譬如用浩鑫HTPC准系统凑起来的超级计算机,把一个学校的MAC电脑凑起来的超级计算机等等,这些看似玩具的东西居然一度占据了TOP500超级计算机排行榜,甚至谷歌自己用的服务器也是用这种办法攒出来的。
而在这个过程中,人们发现,限制超级计算机能力居然是功耗,人们不能堆积太多的数量是因为功率和发热限制,性能功耗比甚至比性能本身更重要。
于是,IBM开发出蓝色基因,不追求单个核心的高性能,而是降低功耗,攒更多的数量来提升性能。但是因为单独开发这种处理器在批量和成本上无法与通用的PC处理器相比,并没有流行开。
三、Cell和GPU引发的变革
索尼为了提升PS3游戏机的性能,联合IBM搞了Cell处理器,这是异构计算的开始。因为在计算任务中,有些任务是简单的,不需要复杂的逻辑处理,只需要足够的计算单元暴力计算,这样处理器就可以设计成两部分,一个简单的运算核心,几个强大的简单计算单元,这就是Cell的思路。
因为这种计算编程难度太高,所以Cell用在游戏机上并不成功,但是这个思路可以拿到电脑上,这就是我们熟悉GPU通用计算。
因为3D的需求,显卡有强大的计算能力,这种能力只用于3D游戏浪费了,于是在Cell之后就有了GPU的通用计算,CPU处理复杂任务,GPU处理暴力计算,nVIDIA甚至搞出来CUDA专门解决这个问题,而且在GPU的设计上就为通用计算做了优化。
单台计算机异构化,获得强大的计算能力,那么就可以把这些单台计算机联网,组成计算能力强大的异构超级计算机。
于是中国在2009年搞出来天河一号超级计算机,就是CPU和GPU异构组成的超级计算机,一度排名世界第一。百度搞人工智能的计算机也是这种异构的超级计算机。
四、Intel的反击
如果以后超级计算机全部异构化,那么CPU提供的计算能力只占一小部分,这无疑代表了nVIDIA和AMD要抢Intel的饭碗,Intel当然不能坐以待毙。
于是Intel开始自己做异构用的芯片,这就是Larrabee计划,其实GPU本来就是一个个小的计算核心,然后组合起来。而Intel手里是有小核心的,这就是当年的奔腾一代处理器核心P54C。
Intel把这款20年的老核心集成起来做成众核,做成协处理器,可以做3D显卡,也可以做超级计算机的协处理器。这个项目初期失败了。但是,Intel在这个基础上发展出来了“众核架构”(MIC)的Xeon Phi协处理器。并且获得了天河2号(目前世界第一超级计算机)的选用,Intel扳回一城。
五、Knights Landing的升级
协处理器的能力取决于小核心的计算能力,P54C这个20年前的核心弱爆了。而Silvermont作为Intel反击移动市场的利器,性能功耗比非常出色,于是,Intel把这个小核心攒起来做成众核的Xeon Phi,这就是Knights Landing。
Knights Landing的72个核心将每两个核心构成一个模块(Tile),然后再通过Mesh网格网络连接在一起,共享36MB缓存,还有816GB HBM高带宽显存充当三级缓存。
在内存规格上,Knights Landing支持六通道的DDR4-2400,最大容量384GB。在扩展方面则集成36条PCI-E 3.0通道,可以在一台主机上插数块,提升几倍运算能力。据了解,中国的下一代超级计算机很有可能用上。
所以,低功耗的移动处理器变身超级计算机核心,实际是技术不断探索发展经过几代进步的结果,随着Intel未来移动桌面合一的计划,超级计算机会更加强大,我们的生活也会随之改变。