美国想凭Summit夺回超级计算机霸主地位
扫描二维码
随时随地手机看文章
美国谋求重新夺回超级计算机霸主地位;
IBM终于开始出货其独具风格的Power9处理器;
英伟达的Volta GPU将成为Summit和Sierra的主力计算单元。
美国欲凭借Summit超级计算机重回世界之巅
计算机领域的军备竞赛对国际关系和地缘政治的影响和其它任何常规军备竞赛一样重要。这是一场关于打造出全球最快的超级计算机的竞赛。拥有最快的超级计算机不仅仅关乎民族自豪感,它还具备货真价实的经济、政治和军事利益。超级计算机有诸多用武之地,不仅可以用于大范围地区的天气预报,还可以用于核武器的建模和设计。
目前,世界上最快的超级计算机是中国的神威·太湖之光,其运算能力能够达到惊人的93 PetaFLOPS,即每秒执行93×10 ^ 15次浮点运算。 2018年,美国计划在田纳西州的橡树岭国家实验室(ORNL)打造出超过神威·太湖之光的超级计算机。这台名为Summit的超级计算机的运算能力将达到200 PetaFLOPS,同时,加利福尼亚州的劳伦斯利弗莫尔国家实验室也正在建造一个设计上与Summit类似的姊妹计算机Sierra。
Summit由大约4600个“节点”组成,这些节点基本上都是机架式服务器。虽然Summit的计算能力将比其前任强大5-10倍,但它的节点只有前任的1/4,而且耗电量也大大降低。
这台超级计算机这么强悍,靠的是这些节点的特殊内在。每个节点都包含一个由IBM设计的专用HPC(高性能计算)服务器。 该节点包含两个IBM Power9处理器、六个英伟达的Tesla V100 SXM2 GPU加速器,而且整个盒子采用水冷设计,如文章顶部的硬件照片所示。该硬件最近曾在全球超算大会SC17上展出过。
IBM系统的独特之处在于,每个Power9处理器都通过英伟达专有的高速NVLink数字接口直接与英伟达的GPU通信。 这种内置功能是Power9独有的,可通过NVLink 2.0实现100 GB/秒的吞吐能力。
在实际工作中,由这些Power9处理器协调每个节点的计算流程,Tesla V100则负责繁重的计算工作。IBM将NVLink 2接口集成到芯片上这个设计决策表明它深谙高性能计算的发展方向。IBM并没有抗拒越来越流行使用GPU进行计算的趋势,而是明智地选择了它。
IBM终于开始出货其独具一格的Power9处理器
每颗Power9处理器本身就是一台功能强大的计算机,最多可包含24个处理器内核,每个内核可以并行执行四个线程,Power9支持96个线程的并行计算。此外,每颗Power9还支持48路PCIE 4.0通道和8个内存通道。
IBM的Power处理器系列基于PowerPC RISC架构,曾经用在苹果的Mac电脑上,当苹果公司改用英特尔的x86处理器后,IBM将重点放在了服务器市场上。
客户早就对Power9望眼欲穿,IBM去年发布了这颗芯片,人们普遍预计IBM将在2017年年底出货这颗芯片。根据目前得到的消息,Power9已经应用在Sierra和Summit上,但是IBM并没有公布Power9全面供货的信息,现在业界认为该芯片可能于2018年初上市销售。
Power9是一个庞大无比的芯片,这可能是它迟迟没有面世的原因。 Power9现在采用格罗方德的14纳米制程制造。它可能是格罗方德试图在其14纳米节点工艺上制造的最大的芯片,所以,如果产能和良率达不到IBM的预期,我一点都不会感到惊讶。同样影响产能和良率的一个因素是,Power9是一颗庞大而且复杂的高性能芯片。
英伟达Volta GPU将成为Summit和Sierra的主力计算单元
Summit和Sierra都将使用相似的搭载双Power9处理器的IBM HPC计算机,它们两个的主要区别在于Sierra每个节点只有四个Tesla V100 GPU,而Summit每个节点包含六个Tesla V100 SXM2 GPU。虽然GPU数量更少,但是这种设计方式可以实现CPU和GPU之间150 GB/秒的NVLink 2通信速度,从而提高吞吐能力。
Tesla V100中的每个GV100 GPU都比Power9更加庞大,正是因为每个V100都需要消耗300瓦的功率,才使用了昂贵的水冷解决方案。据预计,整个Summit的的功耗为13兆瓦,而拥有4000-5000个节点的Sierra的功耗为11兆瓦。就所有实际应用而言,Summit和Sierra的计算能力大小主要取决于Tesla V100 GPU的能力限制。
从美国这两款超级计算机可以一窥英伟达V100 GPU的市场机会。这两个系统将使用超过45,000个V100 GPU,美国能源部的一位客户表示,每颗V100 GPU的价格在8000美元左右,这两台超级计算机为Tesla V100贡献的销售额就超过了3.6亿美元。
IBM和英伟达很可能会成为全球超级计算领域的强势存在,并持续受益于永无休止的打造更快超级计算机的军备竞赛。