NVIDIA支持Arm CPU，这个圈子又开始乱了

时间：2019-06-19 15:40:40

关键字： AMD CPU GPU 行业资讯

手机看文章

扫描二维码
随时随地手机看文章

[导读]在昨日举行的ISC 2019国际超算大会上，全球超算500强出炉，中国超算失榜首但在数量上以219台蝉联第一，远超过美国116台，而美国Summit以20亿亿次运算速度暂夺世界超级计算机领域的头把交椅，据悉，这台超级计算机搭载的近28000块NVIDIA GPU提供了95%的计算力。

在昨日举行的ISC 2019国际超算大会上，全球超算500强出炉，中国超算失榜首但在数量上以219台蝉联第一，远超过美国116台，而美国Summit以20亿亿次运算速度暂夺世界超级计算机领域的头把交椅，据悉，这台超级计算机搭载的近28000块NVIDIA GPU提供了95%的计算力。

现如今，超级计算机领域已开始向百万兆级计算规模进击。美国目前在建的Aurora及Frontier中包括加速器等主要硬件分别由Intel及AMD提供。NVIDIA也不甘缺席，在本届超算大会上宣布，将利用其芯片与Arm的处理器打造超级计算机，进一步推动英伟达开发用于气候变化预测和核武器建模的系统。NVIDIA支持Arm CPU，或为高性能计算行业构建节能、支持AI的百万兆级超算开辟全新途径。

Arm具备足够实力进击Exascale超算领域

英国Arm公司是全球领先的半导体知识产权(IP)供应商，于2016年被日本软银集团(SoftBank)以234亿英镑(约合310亿美元)高价收购，该公司为大多数手机芯片提供底层处理器技术。

但Arm处理器与英特尔或IBM芯片的不同之处在于，Arm本身并不制造芯片。相反，它将底层技术授权出去，这样其他人就可以自主制造芯片。华为、苹果、三星、高通、飞利浦等各大芯片厂商们都从Arm那里购买授权，全球超90%的智能设备均采用Arm架构，包括手机、平板、手表、电视、无人机等。

在超大规模数据中心和高性能计算的服务器市场，英特尔x86处理器长期占据主导地位, 随着Arm处理器的崛起，传统x86 CPU市场面临着巨大的威胁。

经过多年发展，很多面向高性能计算的应用及AI框架也支持了Arm指令集架构，同时目前Arm内核的性能也大幅提高。和其他架构相比，Arm的一大特色在于出色的能效，它能够为超级计算机提供开放式架构，因此用户可以添加各种有益于超级计算的技术，例如紧密集成。

一直以来，Arm都在寻求机会将其处理器扩展至高性能计算领域。2016年8月宣布将与日本富士通公司合作，开发一个以64位ARMv8-A驱动的Post K超级计算机;同年12月宣布收购Allinea Software公司，后者主要为超级计算机提供性能分析工具;2018年6月，美国能源部下属的桑迪亚国家实验室宣布建造基于Arm处理器的超算Astra，并于同年11月现身TOP500列表;于此同时，Cray在英国气象局交付了一台基于Arm的超级计算机Isambard;而且日本的下一代超级计算机Post-K也同样基于Arm架构。

就美国超级计算机Astra为什么选择Arm，制造方惠普称“Arm服务器在功耗方面更加经济，可以打包的更加紧密，且惠普青睐该平台的内存性能。”

而且如中国的飞腾等公司已经使用ARMv8指令集设计出了FT-2000+/64处理器，Arm加入Exascale超算领域其实力已然足够。

据悉，全球众多涉及超级计算的项目或单位都在寻求Arm的加入，包括欧洲处理器计划(European Processor Initiative)、日本先进情报项目中心 (RIKEN)、美国能源部的先锋项目(DOE Vanguard project)等。

NVIDIA将支持Arm CPU打造超级计算机

长期以来，NVIDIA始终以为PC提供图形芯片而闻名，以使视频游戏看起来更逼真。近些年来NVIDIA在AI新兴领域投入巨大，其CUDA加速计算实力不可小觑，因而日益成长为数据中心市场的佼佼者。

NVIDIA的CUDA GPU芯片被用于与英特尔、IBM等公司的中央处理器(CPU)协同工作，完成大规模并行计算的加速任务。昨日发布的Green500排行榜，在全球最节能的25款超级计算机中，有22款都得益于NVIDIA的支持。

而实现这些的关键因素在于：采用NVIDIAGPU的超级计算机能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上;NVIDIA与Mellanox合作优化整体超级计算集群的处理;以及NVIDIA发明的SXM3D封装和可实现极密集型扩展节点的NVIDIA NVLink互连技术。

据了解，NVIDIA与Arm有10年的合作基础，此前，NVIDIA几款用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品都采用了Arm。对于此次双方推进在在超算领域的合作，NVIDIA解决方案架构与工程团队副总裁Marc Hamilton表示，NVIDIA和Arm已为这个计划准备了两年左右，现在是最佳的发布时机。

尽管英伟达加速计算部门副总裁伊恩·巴克(Ian Buck)表示，从技术角度看，建造配有Arm处理器的超级计算机将是一个“严峻的考验”。但他坦言，英伟达之所以这么做，是因为欧洲和日本的研究人员希望利用Arm的技术开发超级计算芯片，这实际上为他们提供了超越IBM和英特尔的第三种选择，他们可以在这方面拥有更多控制权。

谈及Arm的技术时，巴克表示，“这种开放性使得Arm的技术非常有吸引力，它能够为超级计算提供一个开放式架构，这也是我们宣布支持Arm的原因。”

据悉，NVIDIA将于今年年底前向Arm生态系统提供全堆栈的AI、HPC软件，该堆栈为600多个HPC应用程序和所有AI框架提供加速，其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具，比如支持OpenACC的PGI编译器和性能分析器。

堆栈优化完成后，NVIDIA将为所有主要CPU架构提供加速，至此，NVIDIA将完成了在x86、POWER(OpenPower)及Arm多种处理器指令集体系结构上构建超算。对于Arm而言，通过将NVIDIA软件栈引入Arm生态系统，将进一步助推其在HPC服务器市场的创新。

NVIDIA创始人兼首席执行官黄仁勋表示：“NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合，将助力HPC社区实现大幅提升，以达到百万兆级。”

对于NVIDIA CUDA架构向Arm的开放，超级计算中心、系统提供商和系统级芯片制造商，包括Ampere Computing、Cray、CSC、EPI、HPE、Julich、Marvell、Mellanox、日本物理化学研究所计算科学研究中心等，均认为该举有利于解决HPC行业日益不可持续的功耗水平问题。

作为促进科学发现的重要工具，超级计算机已挺进“百万兆级”。在这个赛道上，如今又迎来了一位新的重量级选手。NVIDIA 能否将 CUDA和Arm的软件生态无缝衔接, 为高性能计算行业构建节能、支持AI的百万兆级超算开辟全新途径，值得观望。