NVIDIA支持Arm CPU,这个圈子又开始乱了
扫描二维码
随时随地手机看文章
在昨日举行的ISC 2019国际超算大会上,全球超算500强出炉,中国超算失榜首但在数量上以219台蝉联第一,远超过美国116台,而美国Summit以20亿亿次运算速度暂夺世界超级计算机领域的头把交椅,据悉,这台超级计算机搭载的近28000块NVIDIA GPU提供了95%的计算力。
现如今,超级计算机领域已开始向百万兆级计算规模进击。美国目前在建的Aurora及Frontier中包括加速器等主要硬件分别由Intel及AMD提供。NVIDIA也不甘缺席,在本届超算大会上宣布,将利用其芯片与Arm的处理器打造超级计算机,进一步推动英伟达开发用于气候变化预测和核武器建模的系统。NVIDIA支持Arm CPU,或为高性能计算行业构建节能、支持AI的百万兆级超算开辟全新途径。
Arm具备足够实力进击Exascale超算领域
英国Arm公司是全球领先的半导体知识产权(IP)供应商, 于2016年被日本软银集团(SoftBank)以234亿英镑(约合310亿美元)高价收购,该公司为大多数手机芯片提供底层处理器技术。
但Arm处理器与英特尔或IBM芯片的不同之处在于,Arm本身并不制造芯片。相反,它将底层技术授权出去,这样其他人就可以自主制造芯片。华为、苹果、三星、高通、飞利浦等各大芯片厂商们都从Arm那里购买授权,全球超90%的智能设备均采用Arm架构,包括手机、平板、手表、电视、无人机等。
在超大规模数据中心和高性能计算的服务器市场,英特尔x86处理器长期占据主导地位, 随着Arm处理器的崛起,传统x86 CPU市场面临着巨大的威胁。
经过多年发展,很多面向高性能计算的应用及AI框架也支持了Arm指令集架构,同时目前Arm内核的性能也大幅提高。和其他架构相比,Arm的一大特色在于出色的能效,它能够为超级计算机提供开放式架构,因此用户可以添加各种有益于超级计算的技术,例如紧密集成。
一直以来,Arm都在寻求机会将其处理器扩展至高性能计算领域。2016年8月宣布将与日本富士通公司合作,开发一个以64位ARMv8-A驱动的Post K超级计算机;同年12月宣布收购Allinea Software公司,后者主要为超级计算机提供性能分析工具;2018年6月,美国能源部下属的桑迪亚国家实验室宣布建造基于Arm处理器的超算Astra,并于同年11月现身TOP500列表;于此同时,Cray在英国气象局交付了一台基于Arm的超级计算机Isambard;而且日本的下一代超级计算机Post-K也同样基于Arm架构。
就美国超级计算机Astra为什么选择Arm,制造方惠普称“Arm服务器在功耗方面更加经济,可以打包的更加紧密,且惠普青睐该平台的内存性能。”
而且如中国的飞腾等公司已经使用ARMv8指令集设计出了FT-2000+/64处理器,Arm加入Exascale超算领域其实力已然足够。
据悉,全球众多涉及超级计算的项目或单位都在寻求Arm的加入,包括欧洲处理器计划(European Processor Initiative)、日本先进情报项目中心 (RIKEN)、美国能源部的先锋项目(DOE Vanguard project)等。
NVIDIA将支持Arm CPU打造超级计算机
长期以来,NVIDIA始终以为PC提供图形芯片而闻名,以使视频游戏看起来更逼真。近些年来NVIDIA在AI新兴领域投入巨大,其CUDA加速计算实力不可小觑,因而日益成长为数据中心市场的佼佼者。
NVIDIA的CUDA GPU芯片被用于与英特尔、IBM等公司的中央处理器(CPU)协同工作,完成大规模并行计算的加速任务。昨日发布的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。
而实现这些的关键因素在于:采用NVIDIAGPU的超级计算机能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上;NVIDIA与Mellanox合作优化整体超级计算集群的处理;以及NVIDIA发明的SXM3D封装和可实现极密集型扩展节点的NVIDIA NVLink互连技术。
据了解,NVIDIA与Arm有10年的合作基础,此前,NVIDIA几款用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品都采用了Arm。对于此次双方推进在在超算领域的合作,NVIDIA解决方案架构与工程团队副总裁Marc Hamilton表示,NVIDIA和Arm已为这个计划准备了两年左右,现在是最佳的发布时机。
尽管英伟达加速计算部门副总裁伊恩·巴克(Ian Buck)表示,从技术角度看,建造配有Arm处理器的超级计算机将是一个“严峻的考验”。但他坦言,英伟达之所以这么做,是因为欧洲和日本的研究人员希望利用Arm的技术开发超级计算芯片,这实际上为他们提供了超越IBM和英特尔的第三种选择,他们可以在这方面拥有更多控制权。
谈及Arm的技术时,巴克表示,“这种开放性使得Arm的技术非常有吸引力,它能够为超级计算提供一个开放式架构,这也是我们宣布支持Arm的原因。”
据悉,NVIDIA将于今年年底前向Arm生态系统提供全堆栈的AI、HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,比如支持OpenACC的PGI编译器和性能分析器。
堆栈优化完成后,NVIDIA将为所有主要CPU架构提供加速,至此,NVIDIA将完成了在x86、POWER(OpenPower)及Arm多种处理器指令集体系结构上构建超算。对于Arm而言,通过将NVIDIA软件栈引入Arm生态系统,将进一步助推其在HPC服务器市场的创新。
NVIDIA创始人兼首席执行官黄仁勋表示:“NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百万兆级。”
对于NVIDIA CUDA架构向Arm的开放,超级计算中心、系统提供商和系统级芯片制造商,包括Ampere Computing、Cray、CSC、EPI、HPE、Julich、Marvell、Mellanox、日本物理化学研究所计算科学研究中心等,均认为该举有利于解决HPC行业日益不可持续的功耗水平问题。
作为促进科学发现的重要工具,超级计算机已挺进“百万兆级”。在这个赛道上,如今又迎来了一位新的重量级选手。NVIDIA 能否将 CUDA和Arm的软件生态无缝衔接, 为高性能计算行业构建节能、支持AI的百万兆级超算开辟全新途径,值得观望。