“天河2号”详解:中国超级计算机再夺世界第一
扫描二维码
随时随地手机看文章
在德国莱比锡举行的2013年国际超级计算大会上,第41期全球超级计算机500强排行榜今天正式公布,中国的天河2号(Tianhe-2)成功登顶。这也是继2010年11月的天河1A夺魁之后,中国重返超算性能世界第一!(不过天河1A这次再次下滑两名,排到了第十)
曾在5月份参观了天河2号系统的TOP500编辑Jack Dongarra表示,这套系统值得人们尊重。他说:“这套系统的大部分功能都是中国研发的,只使用了Intel作为主计算部分。互连网络、操作系统、前端处理器、软件都是中国自己的。”
天河2号由国防科技大学研发,正在广州国家超级计算中心进行部署,为华南地区的教育和研究机构提供高性能计算服务。
它由1.6万个浪潮节点组成,每个节点有两颗Ive Bridge-E Xeon E5-2692 2.2GHz 12核心处理器、三块Xeon Phi 31S1P 57核心协处理计算卡,总计3.2万颗处理器、4.8万个计算卡,总的计算核心数量为312万个。
此外还有4096个FT-1500前端处理器,这是国防科技大学为天河1号研发的,SPARC V9架构,16核心,40nm下频率可达1.8GHz,功耗65W。
性能方面,Linpack峰值浮点计算能力为54902.4TFlops(54.9PFlops),也就是每秒钟5.49亿亿次,而最大计算能力为33862.7TFlops,亦即接近3.4亿亿次每秒。(E5-2692单颗浮点性能0.2112TFlops、Phi 31S1P单块浮点性能1.003TFlops)
这套超算还有1PB系统内存(每节点64GB)、12.4PB外部存储、TH Express-2专用高速互连网络(13台交换机/每台576个端口/NRC AISC控制器),操作系统是国产的麒麟Linux,编译器icc,数学库Intel MKL-11.0.0,MPI并行编程采用MPICH2加定制GLEX通道。
整套系统功耗为17808千瓦,虽然很高,但因为性能也非常突出,能耗比达到了1.9GFlops/W(19亿次计算每秒每瓦特),也算是属于世界先进行列了。半年前最绿色的超算能耗比为2.5GFlops/W,上次性能第一的Titan(泰坦)能耗比为2.1GFlops/W。
说起Titan,推土机Opteron、开普勒Tesla组建的它这半年来没发生任何变化,最大性能还是1.76PFlops,沦落到第二名。从性能上对比,天河2号相当于几乎两套Titan。
一年前的冠军“红杉”(Sequoia)现在排第三,峰值性能没变,但是最大性能从16.32PFlops提高到了17.1732PFlops,看起来是对执行效率进行了优化,深入挖掘了计算潜力,值得学习。
日本“京”是一年半前的头名,现在位列第四,本身没有任何变化。
第五名“Mira”也是老面孔,但是和红杉一样提高了最大性能,现在有8.5866PFlops,比之前高了5.2%。
再往后的“惊跑”(Stampede)也不是新来的,但排名比半年前高了一位。它和天河2号一样是Xeon、Xeon Phi的搭配组合,但是这半年来又增加了不少协处理计算单元,核心数量增加1.57倍而有462462个,最大性能几乎翻了一番,目前为5.17PFlops。
除了天河2号,另外惟一一个进入TOP10的是美国国防部、国家核安全局、劳伦斯利弗莫国家实验室的“Vulcan”(火神),基于IBM蓝色基因/Q,采用Power BQC 1.6GHz 16核心处理器,峰值性能4.3PFlops。半年前还位列第65。
前十名中美国占了半壁江山,中国、德国各有两套,日本一套。第11名的“Pangea”是第一次出现在排行榜上,来自法国,SGI Altix X系统,Intel Xeon E5-2680八核处理器,110400个核心,最大性能2.566PFlops。
本届排行榜其它要点:
1、已经有26套系统的最大性能迈入了PFlops(每秒千万亿次)级别,半年增加3套。
2、第一名天河2号、第六名Stampede都使用了Intel Xeon Phi协处理器,证明了这种架构的巨大潜力。第二名Titan、第十名天河1A都使用了NVIDIA Tesla加速卡。
3、总共有54套系统使用了加速器/协处理器(NVIDIA Tesla 39套、AMD Radeon 3套、Intel Xeon Phi 7套),比半年前少了8套,这似乎也是第一次出现倒退,证明传统CPU仍然是高性能计算的绝对主力。
4、中国上榜超算66套,之前两次分别为72套、68套,基本保持稳定,而且始终仅次于美国位列世界第二(日本30套/-2)。有了天河2,中国不但在数量上,性能上也超越日本,成为世界第二。
5、Intel处理器还是绝对主流,份额高达80.4%。
6、88%的系统所用处理器拥有六个或更多核心,67%的不少于八核心。
7、IBM蓝色基因/Q依旧是最抢手的集群,第3、5、7、8名都是基于它的。
8、500强门槛现在达到了96.6TFlops,比半年前的76.5TFlops猛增了26.3%。
9、现在的最后一名半年前还能排322。换句话说,上次的500强里有178套都被“淘汰”了,只不过前十名波澜不够大。
10、500套系统总性能223PFlops,比半年前的162PFlops增长了37.6%,比一年前的123PFlops则增长了81.3%。天河2一套就占了总性能的24.6%,几乎五分之一啊!
11、美国252套占了一半还多,比上次有多了2套。欧洲112套,比上次增加7套,还是不如亚洲119套(少了4套)。
12、英国、法国、德国分别有29、23、19套。
完整榜单(Excel):
http://s.top500.org/static/lists/2013/06/TOP500_201306.xls
完整榜单(XML):
http://s.top500.org/static/lists/xml/TOP500_201306_all.xml
以下图片来自eNet: