英特尔高性能计算技术助力中国科研教育网格二期建设
扫描二维码
随时随地手机看文章
走向全新发展阶段的ChinaGrid
中国教育科研网格(ChinaGrid)是教育部“十五”211工程公共服务体系“CERNET高速地区网和重点学科信息服务体系建设”的重大专项,同样也是国家高技术研究发展计划(863项目)资助的项目。它的目标是要将中国国家教育科研网(CERNET)和国内各大高校的海量计算资源和信息资源通过先进的网格技术集成起来,形成一个可提供高性能计算和信息服务、以辅助教学和科研的在线平台。
自2002年开展一期建设到2010年,ChinaGrid已经建成了覆盖全国13个省市、20所高校的网格环境,聚合计算能力和存储能力已分别达到16万亿次和180TB,是目前全球最大的基于高校资源构建的网格环境。在此基础上,ChinaGrid还第一期成功开发和部署了五类应用网格:生物信息学、图像处理、计算流体力学、海量信息处理、大学课程在线。
就在第一期建设取得了阶段性成果之际,2011年3月国家发展改革委又批准了中国教育科研网格二期建设项目科研报告。ChinaGrid二期项目建设任务由华中科技大学等42所高等学校承担,建设内容主要包括网格资源建设、重点学科网格平台与典型应用建设和公共支撑平台建设。
来自英特尔等IT厂商的倾力支持
ChinaGrid的建设不但牵动着中国教育和科研行业内部人士的关注,也一直是以英特尔公司为代表的、引领着高性能计算技术商业化和普及化的IT厂商们全力支持的对象。它们不但携手合作伙伴为ChinaGrid第一期中参与的高校提供了最适于它们应用环境和特征的高性能计算产品及技术,还提供了很多涉及高校高性能计算人才培养与应用优化的支持。
以英特尔公司为例,为帮助ChinaGrid参建高校发掘其高性能计算系统的性能潜力,并加速相关技术和应用的研发,它就曾特意将网格计算列为“英特尔大学合作计划”在国内的重点合作领域之一,不但通过研究资助及提供适当的软件平台,直接参与了CGSP平台的开发和改进,还与ChinaGrid一期建设时间同步,即从2003年初至2005年底累计为16所国内高校的20个与网格相关的研究项目提供了资助。
此外,英特尔还通过资助课程开发和引进国外先进课程等方式,帮助国内高校开发了与网格和高性能计算相关的课程课件;通过赞助和协办全国性高性能计算技术竞赛,如英特尔高性能计算应用与优化大赛,带动了网格和高性能计算技术相关人才的培养;通过举办网格与高性能计算学术研讨会,特别是邀请公司内部来自全球各地的高级技术专家来中国分享经验和最新技术进展,迅速提升了国内高校对网格和高性能计算技术的研究和应用水平。
ChinaGrid二期与百亿亿次时代
既往持续、倾力的支持让英特尔公司在ChinaGrid的发展历程上留下了浓墨重彩的一笔,而面对ChinaGrid第二期的建设,英特尔则认识到了更为艰巨的挑战,因为在2011年-2020年这一个新的十年期,高性能计算在现实应用需求激增的推动下,必将出现更为快速的发展,以应对那些对性能要求更为苛刻的应用,包括管理互联网共享数据的爆炸性增长、寻求应对气候变化的解决方案、管理不断增加的自然资源(如石油和天然气)开采成本等。高校和科研机构用于科研工作的科学计算类应用本来就是此前最消耗高性能计算资源的一类应用,在未来十年来自它们的性能需求压力只会更加水涨船高。
面对这些挑战,英特尔和很多合作伙伴都意识到了将高性能计算推向百亿亿次时代的紧迫性和必要性。所谓百亿亿次,就是指高性能计算机要实现每秒百亿亿次浮点计算(ExaFLOP/s)的性能水平,这相当于目前全球最快高性能计算机性能的百倍之多,英特尔希望在2011年-2020年这个十年期的末期实现这一目标。据英特尔预测: 2015年时,全球高性能计算机500强(TOP500)排行榜上排名第一的系统在性能上将有望达到每秒十亿亿次浮点计算,2018年时,它将越过每秒百亿亿次浮点计算的标杆,而到2011-2020这个十年期的末期时,地球上最快的计算机的性能则有望超过每秒4百亿亿次浮点计算。如此强大的计算能力,将为所有高性能计算应用的计算效率和精细度带来革命性的提升,从而使包括科学研究、石油勘探、新能源开发、工业设计、气象和自然灾害预测以及金融计算等在内的、需要使用强大计算力解决极为复杂问题的相关领域获得极大收益。
制胜百亿亿次计算时代的利器
遥望百亿亿次时代,可以说人们想象的应用场景越美妙,它们实现起来的难度就越高。而在所有挑战中,最首要的就是如何在可接受的能源消耗状况下实现这一性能目标。举例来说,今天中国最快的超级计算机——天河一号A(Tianhe-1A)如果要实现每秒百亿亿次浮点计算性能,就需要消耗1.6GW的电能,这相当于200万个普通家庭的用电量,因此会带来巨大的能效挑战。
面对这个难题,英特尔给出的创新方向是进一步提升现有处理器的性能和能效,并辅以专门针对高度并行计算应用开发和优化的创新计算技术。前者对于未来一段时间内的高性能计算需求,包括ChinaGrid二期建设的前期阶段是非常有意义的。英特尔将在这一阶段坚持提供不断优化的处理器平台。例如英特尔目前主打双路服务器(可用于构建高性能计算集群)和多路服务器(有助于实现超级节点)的至强? 5600处理器和至强? E7处理器分别比各自的上一代产品实现了高达60%和40%的性能提升,是各自市场领域中最具性能实力的产品,在这两款处理器之后,即将问世的新一代双路服务器平台——至强? E5处理器平台(代号为Romley)也将凭借全新Sandy Bridge微架构(支持高度弹性化的多核架构设计以及针对并行计算优化AVX高级矢量扩展指令集)、对于磁盘阵列和SAS先进存储技术以及板载万兆网卡的支持,为高性能计算系统的计算、存储和网络层面的性能和功能均带来显著提升。[!--empirenews.page--]
在处理器平台不断更新升级的同时,如果仅使用通用处理器来提升性能面对的功耗挑战越来越大,英特尔制胜百亿亿次计算时代的另一利器——针对高度并行计算任务开发的英特尔? 集成众核(Intel? Many Integrated Core,Intel MIC)架构就将发挥重要作用。
与其他IT厂商提供的类似产品或解决方案相比,英特尔? 集成众核(MIC)架构最强的优势就是基于已被业界广泛接受和应用的英特尔架构,因此其相关应用的开发和优化也沿用了用户们熟悉的编程模型和编程环境,这使得用户可以利用英特尔软件开发和优化工作的特别版本,在非常短的时间内将其现有的、运行在英特尔架构处理器平台上的高性能计算应用迁移到基于英特尔? 集成众核架构的产品上运行,并通过简单的优化就能获得可观的性能提升,而这将为用户带来的应用性能迅速增长和既往软件投资得以保全的双重收益。
真实应用负载理念指导系统构建与优化
汇集以上英特尔已经发布和即将推出的高性能计算产品技术,再加上整个产业界的智慧与努力、支持与帮助,高性能计算用户、包括ChinaGrid参与高校这样的科学计算用户在走向百亿亿次计算时代就拥有了更多的先机和胜算。不过,拥有了可构建更高性能计算系统的核心模块和能否真正按照自身应用需求构建出最适用于它们的系统还是有所不同的。其中的关键,就是用户能够根据自身应用负载的特征和需求构建和优化其高性能计算系统。
面对这一关键环节,英特尔则致力于倡导以真实应用负载理念来指导系统的构建与优化,这与曾经流行的单纯以个别基准测试软件,如Linpack测试成绩及其在高性能计算机排行榜上的名次来指导系统构建与优化迥然有异。英特尔认为:像Linpack、Stream、SPEC旗下用于测试处理器浮点和整数计算性能的基准测试更适用于发掘系统平台中单个组件,如处理器和内存的极限性能水平,但它却无法衡量出在一个真正的应用中,一个高性能计算系统中的所有组件是如何运行以及实现互相影响以实现最佳性能、能效、性价比和性能空间比的。
相对而言,惟有使用源自高性能计算应用开发商提供的或用户自行开发和优化的应用,并配合真实的负载,才能更为准确地发现被测试系统的真实表现,它是否符合真实应用的需求,并发现其进一步优化的方向,这种指导可以为用户带来更加合理的投资以及出色的投资回报。
英特尔支持ChinaGrid提升高校科研效率
通过提供包括最新至强? 处理器以及英特尔? 集成众核架构产品和与之相关的软件开发与优化工作,以及更多创新的高性能计算技术,英特尔公司由衷期望能够在未来十年引领整个产业界走向百亿亿次计算时代的同时,全力支持和帮助ChinaGrid第二期建设走向成功,以技术的力量破解其面临的挑战,进而加速中国高校的科研效率,实现与中国高性能计算产业及最终用户的持续共赢。