浅谈数据中心界的Linux
扫描二维码
随时随地手机看文章
开放或封闭,它曾经是IT行业的焦点,Linus Torvalds出版的Linux以发展的力量改变了世界!
一、开放是IT行业不可阻挡的浪潮
1991年,芬兰大学生LinusTorvalds发布了Linux的第一版0.02,至今已有近30年的历史。在这快30年的时间里,Linux所搭建的开放生态迅猛生长。
根据2019年的相关统计:
全球TOP500超级计算机100%运行的是Linux。全球排名前25位的网站中有23个使用Linux。全球排名前100万的Web服务器中有96.3%在Linux上运行。全球90%的云基础架构都在Linux上运行。有54.1%的专业开发人员使用Linux作为平台。
另外,根据2018年的统计,安卓占据了移动操作系统市场的75.16%,所有智能手机中有85%基于Linux。
Linux的强大在于一直坚持开源开放,在这种思想的号召下,OpenStack、Kubernetes等软件的流行,无不显示出开源开放赋予IT产业的强大动力。软件领域的“车同轨、书同文、统一度量衡”也在影响着底层基础架构。在数据中心界,开放也成为加速产业发展的重要基石。
二、开放计算,数据中心界的Linux
一直以来,数据中心能耗,密度,绿色环保,基于业务的创新技术如AI、边缘的快速落地是困扰数据中心建设者的重要因素。其中,数据中心最不缺乏的就是创新。比如在能耗方面,Facebook的数据中心PUE最低降到了1.07,也就是说每消耗1.07度电,有1度完全是由服务器、存储、网络等IT设备消耗的。但技术从创新到大规模应用是很慢的,1.07只体现了Facebook的领先水平,同期中国数据中心PUE的平均值远超2.5。而随着数字化转型的加快,未来数据中心面对的挑战不止是能耗,还会更多。
因此,2011年,Facebook联合Intel、高盛等发起首个开放硬件组织,Open Compute Project(开放计算项目),旨在促进为行业制定开放的标准,让新颖技术、最佳实践能够在产业中共享,随后微软、谷歌、IBM、浪潮等也纷纷加入其中,共同应对未来数据中心的挑战。
2012年,阿里巴巴、腾讯、百度、中国移动、联通、电信、浪潮等发起成立ODCC(开放数据中心委员会)的前身天蝎组织,推动了中国基础设施标准化。
2016年底,LinkedIn又发起了OPEN19,只是OPEN19定义的是基于传统技术标准19英寸宽的整机柜服务器,与OCP和ODCC面向大型CSP数据中心不同,OPEN19适合于任何规模的数据中心。
之后,开放计算进展顺利,所有顶级互联网数据中心都已经大规模落地了开放计算服务器,通信、金融、能源等关键领域的TOP企业也纷纷加入这些开源组织并在数据中心建设中加以实践,开放计算似乎正在成为数据中心界的Linux。
三、机会总是留给有准备的人
机会总是留给有准备的人,我们不难发现开放计算组织中,那些积极推动建立数据中心标准,加快技术创新到产业生态的落地的早期成员,像谷歌,Facebook,微软,阿里,腾讯,百度,浪潮,也正是在云计算十年中脱颖而出的企业。在这些掌握产业核心技术、主导数据中心及基础架构及技术创新的企业中,浪潮是唯一同时加入OCP、ODCC、OPEN19全球三大开放组织的核心成员。
不久前,在2020年浪潮云数据中心合作伙伴大会(IPF2020)上,浪潮集团执行总裁、浪潮首席科学家王恩东首次提出“智算中心”,指出智算中心是智慧时代社会经济运行必不可少的基础设施,开放计算和AI是智算中心重要发展方向,其中开放计算更是构建智算中心的基石。
在随后浪潮集团高级副总裁彭震的演讲中,这样描绘智算中心:它就像一个大型电厂,基于开放计算的融合架构、AI等创新技术是构建电厂的关键技术;数据是电厂最重要的原材料,经过智算中心计算力加工后,就可以生成对外的智慧计算服务。浪潮智算中心的提出不仅为建设新一代算力基础设施指明了方向,也为开放的产业生态构建了一幅蓝图。
从Linux到开放计算,ICT产业开放的边界正变得越来越广阔。彭震表示:未来产业会面临越来越多的挑战,这些挑战依靠一个厂商解决不了,所以,全球的开发者会聚集在一起开发解决方案,然后把成果以开源方式分享给所有人,迅速上规模,形成生态。
浪潮将持续引领开放计算体系,打造智算中心基石,构建从模式开放到技术开放、从产品开放到服务开放的开放计算体系。
首先,模式开放,就是以客户场景为核心,与合作伙伴一起联合规划、协同设计、敏捷研发、快速交付。
其次,技术开放,无论是以液冷、循环利用为代表的冷却技术,还是以RISC-V、FPGA、CXL、智能网卡为代表的基础技术,坚持技术领先。
再次,产品开放,即以开放架构和开源为指导,基于先进的开放硬件架构,模块化、标准化构建MDC,并引领其发展方向。最后,基于先进的开源软件,打造标准、高效、敏捷的智算中心基础软件平台和统一管理平台,并最终形成开放的云数智一体化服务。
四、创新不断,征途不止
随着人工智能计算的指数级增长,目前全球已有上百家公司投入新型AI芯片的研发与设计,AI计算芯片多元化趋势愈发明显。但因为各厂商在AI开发中采用了不同的技术路线,导致芯片的接口、互联、协议上互不兼容,导致数据中心用户在AI计算基础设施建设中不得不面临硬件分裂化和生态割裂化的重大挑战。
IPF2020上,浪潮发布了全球首款AI开放加速系统MX1,符合OCP社区的OAI规范,可支持各类符合OAM规范的加速器,极大降低开发AI加速器技术门槛。
彭震表示:“浪潮致力于与业界领导者共同推进AI行业规范的建立,希望通过推动智算中心建设,形成开放共识的AI基础设施规范,促进AI芯片乃至AI产业的良性发展,这一愿景也与全球开放计算OCP社区形成高度共识。MX1作为智算中心在AI算力生产领域的首个开放标准产品,将有力的推动开放计算与人工智能的融合,加快多种AI芯片在智算中心落地,促进产业AI的生态繁荣。”
MX1可在同一AI服务器上支持多种符合OAM(OCP Accelerator Module)规范的AI芯片,并支持构建数量达32颗芯片的大型计算系统,实现超大规模神经网络模型并行计算。
具体来看,MX1支持高速互联技术,搭载高速互联AI芯片,当前支持互联带宽可达224Gbps,理论支持互联带宽最高可达896Gbps,可扩展构建高达32颗芯片的大型计算系统,实现超大规模神经网络模型并行计算,充分释放算力。
除了MX1,浪潮还参与贡献和开发了一系列开放计算产品和规范,贡献第一款通过ODCC认证的天蝎多节点服务器,首款面向云基础架构优化的2U四路服务器全球参考设计NF8260M5,第一款符合OTII标准的边缘计算服务器、开发OpenRMC标准等等。
参与开源组织,不断为基本技术和行业标准做出贡献以及与合作伙伴一起加速新技术的实施一直是浪潮推动数据中心发展的旗帜,如今已成为现实。许多传统企业已逐渐成为加快数字化转型的重要战略,随着开源组织团队的不断壮大,我们有理由相信,数据中心世界中的开放计算将成为Linux,并激发整个工业生态系统的增长。