人工智能在数据中心系统中的应用介绍
扫描二维码
随时随地手机看文章
过去十年间,我们见证了中国在基础设施建设取得的辉煌成就,一项又一项基础建设项目令世界感叹,在全球留下了“基建狂魔”名号:
高铁总里程世界第一,大型发电站,南水北调工程,现代化桥梁,世界最长跨海大桥港珠澳大桥……
这几日,“新基建”一词迅速走红。国家层面召开会议,强调加快推进国家规划已明确的重大工程和基础设施建设,包括5G 网络、数据中心等新型基础设施的建设进度,“新型基础设施建设”(简称“新基建”)立时成为热词。
与传统的基建不同,“新基建”本质上是信息数字化的基础设施。过去中国的数字化基础设施经历了飞速成长、波澜壮阔的十年。
数据呈现出了爆炸式增长,数字化、信息化在十年间带动了巨大的社会和产业变革。“新基建”的提出,必将使数字化的基础设施的发展再度进入高级道。从中长期来看,中国企业上“云”、数字化转型、甚至“云原生”的趋势不可逆转。经此一“疫”,预计进度还将加快。
从产业发展的历史阶段和政策支持举措的双重角度来看,这都是对于科技端公司的重大利好。
事实上,这股风潮兴起之前,国内外的科技公司们早已在紧锣密鼓。几天前,谷歌宣布将在全球范围内新增4个数据中心,以确保其全球业务的增长。另称计划今年投入100亿美元扩建数据中心和办公规模。
数据中心是支撑一家公司业务高速运转的“心脏”,也是黑科技魅力直观可感的地方。如何把“新基建”中的这项数据中心搞好,是门大学问。
一、UPS,数据中心的“蓄电池”
随着越来越多企业上“云”,一些超大型数据中心迅速崛起。数据中心、计算中心的规模、数量在可预见的未来将会成倍增长,其IT设备数量、占地面积等投资成本也将随之飙升。
云计算和边缘计算,无法割裂开来。而IDC公布的数据显示,预测到2025年全球数据圈将扩展至163ZB,相当于2016年所产生16.1ZB数据的十倍。智能汽车、智能无人机、智能制造等新兴技术的发展,使得边缘计算同样非常重要。
为了减少网络传输所带来的延迟,IDC预测,这些数据中约有20%的数据将是实时数据,需要在边缘完成计算,无需发回到网络中心进行处理。这意味着,物联网时代,小型或者微型的数据中心将会越来越多,来加强边缘计算和数据分析的能力。
5G时代的数据中心,正在向超大型云计算中心和边缘数据中心的两级发展。未来的数据中心,在数量和体积上将呈现两方面趋势:云数据中心,大愈大,效率驱动;而边缘数据中心,小愈多,由体验驱动。
由此,对于数据中心的高效管理将成为一个大问题。传统的数据中心,最基础是要对安全性、可靠性进行保障。确保数据中心的供电稳定,是重中之重。
数据中心停电意味着什么?
2017年5月27日CBRE数据中心的停电事故,因为CBRE数据中心停电事故的发生,英国航空公司的预订、办理登机手续系统、呼叫中心和移动应用程序受影响而无法使用,导致英国航空公司672个航班被取消,75000名乘客的航班被取消或延迟,预计损失超过1亿英镑。
2019年9月,AWS的一个数据中心再出断电事故,丢失数据超过1TB,且相关数据不可恢复。
对于数据中心来说,在电力系统的运行过程中,不可避免地会出现故障。尽管故障出现的几率很小,持续的时间也不长,但产生的后果却往往十分严重。所以UPS系统的应用对于数据机房电力系统不间断运行来说尤为重要。
可能很多人不知道UPS不间断电源是什么?我们的日常生活中比较少见。UPS电源是不间断电源,功能类似于一个蓄电池。比如我们的电脑连接上了UPS电源,当遇到突然停电的情况,电脑就会自动切换到UPS供电,以保证电脑上的数据不丢失。这对于数据中心道理则相同。
数据中心机房的能耗大户是服务器、数据存储器等数据处理设备,数据设备的用电量大,就需要更多的UPS电源来供电,UPS电源在电能转换中需耗费一定的能量。能源环保,节能节电,稳定可靠,始终是数据中心不可回避的问题。
同时,在数据中心宝贵的使用面积中,如何最大程度地提升使用效益、减少基础设施占地面积,也为行业所关注。
二、超高密“开源节流”
伴随IT算力持续演进,CPU和服务器功率持续提升,数据中心必将向高密化发展。在2020年,大型数据中心占比将达40%,复合增长率超过45%。
既想保证供电稳定,又要实现能耗低、占地面积减少,对UPS不间断电源的创新需求就显得很迫切。作为数据中心的动力源泉,UPS供配电系统不仅存在很大的发展空间。UPS相当于数据中心的“蓄电池”,以保证数据的安全、业务的正常运转。
前不久,华为给数据中心这个各家公司的“AI心脏”做了个“改良手术”,面向全球发布全新UPS功率模块,更高功率密度助力数据中心“开源节流”,实现了UPS电源三方面的跨时代意义,是UPS领域的一项大进展。
1、更小体积
此次华为公布的单模块功率密度达到100kW/3U,较业界主流水准提升了1倍。
通过高密化的设计,FusionPower 2.0数据中心供配电解决方案1200kVA的系统只需12个功率模块,实现“一柜一兆瓦”,考虑UPS输入输出配电,端到端系统方案从8柜降低为4柜,节省占地超过50%。
对于ISP行业,更多的业务空间意味着更高的收入,以部署10套1200kVA的华为FusionPower2.0系统为例,可节约40柜位空间,每年帮助ISP客户增加400万元人民币的收入。
2、更低热耗
华为整机效率高达97%,效率高,热耗小。采用三电平+交错并联拓扑架构降损耗,三电平拓扑IGBT、二极管和电感两端电压只有两电平的一半,同时,耐压低的IGBT和二极管具有更低的开关损耗和导通损耗。而交错并联技术进一步降低损耗。
同时,华为还采用先进器件优化及数字控制技术降损耗。
3、更强散热
2012热实验室多物理场仿真平台打造最佳散热设计,多物理场仿真平台,精度较业界水平高30%。系统和部件极致设计及布局也可实现超强散热能力,“海洋式”温度采样与数据运算,多点无死角调控散热。
关于超高密UPS模块技术以及华为跨代UPS-FusionPower系列产品的具体参数,可关注华为接下来举办的技术解密会。
近年来,华为在UPS市场的表现可圈可点,全球市场份额快速上升,而且连续多年成为国内核心运营商不间断电源的首选供应商。
从2012年开始,华为推模块化UPS,随着锂电这个风口的来临,华为又推出了智能锂电解决方案。同时在智能化上深耕,采用更多的AI技术,采取主动的AI预测性维护,提升系统可靠性。
三、AI反哺
在数据中心未来的发展趋势看, AI技术的反哺是必不可少的一环。未来IT负载将超过80%为AI负载,单位体积的负载密度持续增加,供电的高密能够有效匹配负载密度的增加,为数据中心减少供电的占地,提升出柜率。
而不论是AI技术的介入,还是数据中心的集群化发展,都与数据中心绿色、节能发展方向相关。
AI接下来在数据中心的一个想象力可能是提升整个制冷系统的智能化程度。目前通常整个机房的制冷都基于统一的制冷或散热的设备,不能做到单体控制。
即使对机房、供电等部分单独供冷,也很难做到保证每一个单元都运行在最优温度区间内。智能化的制冷系统将根据每个单元的需求,自行调节供冷功率,最大化的降低损耗。
Facebook曾使用外部的冷空气流通,微软探索试验过水下数据中心。2018年,谷歌通过使用人工智能来帮助数据中心冷却和保持高效。DeepMind的机器学习算法在谷歌数据中心的应用,在不影响服务器性能的情况下,将用于冷却的能量减少了40%。
此外,AI还可利用预测分析优化工作负载分配,对于声音图像及气味的识别,关键节点温度AI的预测,零件寿命的AI预测等,同时还可以利用AI技术实现节能。
通常数据中心用电是有波动的,服务器存在闲时忙时,波峰波谷。为了提高服务器及机房的利用率,通过AI技术预测对在线业务需求进行预测,通过在线业务及离线业务混布,闲时调度更多离线业务,跑离线计算、训练模型。
此外,在偌大的数据中心园区,机器人巡检、人脸识别门禁系统等也将落地,大大方便数据中心的运维、管理。
乘着“新基建”的东风,在数据中心这个复杂的系统工程中,为着一次次精进、改良,华为们卯足了劲头。