为TCO和PUE而生:英特尔HTA数据中心战略全解析
扫描二维码
随时随地手机看文章
将空调和UPS从数据中心中搬离出去,这真是一个疯狂的决定,会使很多运营工程师和高管们坐立不安;但这又是一个很明智的决定,因为这会省下大笔的购置和运营成本,显著降低数据中心的PUE和TCO。
有没有一个更好的办法,既要工程师们安心享受惬意的周末时光,又要精明的老板们减少开支,当然还要符合国家节能减排的大政策环境。老实说,现在还没有一个简单可行的操作方案。不过,有些厂商已经开始尝试着往这个方面走,并且推出了不少解决方案。
作为数据中心行业内的最底层解决方案供应商,英特尔也一直在这方面进行尝试。比如允许服务器工作在更高温度环境中,改变服务器的供电方式和电池备份,加强对数据中心IT基础设施的监控能力,做到应用负载与能耗的相匹配,提高IT设备的使用效率。
在这所有的方案中,高温数据中心是特别值得研究的,因为这是釜底抽薪的招数。从现在数据中心的整体能耗组成比例中,IT基础设施、环境制冷和UPS是三块最大的开支。而制冷则是遵守能量守恒定律,主要是为了解决IT设备在运行中产生的热量,而UPS则是为了保证IT设备的工作连续性。
接下来,就让我们来详细了解一下英特尔所推出的HTA数据中心。HTA是High Ambient Temperatures的缩写,中文直译是高环境温度。英特尔希望通过通过提升数据中心工作温度,减少冷却系统的能源消耗,最大化的节约能源,并且降低整体数据中心的PUE。
HTA并不是一套完完全全的新技术,而是一个多种技术的组合式解决方案。从单一晶体管到与处理器、服务器平台、数据中心、以及输配电网络,它已发展出一整套技术。
首先是数据中心气流组织,英特尔采用了目前流行的冷热通道隔离技术。目前,仍然有部分数据中心在机柜放置方面不是很合理,这就造成了机房中局部热点的出现;同时,冷热通道混杂也提高了机房整体温度环境,而机房级的制冷则需要消耗更多的能源。
其次是自然冷源的引入,通过引入自然环境的冷空气来为IT设备降温。比如,谷歌将规模庞大的数据中心建设在靠近北极圈的北欧地区,就是为了引入自然冷源。通常业界认为,自然冷源属于上帝的恩赐,只能在高纬度地区才可能应用;但英特尔的研究发现,即使是在中低纬度地区,在昼夜温差较大的情况下,依然可以通过引入自然冷源来进行降温。
第三是引入英特尔所推出的Node Manager以及Data Center Manager等管理软件,这些软件可以监控每一台服务器功耗,并且给出精确和详尽的报告;同时,为了保证业务连续性,当数据中心市电中断时,根据业务情况,能够通过降低功耗的手段来延长续航时间,保障企业业务受到最小的影响。而Power Thermal Aware Scheduling (PTAS) 技术可以帮助数据中心智能分析运算量、功耗和温度,通过分析各个服务器负载情况,将运算量在不同机柜上进行调度,来尽量杜绝局部热点的出现。
第四,英特尔还为用户提供了Battery Backup Solution解决方案,这套方案能够为数据中心提供电池备份,这样可以省去UPS的一笔不少开支,同时也是确保业务连续性的有效手段。其工作原理与UPS基本一致,也就是在市电中断一直到备用油机全部加载之间,有效保护业务连续性。
第五,也是整体解决方案中最为关键的一环:通过使得服务器可以安全有效的工作在更高的温度环境下,比如说现在普遍的运行环境是18--21℃。如果将环境温度提升到25-27度,服务器和存储仍然能够保证工作,但随之而来的是巨大的能源节约。当然,这主要归功于英特尔在服务器领域内的主打产品至强系列芯片。从至强5600开始,更先进的制程工艺,更加智能的功率匹配,都可以有效帮助降低能耗。
毋庸置疑,HTA将会给用户带来多大的价值。但为什么目前依然是“曲高和寡”,因为用户的疑虑是非常明显的,HTA会不会降低可靠性和稳定性?
从服务器和数据中心的工作原理上来看,伴随着温度的升高,部分IT设备可靠性降低是必然的。所以,HTA数据中心并不是适合所有的应用场景,比如在追求极致性能的HPC领域。正如英特尔亚太区数据中心事业部雷科夫所说:“HTA数据中心更加适合那些对于性价比高度重视的用户,他们追求的不是极致性能,也不是绝对稳定可靠,而是最低的TCO。用户完全可以把在构建和运营HTA数据中心过程中节省的成本,用于购置更多的IT设备,通过增加设备冗余来提升可靠性。”
目前,主流服务器厂商都能够提供一些可以在高温环境下的相关产品,用户已经有了更多的选择。“接下来,英特尔将会和更多的ODM/OEM厂商进行合作,加快新产品的推出,也会通过ODCA等行业组织进行更多的推广和宣传。”
用户需要改变的是什么呢?认识,传统的认识,花费更少的成本,得到同样的稳定性和可靠性,何乐而不为呢?