IDC机房用UPS冗余供电系统的配置和设计
扫描二维码
随时随地手机看文章
摘要:衡量IDC机房的设计和配置水平高低的重要标志之一是,不但要看它的UPS冗余供电系统是否具有高可靠性、高抗干扰性、高抗自然灾害的能力及易“可管理性”,还要看它能否为IDC设备获得100%的高“可利用率”,创造出优良的电源运行环境。
关键词:互联网数据中心;多媒体数据中心;不间断电源冗余配置与设计
1选配具有优异“容错”功能的UPS冗余
供电系统
众所周知,互联网数据中心(IDC)和多媒体数据中心(MDC)是高速互联网的调控中心。用户对它们所承担的对信息资源(数据、语音和图象信息)的远程处理、存储和转送的“时效性”要求极高。那怕是仅几秒钟的“停机”均会给整个互联网的安全运行和用户的生产经营带来无法估量的损失。严重时,甚至会造成社会和经济生活的严重瘫痪。因此,IDC必须向用户提供365×24h连续不断的高速、安全和可靠的信息资源增值服务。为达此目的,从设计原则上讲,承担着向IDC机房供电任务的整个电源系统都必须采用具有高度“容错”功能的冗余式的供电方案,以确保无论是在市电电网出故障时或是在某台“双变换、在线式UPS电源"的逆变器发生故障时,还是在进行日常维护/检修操作时或因故致使保险丝烧毁/断路器开关“跳闸”时,互联设备均应由“在线式UPS”的逆变器电源来供电,而不应进入由普通的市电电源/应急备用发电机组经UPS的交流旁路来供电的状态。这是因为只有“在线式UPS”的逆变器电源才有可能向用户的负载提供同时具有稳压、无频率“突变”,无干扰和波形失真度极小的高质量正弦波电源。对于包括后备式UPS,在线互动式UPS在内的“非在线式UPS”来说,它们主要对输入电源的电压进行调整,对输入电压的频率波动,各种电源干扰和电压失真度并无“实质性”的改善。这就意味着,在整个供电系统中,不应存在单点“瓶颈”故障隐患。为此,应尽可能地配置具有高度“容错”功能的UPS冗余供电系统。也就是说,在这种UPS供电系统的运行中,即使遇到某些“部件”偶然发生“故障”时,整个UPS供电系统必须仍能正常工作。
根据当今UPS产业的技术发展水平,以选用具有“双总线输入”和“双总线输出”供电功能的UPS冗余供电系统为宜。它是由如下几部分供电系统所构成的。
1?1“双总线输入”冗余式的输入电源供电系统
由市电和备用发电机组所组成的双总线输入供电系统,它的基本配置为:由市电输入电源+备用发
电机组+“自动切换"控制柜+输入配电柜。自动切换控制系统时刻监视着各种输入电源的实时运行状态,并确保总是将其中最可靠的一路电源送到UPS的输入端。对于某些重要的IDC机房而言,其“应急发电机”电源实际上是一套由多台柴油发电机+发电机并机控制柜所组成的冗余式发电机供电系统。为确保后接的“N+1”型UPS冗余供电系统能绝对安全可靠地运行,必须高度重视位于上述冗余输入电源供电系统中的各种设备之间的“技术兼容性”和“切换参数”的正确设置。这是因为如果设备的选型和配置不合理或“切换参数”设置不当,就有可能造成后接的UPS供电系统“出故障”或出现对用户负载的瞬间“供电中断”的故障隐患。可举例说明此事。 1)由于某用户的“1+1”型UPS并机系统的输入供电系统的设计欠妥,在长达数年的运行中似乎一切“正常”。然而,当用户的输入变压器的高压侧因故出现“瞬间跳闸”故障时,引起UPS中的电池组也发生“爆炸起火”故障;
2)由于所选配的“1+1”型并机系统存在设计缺陷(价格低),某用户的“1+1”型UPS冗余并机系统,在输入电源供电中断又突然恢复正常供电时,或在同一电网上有人在作市电供电与备用发电机供电“互投切换”操作时,就会出现如下故障现象:
——出现了这套UPS供电系统长期处于对用户负载提供“交流旁路电源”供电的故障状态; ——其中的1台UPS的逆变器进入“自动关机”状态,其持续时间为3~10s左右;
——整套“1+1”UPS并机系统出现2~6s左右的“短暂停机”故障现象等。
在此说明的是,对于-48V通信电源而言,由于它们已采用双路三相交流电源供电体制及备有大容量的-48V电池组的缘故。一般是将这种冗余式的通讯电源的输入端直接连接到IDC的冗余式输入电源的输出端上,而无需将它们连接到“N+1”型UPS冗余并机供电系统上,从而达到节省投资的目的。
1?2高可靠性的“N+1”型UPS冗余供电系统
要想让互联网数据中心具有365×24h的“全天候”运行特性,对于向它提供电源的UPS产品的可靠性的要求是非常苛刻的。这是因为对于可靠性仅达99.999%的UPS产品来说,它在一年中可能造成的互联网的停机时间长达316s,即使将UPS产品的可靠性提高到99.999999%,在一年中可能造成的停机时间仍有320ms之长。对于IDC机房而言,如果真的发生长达320ms的停机故障,它会带来很大的损失。这是因为当前多数计算机所允许的瞬间供电中断时间为10~18ms。否则,就会造成用户的网控操作系统或运行软件遭到破坏。因此,要想让IDC机房真正具备能提供365×24h的连续不间断的运行特性,绝不是当今的UPS产业可提供的UPS单机所能达到的。迄今为止,我们只能制备出故障率越来越低的UPS产品。然而,还制造不出“故障率为零”的UPS产品。在当今的技术条件下,采用“N+1”型UPS冗余并机供电系统是消除单点“瓶颈”故障的最佳供电方案。它是在确保各台UPS单机的逆变器输出电压处于同幅度、同频率和同相位的条件下(出现在各种UPS单机之间的“环流”等于零),将“N+1”台具有相同输出功率的UPS单机置于并联输出状态来运行的供电系统。
为使UPS并机供电系统具有必要的“容错”功能,要求用户的最大负载量不应超过N台UPS单机的总输出功率。当UPS并机系统正常工作时,由“N+1”台UPS单机来平均分担负载电流。当某台UPS出故障时,发生故障的那台UPS通过执行“选择性跳闸”操作而自动脱机,此时,由剩下的N台UPS继续为用户提供高质量的逆变器电源。
大量的运行实践表明,随着位于UPS冗余系统中的UPS单机数量的增加,它不但会造成整套UPS冗余并机供电系统的可靠性逐渐地下降,而且还会导致整套UPS冗余并机系统的“输出功率的余量”也逐渐地减小(这意味着:UPS并机系统的抗输出过载能力也在逐渐地降低)。因此,从应用技术的角度看,用户应尽量地选用最可靠的“1+1”型或“2+1”型UPS冗余供电系统。为说明此问题,请参见表1。
表1某型号UPS多机冗余直接并机供电系统的可靠性并机方案1+12+13+14+15+16+1
系统输出功率“余量”/%1005033252016
系统与单机的MTBF之比5.54.12.92.11.30.98
从表1可知,对“1+1”型并机系统而言,其MTBF为单机的5.5倍。由此可见,采用冗余并机供电方案的确可使得整个供电系统的可靠性得到明显的改善。然而,过份地增多单机的数量会造成并机系统可靠性的“巨大牺牲”,而且“6+1”型并机系统的可靠性反而比单机的可靠性还低。
IDC机房用UPS冗余供电系统的配置和设计(1)
图2带负载同步控制器LBS和STS的双总线输出UPS冗余 [!--empirenews.page--]
供电系统(力博特的UPS电源产品)
图1经济型的双总线输入,双总线输出UPS冗余供电系统
表2互联网的“带宽”增值服务价格比较表网络速率/bit/s≤64k64~128k128~256k256~384k384~512k512~768k768~1024k1024k~2M
网络的相对使用费用11.31.82.43.34.56.17
网络速率/bit/s2M~4M4M~8M8M~10M10M~20M20M~34M34M~100M100M~200M
网络的相对使用费用91619305090150
1?3“双总线输出”型的UPS冗余输出配电系统
为了消除可能出现在UPS并机系统输出端与用户端之间的“单点瓶颈”故障隐患,有必要配置UPS的双总线输出配电系统。其基本配置是由“N+1”型UPS冗余供电系统(优选“1+1”或“2+1”型并机供电方案)+输出配电柜+负载自动切换开关(LTS)所组成的UPS输出供电系统。对于某些要求极高的的场所,还应配置由负载同步控制器(LBS)+两套“N+1”型UPS冗余供电系统所组成的具有极高“容错”功能的供电系统。鉴于目前在IDC机房中所用的服务器和磁盘阵列机等产品中有(30~50)%为采用“双电源输入供电”体制的产品,对于这些设备,可以直接将分别来自两套“N+1”型并机系统的电源连接到这种“双电源输入设备”的两个输入端上。对于采用“单电源输入供电”方式的关键负载,则是将分别来自两套“N+1”型并机系统的电源首先连接到“负载自动切换开关”(常见的是STS型的静态开关和SS型的快速切换开关)的两个输入端上,然后再将用户的关键设备连接到“负载自动切换开关”的输出端上。两种典型的双总线输入,双总线输出UPS冗余供电系统示于图1和图2中。
2选配具有高抗干扰性和优良EMC特性的
UPS冗余供电系统
采用该供电系统是为信息网络获得100%的高“可利用率”(IDC和MDC机房中的信息网络设备的“数据吞吐量”和“数据传输速率”均能达到这些设备的标称工作值)而创造优良的电源运行环境。大量的运行实践表明,UPS产品本身的电磁兼容(EMC)特性是否优良,UPS供电系统中可能出现的各种“干扰”能否被尽可能地减少,是决定互联网设备的“误码率”是否被降低和网络的“实际数据传输速率”是否能被提高的重要原因之一。如果上述问题处理不当,会造成本来可以高速运行的互联网络总是处于低速,小数据吞吐量的“降额使用”状态(它意味着互联网的实际“可利用率”极低),从而造成信息资源的巨大浪费。为说明这个问题,请见表2。
从表2可知,如果因供电系统的抗干扰性能不好,从而迫使互联网设备进入低速的“降额使用”状态的话,它不仅会使得大量的网络用户因“工作效率”下降而带来巨大的“隐形经济损失”。而且,还会导致“电信和网络运营商”的利润大幅度下降。
可举例说明电源“干扰”对互联网的“误码率”和“数据传送速度”可能带来的影响。例如,某用户因过
CIRRUSLOGIC设计中心在深圳成立
CirrusLogic公司(纳斯达克上市代号:CRUS)在深圳成立了一个新的电子设计及应用中心,扩大了其在音频/视频系统、个人录像机,特别是中国迅速增长的DVD市场等数字娱乐电子领域的全球领导地位。
该设计中心将为CirrusLogic在中国的大量消费电子客户提供支持,加强对该地区某些关键时频客户的支持,并将Cirrus业务扩大到全球增长最快的中国电子市场。
份地考虑价格问题而选用某种型号的UPS。在其局域网的运行过程中,偶然发现,如果将UPS的逆变器关机,让UPS进入由市电经交流旁路通道供电的状态时,则局域网的“数据包的传送速率”反而比用UPS逆变器供电时的“数据包传送率”还高的“反常”现象。造成这种“反常”现象的原因是,在这种UPS的输出中存在有严重的“调制干扰”的缘故。因此,在当今的互联网时代,考察一台UPS质量的高低时,不能只局限于它是否能确保不间断地向用户提供逆变器电源。这是因为,即使我们在选用这种型号的UPS产品时,表面上看起来,无论是UPS本身,还是互联网设备似乎都在“正常地”运行着,它们并没有造成互联网出现任何“停机”故障,然而,由于此时的互联网设备是处于“低数据传送速率”和“小数据吞吐量”的“低效运行”状态,也就是说,在此条件下,不能充分发挥互联网设备的技术潜力,其恶果是造成互联网的实际“可利用率”的急剧下降。
3选配同IDC的集中监控系统“兼容性”
好的UPS冗余供电系统
为了满足信息网络对IDC和MDC机房实现无人或少人值守管理和远程集中监控的需求,从而提高对UPS供电系统的“可管理性”,对互联网数据中心来说,除本身应配置对它的所有IT设备进行实时监控的网络管理系统之外,还应建立一套对“非IT设备”的集中监控体系,以便对诸如空调机、配电柜、电池组、发电机组、漏水警报、安全系统和消防系统等设备的运行情况进行实时的监控和分析。为此,要求所选用的UPS冗余供电系统应配置有如下通信接口:
1)在UPS上配置RS232/RS485接口,Modem或SNMP适配器;
2)用于显示UPS的工作状态/报警信息的“继电器干接点”型的输出通信接口;
3)“用户自定义”输入信号(门禁、烟雾、温度、湿度等报警信号)的“继电器干接点”型的输入通信接口;
4)对各种“非IT设备”配置必要的数据采集器;
5)配置相应的集中监控和管理软件包或通信协议。
利用上述的输入/输出通信接口和相应的电源管理软件或用户现有的网管集中监控系统,就可以组成所谓的智能化IDC和MDC机房的集中监控系统。在这样的网管系统中,可实现的主要调控功能有:
1)调阅在UPS的LED/LCD显示屏上所能观察到的UPS的实时运行参数(例如:输入/输出电压、电流、频率、有功功率/视在功率、功率因数及电池组的充放电电压/电流等参数);
2)“互联网数据中心”所用的各种“机房环境调控设备”的“运行大事记”(自各种设备开机以来,按时序排列的,曾出现过的故障/报警/用户所执行过的操作等信息);
3)万一发生故障时,执行网络广播报警(弹出报警窗口),电话或手机的自动拨号、自动传呼或发E-Mail等操作,以便通知值班人员及时到现场排除故障或维修;
4)对UPS的备用电池组执行可编程的电池容量“自测试”操作,如果发现电池的“实有容量(Ah)"偏低时,还应自动发出“电池需要更换”的预报警信号;
5)将“用户的自定义”报警信号(例如:温度/湿度、门禁、消防等报警信号)经UPS的输入通信接口被纳入IDC机房或智能化楼宇的统一的集中监控系统;
6)由IDC和MDC的主管当局所指定的人员,根据不同的授权权限,分级“重新调整”/设置各种相应设备的运行参数或执行远程的故障分析/诊断操作。