中大科慧王山中:IDP助力IDC动力系统高效安全
扫描二维码
随时随地手机看文章
中国IDC产业联盟讯 为了提升数据中心行业对安全管控系统更加全面的认识及技术的发展,加速推广电能质量管理系统的应用标准。中国数据中心产业发展联盟特于6月24日在京具举办“2011中国数据中心动力安全能效管理趋势研讨会” ,邀请国内众多资深专家就数据中心安全运维和电能质量管理等议题进行深入交流和探讨。
中国IDC产业联盟网作为中国数据中心产业发展联盟的官方指定媒体,对此次大会进行全程深入报道。
中大科慧公司总经理王山中在演讲中指出,数据中心动力系统作为整个数据中心最基础、最底层的支撑系统,因为所有的IT系统、业务系统都是依靠电力系统来工作的。但现实是,我们对IT设备和业务系统都有很完备的管理平台,但对电力情况却没有深入管理。
某些数据中心可能一年有两到三次的检查,而中大科慧的设备则可以提前预测电能质量并实现实时监控。同时对影响电能质量的比如谐波问题以及三相不平衡的问题,还有无功功率进行一个补偿和消除以及治理。
以下为中大科慧公司总经理王山中演讲全文:
王山中:首先非常感谢各位领导、嘉宾以及媒体朋友来参加我们这个会。下面就我们的产品给各位领导作一个汇报,给各位专家作一个展示。
我们的产品叫IDP。先看一下目前我们中心运维方面的现状,数据中心动力系统作为整个数据中心最基础、最底层的支撑系统,它的重要性自然是不言而喻,因为所有的IT系统、业务系统都是依靠电力系统来工作的。但现实是,我们对IT设备和业务系统都有很完备的管理平台,而且不断在升级改造。我们很清楚每台交换机每个断口的宽带速率以及每个网络端倪九到端的所有IT系统的工作状态,但对电力情况却没有这么深入的去管理。
也许有些管理员说了,我们有对机房电力动力这一块管理管理,我们可以通过UPS,通过moutbus,甚至通过PDU对每台服务器连接的插孔的电力进行监控。看似很完美的监控,试想一下,如果某台服务器宕机了,或者某台UPS保护性停机了,经设备长厂商检查后不是设备本身问题,我们该怎么办?这种情况不是没有,我们UPS厂商经常用电能质量方面的分析仪器进行分析,比如fluke43、法国CA等。我们为什么不失市去监测它?某些数据中心可能一年有两到三次的检查,就是请一些第三方的机构去监测,我们的设备就能做到这一点,可以提前预测电的问题,而且可以实时72小时的去监测电方出现的问题。同时对影响电能质量的比如谐波问题以及三相不平衡的问题,还有无功功率进行一个补偿和消除以及治理,这样我们的监控才是有意义的,因为我们不光知道它发生故障,而且还可以知道怎么样防止故障的发生,我们的设备可以治理它,防治它。
UPS在投标的时候,提交给领导的文件上都写着满载THDi低于5%,但每个数据中心都不可能用单台UPS进行供电,而且都不是满载运行的,通过我们测试的数据也可以发现这些问题。
我们对您目标的理解,IDP设备首先是基于IT运维的理念进行设计的。我们对您目标的理解是:
1、降低故障发生率,提高故障响应速度。
2、提升动力运维效率,增强解决问题的能力,可以通过对事件的管理进行。
3、实现管理层透视,全面掌控动力系统运行状况。我们可以通过评估报告去展示,例行的报表和事件报告。
面临的压力和突出的问题,首先是可用性的问题,缺乏全面的告警与预警机制,我们是有告警,但是告警得到的参数只是电压、电流、功率,如果要出现问题的时候,这些参数是无法分析出根本原因的。依靠这些数据,我们无法分析根本原因。
第二是性能问题,找不到问题的根本原因,比如UPS保护性停机,油机无法加载,服务器宕机,开关跳闸了。
我们帮助您实现目标的方法:
1、全面、实时、准确的电能监控。集成或部署专业监控软件,设置最佳实践阈值和预警机制。
2、整合事件和性能数据以帮助故障分析。首先是高效的事件处理引擎,然后是事件和历史数据的关联,我们看到这个事件了,这个事件可以直接双击进去以后,关联下面每一个周波上面,260个点每一个点电的情况都可以看得到。
3、统一的管理平台和用户分权视图。
4、结合行业的最佳运维实践,把软件做的更符合用户的使用习惯。
处理问题能力,设备由原来被动式的管理变成主动式管理,首先发现问题,超出阈值的时候告警,然后快速定位,诊断原因,我们设备本身解决不了的问题,交给专家处理。快速响应,我们设备能做到的,快速响应它,马上把它治理掉,最后问题就消除了。
IDP全程叫Integrated Detector Procession,我们一直追求的是安全方面的,我们是有节能的作用,但是我们更是安全的必须,我们的设备叫做数据中心电能综合管理设备。
设备分为两部分,一部分是电能质量的治理部分,前面专家说到了,治理部分肯定要前期去测量才能知道我们该配多大容量的设备,在哪个点需要做制冷,所以必须分成两部分,一部分是治理部分,一部分是管理部分,但是是一台设备。左半部分是治理部分,右边是通过运维软件来实现。
综合运维管理平台的介绍,综合运维管理平台是整个IDP的核心单元,换句通俗的话说,就是整个监控的大麻烦,主要职责是接收、记录、分类、派发、监视、督促和关闭发现问题或请求,提供一线支持、解决简单的问题,为管理层集中提供管理信息,为技术人员提供最全面可靠的技术信息及依据。
这是管理平台的一个视图,从这个上面可以看到,这是给中行广州分行做的,可以从这个管理平台上看到,比如说佛山,实施了月报,从颜色上可以看到是不是有问题,大于或者等于80%的时候,会以红色来表示严重程度,如果是大于或者等于40%的时候是黄色,小于黄色的时候就是告诉他正常。
这是软件的基础设置。管理平台的架构,最底层的采集哪些点的信号,我们采集UPS,采集ATS,可以采集变压器的,或者采集直接输入输出配电柜,或者油机的,最后采集数据全部到这个平台上来。
下面是设备的功能,第一个功能是在线监测,以图形化展示在线监测电压、电流的有效值,功率、谐波、频率、闪变、浪涌塌陷、瞬变、三相不平衡、正负序及零序电流等。
环境监控是全涵盖的,比如电压、电流、功率都有,包括闪变,三相不平衡。可以用图形化的去勾选,是A项目还是B项目还是C项目,也可以看负值也可以看有效值,可以看单向的,比如电压或者电流的对比,可以看三相不平衡的矢量图,也可以看谐波的柱状图。这是通道的选择,可以选择A项还是B项还是C项的通道,显示模式也可以更改,如果更改成列表的形式,就以数值的形式列出来。[!--empirenews.page--]
第二个功能是事件管理,事件是不属于标准运作的突发事件,它可能导致设备的中断或潜在的隐患形成。事件管理是为动力尽快恢复正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对其他系统的影响最小化。事件管理流程受事件的触发和驱动,所谓的事件是发生非常规的情况,比如电压消失了,发生一个闪变或者浪涌塌陷。任何可能会影响到系统或者设备正常工作的情况都可以当作一个事件,有的事件也包括用户的请求和密码的重设备。事件管理的责任就是把事件记录下来,分类、统计、过滤、解决已知问题,监控跟踪事件,最终解决事件。如果发生一个报警的时候,这个事件是要有人去处理得,没人去处理的时候,这个事件一直在报警。有人处理得时候要确认,必须要处理,比如谁处理得,一个什么样的简单办法。事件管理主要记录每个事件的发生时间、类型、事件发生点、事件的简单预览、事件的优先级。
当我们鼠标放在这的时候,可以看到一个预览的图,从这个预览图可以看到当时事件发生时的简单概括。右边有一个比这个预览稍微详细一点的,当我们双击以后,就直接进入后台的历史数据库,数据库可以看到每一个点上的情况。
如果事件要很多,还有事件过滤功能,通过类型去过滤,通过优先级去过滤,关键负载的给它设置的优先一点。比如要接1号架,1号架是我们比较关心的地方,把它的优先级设的最高,当它出现问题的时候,它永远是排在最前面的。
这就是事件关联历史数据,双击以后进到事件发生的那一个时刻的电能的变化情况,当我们点到发生事件的这个点的历史数据的时候,可以看到测量这个点是哪个位置,发生的时间,A项还是B项,持续了多长时间,浪涌塌陷的深度,以及是上行还是下行的,以及这个事件是否被人确认过,是谁确认的。这边可以去看,这一条轴可以有下拉菜单,如果是月的事件就看月,绿色部分表示有数据的部分。
事件关联历史数据还有一个功能,如果有好多个事件,我们可以以不同的颜色来区别这个事件的变化,比如浪涌塌陷绿色,瞬变红色,只要看到红色的都是瞬变,用不同颜色区分不同的历史关联数据,可以看任意时间段的数据。
报警功能,有时间来触发报警。首先可以设置各种参数的限值,比如最大值、最小值、平均值。举个例子,如果设置这个地方的电压限值是240,如果超过的时候,会自动报警,还有一个声音,再是发送Email或者发送手机短信的方式。当这个报警发生的时候,会弹出来这么一个窗口。报警所关联的事件,事件的确认情况,谁去确认它,不确认就会持续报警。事件的简单预览。
我们还通过无线的方式做一些报警,比如说可以在任何地点任何时间任何时候,提供3A无所不在的运维管理,收条一短信,电压消失了,可以更详细的说明一些情况。
历史数据的分析查询,IDP首先能采集和存储这些数据,事后可以随时提取,包括电压、电流的有效值功率,频率,电压电流的谐波,闪变,三相不平衡。我们设计的是很人性化的,这个是年的数据,或者是季度或者是周、日,都可以看。要看周的话,这个轴就变成每一天一轴七天的变化,绿色部分说明有数据的。通过时间段的定义,也可以去做。这边是一些选项,去看哪些数据。这边可以放大,数据这个地方发生了一些变化,我们可以把它拉大到每一个周波去看每一个点的情况。
还有一个跟机房比较接近的功能,就是ITIC曲线,也叫CBEMA,原来是美国计算机商用设备制造协会做的一个曲线,现在叫ITIC,是信息技术工业协会做的一个曲线,这个曲线是专门针对IT设备,主要是计算机服务器设备类电压容忍度的曲线,以防止出现电压突降或超压的深度和持续时间的限值,以防止这些问题对设备造成的不良影响。ITIC有两种曲线功能,可以立刻看到现在这个用电情况是不是在这个曲线范围之内,如果超过这个曲线,我们要看它哪里出了问题。
这个是ITIC曲线,曲线规定的范围在这,数据也是在这个位置,看它持续多长时间,如果持续时间长,对设备就有损害,如果持续时间短,设备可以容忍过去。历史数据也支持这项功能,我们可以选择ITIC或者CBEMA,看这个点是不是在这个曲线容忍的范围之内。
基于国标的评估报告,国家都有对电能质量方面的规定,我们的设备可以通过默认的方式去设计这些国标,不需要手动去设定国标,可以直接点击默认,直接出报表。总共有四种报表,历史曲线图、电能质量总览图、电压电流谐波频谱图以及电能质量的综合统计报表等,报表中包含测量参数测量期间内的最小值、最大值,超过国标多少次以及超过频率。
这是一个标准的限值,人性化可以做到让我们一眼看到是不是超标了,具体下面的数值做一些分析,看超标的比率,与国标规定的值是多少,发生的时间以及最大和最小的平均值。
这是设置,设置的时候,可以去定义这个设备的一些具体情况。当然国标的这些值,比如电流的谐波、频波,不同的电压等级国标的限制也是不一样的,所以只要去选择就可以了。
能效管理,结合目前国家对节能减排做的一个功能。我们可以时刻的记录每个点的能耗情况,并作出统计分析,并与当年的节能减排目标实时对比,节能减排的目标可以手动的设定。可以绘制每个点和整个数据中心的能耗变化趋势。
变更管理,出现一些变更计划的时候,我们可以去申请,可以去新建,可以审批变更。可以去处理变更,可以新建一个变更,以及变更事件的一览表,以及统计变更时间,去看最近7天或者30天,有的3个月的变更。
级别管理,前面说到领导有领导的分权,采用分级的授权管理机制,即将权限定义与用户的职责进行映射。基于用户的权限管理,基于用户组的权限管理,基于访问内容的权限管理,以及这些访问权限的组合。
电能质量的治理,我们的设备既能够监控、去运行、去维护整个机房动力的情况,同时对动力这一块最容易出现的这及时的去治理。
治理功能,系统治理部分采用现代电力电子技术和基于高速DSP器件的数字信号处理技术,制成的新型电能治理专用设备。它由指令电流运算电路和补偿电流发生电路两个主要部分组成。指令电流运算电路实时监视线路中的电流。
这是设备工作的一个动画原理,通过互感器去采集,采集到一个模拟信号通过转换,交给监测,交给控制电路,最后交给补偿电路。拿谐波举例,会跟谐波伏值相等,但是效率抵消做一个补偿,最后数据全部汇聚到运维平台上。[!--empirenews.page--]
对我们工作流程的一个介绍,首先有做治理的工作,我们得注意我们的流程。首先给客户提交一个测试方案,去哪个地方去测,用什么设备去测,测哪些项目。了解客户需求。通过现场的数据测量,提交一个分析报告,通过分析报告最后做一个整体的解决方案,最后通过这些方案以及数据来定制符合用户的产品。
IDP设备的优势,分为两个部分,首先是管理优势。将原来不可见的全项的电力参数集中统一到一个平台进行监控,并形成不同的报表和图形,方便分析管理。提前故障点的分析,并实时跟踪,出现问题及时报警,并记录事件,随时打开事件相关联的历史数据进行分析。报警信息可以直接发送到lotus而系统。及时和IDP治理后参数进行国标对比,实时掌控机房的动力环境。监控指标是最全面的,有16项。可以做在线检测,可以生成各种报表,可以依据国标做一些评估或者依据国际的曲线图做一些分析和评估。人性化的历史数据的分析查询。故障的报警以及任意阈值设置。
治理优势,数据中心本来就安全性比较高,我们是并联接入,便于安装与维护。可消除2到50次谐波,谐波滤除率不低于95%,可以做到只滤波而不产生无功功率。可以消除三相不平衡,中线滤波能力为相线电流的3倍。效果不受电网阻抗影响,可以动态实时跟踪不唐,响应速度快。40纳米内响应负载变化,全响应时间小于10毫米,自动抑制过载、过流、短路等故障,无共振危险发生,可同时补偿谐波、无功和三相不平衡。可以多模块并联转型,工作效率高,电能损耗低,多重保护功能,数字化控制以及多重保护和故障自诊断功能。
有丰富的接入方式,可以通过RS232/485实现,也可以通过以太网实现,也可以通过GPS实现。
安全性,我们的设备通过电科院型式试验报告,总共检测了14项,全部符合或者超过了标准。
谢谢大家!