AT&T投资5亿美元欲打造网络灾难恢复典范
扫描二维码
随时随地手机看文章
2005年8月末,来自加勒比海的5级飓风卡特里娜在美国登陆,给路易斯安那、密西西比等州造成了巨大破坏,一时间,通信服务几乎完全中断。灾害发生后,at&t迅速响应,派出4辆紧急通信车和一个便携式卫星接收器,为救援提供通信服务。出于对at&t应对灾难能力的充分信任,密西西比州政府甚至把灾难控制部门设在了at&t控制中心大楼。在at&t的帮助下,灾害发生地的通信服务迅速恢复,救灾工作得以顺利进行。
目前,洪涝灾害在我国南方地区频繁发生。分析at&t的应急通信之道,或许能为我国运营商提供一些有益启示。
5亿美元投资
在at&t有这样一个特殊的群体,他们的工作内容是设计网络灾难管理架构、监测网络异常情况、模拟灾害现场进行网络恢复演练,以及在灾害发生后第一时间奔赴现场,他们所属的部门就是网络及业务持续部。所谓“养兵千日,用兵一时”,这样的部门或许一年只有为数不多的几次机会能派上用场,不过,这丝毫不影响他们平日里专心致志地紧张备战。
at&t为什么会高度重视网络灾备和应急通信?at&t大中华区总经理吴英才告诉记者,at&t在全球155个市场运营着3800多个服务节点,拥有38个全球互联网数据中心,服务全球99%的经济实体。由于业务遍布全球,不同地方发生意外情况的几率就相应增加,此外,企业客户的数量越来越多,对服务安全性的要求越来越高,因此,长期以来重视服务质量的at&t就将网络灾难复原提高到了战略地位。
除了设置专门的部门外,还有一个数字足以说明at&t的重视程度。据了解,尽管政府对于运营商在网络灾难恢复方面的投资没有作出任何要求,然而截至目前at&t已经自发地投入了将近5亿美元。at&t商业服务部欧洲、中东和非洲地区网络及业务持续部门的经理Justin Williams直言,at&t之所以大手笔投入,是因为“希望能够成为灾难恢复方面的‘典范’。”
6个灾备仓库
Williams认为,对灾难的紧急响应离不开平日的充分准备,以及灾害发生之后的第一时间反应,“准备+反应”成为了灾难复原的两大要素。
准备分多个层面进行,首先是物质上的准备,即保证灾难发生后有充足的通信设施可供及时调用。at&t认为,如果等到灾难发生之后再从设备商那里购买设备,那么会大大增加救灾风险,为此,at&t投入大量资金用于购买灾备设施,所有设备预装完好,随时待命。同时,at&t还会与设备商签约,保证在紧急情况下及时补充供货。而为了保证灾难发生时不会有意外情况发生,at&t严格规定这些应急设备不能挪作他用。
at&t在全球设立了6个仓库用于存放这些设备,其中5个在美国,1个子英国,为了能迅速响应全球任何角落的灾难,at&t甚至自己购置了波音747飞机,一旦发生灾害就能立刻装机运往现场。
网络层面的准备也必不可少。比如,设计两条路由线路保证数据可靠传输,将网络设计成网格状,以确保有迂回路由可用。如果所有的保障措施都失效,那么at&t会通过移动方式建立新的数据节点,尽快恢复通信正常。
在网络和设备准备停当后,at&t会坚持7×24小时地监督网上所有的信息,以提前识别可能发生的灾难。因为时刻保持警界状态,所以有的突发事件客户还没意识到at&t就已经监测出了,从而能在第一时间作出反应,解决问题。
每年4次演练
除了物质上的准备,流程上的设计也至关重要,因为只有流程清晰,人们在遇到紧急情况时才不会慌乱。
Williams介绍,at&t经过反复摸索,总结出来了一套应对网络灾难的6步骤流程:第一,分析现场配置,比对集装箱设备,以了解存在哪些缺口;第二,在仓库内完成通信设施的组建;第三,选择提供应急通信的主要地点;第四,与有关部门协商该地点;第五,网络复原小组运送设备;第六,提供通信服务以及安排线路迁移。六个步骤环环紧扣,确保救灾万无一失。
不过,如果脱离实际的操作,仅仅将这六个流程烂熟于心,那么也只能说是纸上谈兵。为了提高实战能力,at&t特别模拟灾难现场,届时会把应急通信车调出仓库,进行实际演练,从而提高灾备技能。据了解,这样的灾备演练at&t一年要进行4次,涵盖山洪、地震、台风、恐怖事件等各种场景。当然演练的作用不止是为了让工作人员熟悉业务,“灾难恢复非常复杂,会有很多意想不到的情况发生,通过演练我们可以提前预知可能发生的问题,提高解决问题的能力。”Williams表示。