当前位置:首页 > 芯闻号 > 充电吧
[导读]近日,雷电导致部分亚马逊网络服务(AWS)出现中断,让Netflix、Pinterest和Instagram等网站无法访问,造成严重经济损失。根据云计算弹性国际工作组(IWGCR)表示,自2007年以来,共有13个知名的云服务商发生过宕机事件,

近日,雷电导致部分亚马逊网络服务(AWS)出现中断,让Netflix、Pinterest和Instagram等网站无法访问,造成严重经济损失。根据云计算弹性国际工作组(IWGCR)表示,自2007年以来,共有13个知名的云服务商发生过宕机事件,总计停机时间达568小时,总经济损失达到7170万美元。IWGCR表示,每年平均停机时间为7.5小时,可用性仅为99.9%,远远低于关键任务系统所需要的可用性(99.999%)。Schnader, Harrison, Segal & Lewis公司业务服务部门合作伙伴Kevin C. Taylor表示:“廉价的云服务可能最终带来昂贵的代价。”

虽然典型的云服务合同包含正常运行时间条款和服务水平协议的条款,但他们往往未能充分包含企业客户。服务水平协议(SLA)赔偿上限通常只是一定比例的每月服务费的,“对于与生产应用程序停机相关的业务损失,不予以赔偿,”Taylor表示,“即使是对于严重的持续停机故障,赔偿金额都只有约2万美元,这与停机对客户的经济损失相比,简直很可笑,客户的经济损失可能达到数百万。”

聪明的用户可以向其云服务供应商提出以下十个问题,以保护自身的利益。

1.你的基线正常运行时间SLA是否满足我的业务需求?

云服务供应商的99.9%正常运行时间SLA将会让习惯于五个9(99.999%正常运行时间)的用户感到失望。“这是用户需要向云服务供应商提出的第一个问题,看看他们能否做得更好,”外包分析公司HfS Research公司外包安全和风险策略研究主管Jim Slaby表示,“用户还应该对合同中每项服务的恢复点和恢复时间目标进行协商。”你将需要支付更多费用,99.999%可用性需要典型的双主动服务配置,而这意味着每个月增加50%的服务费用。

2.你如何定义“正常运行时间”和“停机”?

“聪明的用户需要完全弄清楚到底怎样算是停机,”K&L Gates律师事务所合作伙伴Todd A. Fisher表示,“是否意味着5%的最终用户会受到影响?或者25%?或者50%?如果系统没有停机,但是运行速度非常缓慢,导致最终用户无法有效地完成工作,这样算停机故障码?”

很多云供应商提供了一个正常运行时间保障的排除情况列表,包括紧急情况,15分钟以内的中断,以及一天的某些事件的可用性等。Slaby表示:“用户需要弄清楚这些不被视为停机的排除情况,以确保让供应商进行日常维护。”

要提防过于宽泛的排除情况。例如,外包咨询公司Pace Harmon主管Dr. Jonathan Shaw表示,电信中断经常被排除在外,因为客户本身购买的服务和供应商(应该提供冗余电信架构以防止单点故障)提供的服务之间没有明显的区别,所以很难判断究竟是哪一方的中断。Shaw表示:“你会看到‘紧急维护’也被排除在外,而且对于何时供应商能够进行紧急维护并没有限制,这意味着他们可以随时用紧急维护这个借口,来掩饰服务中断。”

3. 如何定义“天灾”?

大多数云服务合同还会排除不可抗力事件,即不在供应商合理控制范围之内的事件,例如自然灾害、战争和罢工等。“不可抗力事件可以让供应商逃脱责任,包括SLA,”Schnader公司的Taylor表示,“用户应该对不可抗力的狭隘定义与服务供应商进行协商。”

4.你的云环境的稳定性如何?

Shaw建议对所有云解决方案执行技术尽职调查,以评估重大中断事件的风险。看看云服务是如何架构的。其数据中心是否位于地震断层线上或者位于政治局势不稳定的国家?

5.你的灾难恢复计划是什么?

Slaby表示,“用户应该深入挖掘这方面的信息。”要求对云服务供应商进行实地考察和审核,以评估供应商的可实现恢复时间和恢复点,并将结果用于计算潜在灾难对你的企业的影响。Shaw表示,“如果云解决方案不能足够快地恢复云应用程序,以避免危害业务的事件,这就可以排除这家云服务供应商了。”

6.你隔多久会对这个计划进行测试?

“拥有一个灾难恢复和业务连续性计划,并不能保证灾难发生时,能够最小化停机时间,”Fisher表示,“不幸的是,一些供应商并不会定期测试他们的灾难恢复计划,使他们无法有效应对灾难。”聪明的用户会将半年度灾难恢复测试涵盖在云服务合同中,迫使供应商向用户公布测试结果,并纠正发现的问题。

7.部署的最佳选择是什么?

AWS最近遭受的中断仅发生在美国东海岸的某些设施中。因此,一些客户都不知道这件事,而其他人没有受到影响。Shaw表示,“这种差异的重要因素是客户是如何部署其云应用程序的。”AWS允许客户在不同可用性区域弹性负载平衡器来部署云组件(处理、存储、数据库)来路由流量。Shaw表示,“客户可以通过在不同可用性区域部署多个ELB来减少单点故障,以及使用域名系统查询来提供故障转移。”

8. 当发生灾难时,我能否跳到前列?

在灾难发生时,供应商将奋力使数百名或者数千名客户重新联机。Fisher表示,“如果尽快恢复联机对于你很重要的话,你需要考虑支付额外的费用来享受这种待遇。”

9.如果我不满意的话,我能离开吗?

无论停机原因是什么,如果供应商在预定时间内不能恢复服务,用户应该坚持增加一个条款,以避免让供应商逃脱这方面的责任。Shaw表示:“最糟糕的情况是,为云服务支付多年费用,而无法选择离开。”

10. 我能看看你的企业信息吗?

天灾、软件漏洞和繁重的流量不是可靠云服务面临的唯一风险。企业本身也可能出事。“如果云服务供应商破产,停止提供服务,SLA将不能给你任何保障,”Shaw表示,“所以我们建议你对供应商进行财务尽职调查和业务分析。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭