云计算运维存在哪些难点?云计算并非十全十美!
扫描二维码
随时随地手机看文章
以下内容中,小编将对云计算的相关内容进行着重介绍和阐述,希望本文能帮您增进对云计算的了解,和小编一起来看看吧。
一、云计算运维难点
一方面,云计算要用廉价设备取代那些昂贵的解决方案。所谓互联网的文化就是屌丝文化,屌丝就是便宜,互联网就是要用便宜的东西搭建出高质量的东西,硬件和资源一定不会走高端路线——比如EMC、IBM小型机、SGI超级计算机等等,你如果用它去搭建云计算,成本太贵。
用廉价的解决方案代替昂贵的解决方案是整个计算机发展史中到今天唯一不变的事情。所以如果你要让夏利车跑出奔驰车的感觉,你需要自己动手做很多事,搭建一个智能的系统。用廉价的东西做出高质量的东西,运维好廉价的设备其实是云计算工程里最大的挑战。
另一方面,因为你机器多了,然后你用的又不是昂贵的硬件,所以故障就变成了常态,硬盘、主板、网络天天坏。所以,没什么好想的,运维就必须要跟上。云计算的目标是在故障成为常态的情况下保证高可用——也就是我们所说的,你服务的可用性是3个9、4个9还是5个9。
最后,这一大堆机器和设备都放在一起,你的安全就是一个挑战,一方面是Security,另一方面是Safety,保证数十台数百台的设备的安全还好说,但是对于数万数十万台的设计,就没有那么简单了。
所以,面对这样的难题,人是无法搞得定的,你只能依靠技术来管理和运维整个平台。比如必须有监控系统。这跟操作系统一样,对资源的管理,对网络流量、CPU利用率、进程、内存等等的状态肯定要全部收集的。收集整个集群各种节点的状态,是必然每个云计算都有的,都是大同小异的。
然后,你还要找到可用性更好的节点,这需要有一些故障自检的功能。比如阿里云就遇到过磁盘用到一定时候就会莫名其妙的不稳定,有些磁盘的I/O会变慢。变慢的原因有可是硬盘不行了,于是硬盘控制器可能因为CRC校验出错需要要多读几次,这就好比TCP的包传过来,数据出错了,需要重新传。在这种硬盘处理半死不活的状态时,你肯定是需要一个自动检测或自动发现的程序去监控这种事情,当这个磁盘可能不行了,标记成坏磁盘,别用它,到别的磁盘上读复本去。我们要有故障自动检测、预测的措施,才能驱动故障,而不是被动响应故障,用户体验才会好。换句话说,我们需要自动化的、主动的运维。
二、云计算并非十全十美
安全威胁尽管大多数云提供商都采用了一些安全措施来防止黑客侵入其云基础设施,但数据泄露的发生率表明云计算仍然容易受到攻击。这使得在虚拟数据中心中存储业务关键文件和关键数据具有潜在风险。例如,Microsoft在2021年透露,由于其旗舰AzureCosmosDB数据库的一个重大缺陷,客户信息可能已经暴露给黑客,这让黑客能够读取、更改或删除保存在云端的数据。此外,Fugue的一项调查结果表明,在云环境中工作的团队中,大约有四分之三的团队经历了大约十起由于云系统配置不当而导致的潜在黑客事件。尽管这些威胁不会使云计算完全不安全,但只有在云设置中存在人为错误和端点配置问题时,才会显示出更高的成功攻击或数据泄露的可能性。
延迟问题云延迟描述了云服务运营商响应客户端请求所需的时间。云服务延迟在云计算中是一个严重的问题,特别是现在全球数据生成和连接设备呈指数级增长。随着这些设备生成的数据越来越多,云服务延迟的发生率可能会增加。数据传输到云托管中心进行计算过程和返回客户端所需的时间会影响云计算。这就是为什么现代物联网设备和智能产业正在采用边缘计算作为计算模式。
不经济由于云存储的数据和文件量很大,用户需要大量带宽才能持续访问这些数据。尽管许多云服务提供商已经调整了其支付方式,以反映现用即付的模式,但维持与云服务的连接仍然需要花费大量成本。因此,维持这种持续访问云资源的带宽级别可能是资本密集型的,没有太多的初创公司能负担得起。
以上所有内容便是小编此次为大家带来的有关云计算的所有介绍,如果你想了解更多有关它的内容,不妨在我们网站或者百度、google进行探索哦。