关于云和网的未来,这位大佬讲了真话……
时间:2021-11-01 14:34:30
手机看文章
扫描二维码
随时随地手机看文章
[导读]枣君注:本文是华为边缘计算网络产品规划专家张云锋先生在全球边缘计算大会·上海站上的发言,干货很多,观点也很独特,特此推荐给大家。 以下是演讲正文:大家好,接下来由我为大家做一下分享,题目是《面向物联网和边缘计算的云网演进》。首先做一下自我介绍,我叫张云锋,12年IC...
枣君注:本文是华为边缘计算网络产品规划专家张云锋先生在全球边缘计算大会·上海站上的发言,干货很多,观点也很独特,特此推荐给大家。
大家好,接下来由我为大家做一下分享,题目是《面向物联网和边缘计算的云网演进》。
7年无线接入网的产研经验,包括对C-RAN,Radio Cloud的一些探索和实践,对运营商的移动通信网有些了解。
4年云网融合的产研经验,包括对SDN、SD-WAN、SASE的一些探索和实践,对企业网市场也有一些了解。
目前,在华为做边缘计算网络相关的产品规划工作,方向与行业数字化转型有关。
很感谢边缘计算社区,提供了今天这次机会,能和大家交流一下关于网络演进的一些看法。以下观点仅代表个人,不代表任何组织立场。
● SDN产品社死
大概在今年8月份,朋友圈忽然被一条消息悲鸣刷屏:“Gartner宣布放弃SDN”。
作为一个从业者,觉得有些莫名其妙:因为这其实不是新闻,Gartner早在2019年就已经宣布过这个结论,但大家却一直憋到了2021年才情绪爆发,感觉像是一个寄托着全村希望的大小伙,在坚持了两年的委屈之后,终于破防,嚎啕大哭了一场。那大家为什么非要憋着劲呢?
因为Gartner给出的放弃SDN的理由有点奇怪:“迟迟不被市场所接受”。SDN的核心理念是“转控分离,集中控制,按需调度”,主要的产品形态是软件定义的高速通道。运营商、云厂商天然有着大量的基础设施需要运维运营,不可能不用SDN。
那么问题出在那呢?答案可能是云。
云起来之后,时代就变了。绝大部分企业都开始租用ICT资源,只需要使用云厂商和运营商提供的SDN服务即可,不会再有直接的SDN建设需求。所以,SDN更像是“产品社死,理念永生”。
● SD-WAN拥挤窒息
SD-WAN继承了SDN的遗志,把软件定义的范围,从机房内和机房间的高速通道,扩展到了机房外的广域网络,客户更加广泛。
不过,这里也有一个奇怪的现象:一方面,根据Gartner、IDC等知名机构的预测,SD-WAN2023年的全球市场规模,大致在40亿到60亿美元之间,不算太大。
但是,这里却集中了几乎所有的设备商,运营商、云厂商、CDN厂商,以及一大批细分领域的创业公司,挤得让人有点窒息。
每个巨头都守着一个千亿甚至万亿级别的市场,为什么还不放过创业公司的这点蚊子肉?
这到底是“道德的沦丧,还是人性的扭曲”?
其实都不是,还是因为那个趋势,云起来之后,巨头们忽然发现,原来的企业网慢慢不见了,SD-WAN似乎是这个领域唯一的救命稻草,要是现在不去抓一抓,那么以后企业网侧的任何机会,可能就会变成“热闹是他们的,我什么都没有”。
考虑到这一点,千军万马过独木桥,也就不奇怪了。
一方面,根据市场调研,企业纷纷表示,NFV是一个令人向往的趋势。不过当厂商开始提供NFV产品时,才发现企业原来是叶公好龙,嘴上说喜欢,身体很诚实,缺乏埋单意愿[1]。
这不是我说的,这是Gartner的调研报告说的。这个遇冷也不是一年两年了,至少在2020年还是如此。
为什么会这样?可能还是与云有关,NFV徒有云的外表,却没有云的灵魂。
网络功能是虚拟化了灵活了,但底层硬件的资产投入并没有啊。设备商说,老哥,这硬件你只用投资一次,以后就都可以复用了,老灵活了。
企业哪怕再没吃过猪肉,也是见过猪跑的,现在还没有成熟的NFV生态呢,买硬件不就是换种方式被绑定么,性价比还更低,赶紧说,不不不,你看我只要羊毛行不行,羊还是您自己留着。
归根结底,经过云的洗礼,大家都在想着只要羊毛不要羊。
● 5G风口浪尖
一方面,能感受到的是全球竞争,从国家到运营商到设备商。如果你去问设备商,最近5G的项目怎么样,设备商会表示压力山大。
这些压力真的像一些自媒体所说,来自所谓的国内政治任务吗?
至少不全是,海外运营商对部署5G的进度需求,也远超当年的4G。
另一方面,大众对5G的口诛笔伐就一直没停过,你要是敢在某乎喊一嗓子:“5G赋能千行百业很重要”,大概率会被嘲讽的口水喷死,几乎没有还嘴的可能。
为什么会出现这么搞笑的场面?
原因之一,可能是媒体和运营商对5G吹得太过了。
但更大的原因可能在于,5G与4G的性质全然不同。它在设计之初,就是以2B应用为主的。这意味着买方是极其理性的,要的是能解决实际问题的方案,而不是在那掰扯单点技术的先进性。
但从基础设施到行业应用,不是一个5G就能解决的,至少不是通信层面的5G能单独解决的,需要一系列的行业配套。
结果自然就是,枪打出头鸟,媒体把你捧得有多高,公众对你的反感就有多狠。
所以,如果单看网络,各有各的烦恼。
幸好,边缘计算来了,这是一个难得的有广泛共识的领域,大家都可以在这里找到自己的存在感。
网络需要往边缘计算,最大的需要,就是通过边缘计算来综合落地的需要。
这与一个更大的时代趋势有关,就是行业的数智化转型。
所谓数智化,分为三方面[2]:
数字化:通过对人、物、环境、过程等对象进行数字化,产生数据。根据IDC的预测,到2023年,会有70%的企业需要处理物联网数据;到2024年,会有380亿物联网设备在数字化这个世界。
谁相对爱提这个概念?互联网公司。
而网络化则是AIoT的支撑。什么叫支撑?做网络的朋友应该都知道,所谓支撑,就是平时没啥存在感,好不容易有存在感的时候,就是需要让我们来背锅的时候。
一个背锅的,是不配有高大上的名字的,所以我们长期被互联网公司叫做管道,业务跑好了,赢在我有互联网思维;业务出问题了,哎,你们这帮人连个管道都做不好。
好在边缘计算来了,这个所谓的管道,在各个层级被打开来承载计算。这时,也就出现了什么算力网络,算网融合之类的概念。
谁相对爱提这个概念?当然是苦管道久已的运营商。
不过,觉得这个词还是供应商视角的词,客户关心的是行业智能,并不关心谁跟谁融合;你爱跟谁融合跟谁融合,别在我面前绕来绕去。
好在5G又来了,借助移动通信的泛在连接,不知哪出来了个聪明人,发明了一个更加牛逼的客户视角的词,泛在智能。我很感谢他,网络终于在客户那,找到了一回时代级别的存在感。
所谓大象无形,一个事物越是宏大,就越是不容易从具象上去分析,所以我们就从商业的视角来回顾一下,看看云可以带给边缘计算哪些启示。
第一个问题:云的产品本质是什么?
这个问题已经是老生常谈了,是IT的外包服务。
外包到基础设施层次,是IaaS,比如阿里云的ECS,提供的是一台带操作系统的电脑。
外包到开发平台层次,是PaaS,比如声网的RTE,提供的是一整套实时音视频软件开发平台。
外包到软件应用层次,是SaaS,比如微软的Office365,提供的是一个个具体的软件应用。
第二个问题:那为什么会有这么多IT外包需求呢?
时代级的产品必定有时代级的需求来支撑。答案是第三次产业革命。
第三次产业革命的核心正是信息技术,Information Technology,简称IT,所以海量的IT需求,正是这个时代的红利。
第三个问题:即使有海量的IT需求,那为什么产品形态会是外包服务呢,而不是客户去自建自维?
这意味着买卖双方之间,必定达成了某种强烈的商业契合。
先看买的方面,随着产业革命滚滚向前,各种业务创新越来越快,越来越复杂,承载业务的IT系统不再是几台电脑了事了,也是跟着越来越复杂,越来越庞大。
比如,谁能快速说清像滴滴打车之类应用,需要哪些IT基础设施吗;谁能快速说清高铁外卖,就是在高铁上点外卖,需要哪些IT基础设施吗。
很多专注于业务创新的客户只负责天马行空,寄希望于供应商能够提供相关的参考方案,这也进一步强化了云的服务本质,就是云特别重视解决方案,而不局限于单个产品;很多时候,这才是客户接触云的第一界面。
1)资源的规模优势,比客户自己单独去购买资源更有优势,这主要体现在全球的供应链积累以及价格谈判能力上;
2)运维的效率优势,比客户自己单独去运维基础设施更有效率,这主要体现在拥有一个庞大且专业的IT团队,足以碾压任何一个客户。
如此一来,在买方诉求和卖方优势的共同作用下,外包成为了一种理性的商业选择。同时,云产品的核心价值也就推导出来了:
1)敏捷,客户可以无需关心基础设施,可以在分钟级别内完成全球部署,从而专注到自己的业务创新;
2)弹性,客户不需要再去规划容量,预留资源,可以随时进行伸缩;
3)按量付费,客户可以将一次性的CAPEX投入变成细水长流的OPEX支出,不使用时不付费。
把这三点翻译成大白话就是:不求天长地久,但求要时能有,随时要随时有。这的确是一种理想的IT外包。
让我们来俯瞰一下,网络发生了哪些变化:
机房内,集中了海量用户,网络需要在超大租户规模的情况下,依然具备超高带宽,超低时延,从而发生了一系列变化:
首先,网络的架构变了,传统的“接入-汇聚-核心”三层架构,更多关注的是南北向流量,不适合以东西向流量为主的云机房,Spine-Leaf架构开始大流行;
接着,网络的设备变了,传统设备在接口和性能等规格方面不再匹配,设备商被迫卷入,开始研发新的款型;
然后,网络的协议也变了,比如出现了GENEVE之类的更为灵活的Overlay协议。
并且,云在一定程度上引爆了人工智能,人工智能反手就来补一刀,为云机房招来了大量的异构算力,进一步要求网络既要有硬件的性能,又要有软件的灵活,各类智能网卡、DPU开始流行起来,这个趋势还远未结束。
机房间,传统的自组织的网络架构和网络协议显然无法满足互联网业务的抽风特性,业务开始要求网络选边站表忠心,要么继续效忠传统的网络协议,要么服从业务软件的统一指挥,SDN开始流行起来。
机房外,SD-WAN,尤其是广义的SD-WAN,像病毒一般席卷了设备商、运营商、云厂商、CDN厂商,以及众多像声网之类的新兴厂商。
答案是总线。
既然总线可以像网络,那么网络为什么不能像总线呢?
云化的网络在某种程度上可以看成是计算机总线的外延:机房内和机房间的Fabric网络,可以看成是靠近核心计算层的总线;机房外的接入网络,可以看成是靠近外设层的总线。
只不过,计算机内部总线的承载内容,是指令和数据;计算机外延总线的承载内容,演变成了算力和算料。
这一演变,让网络拥有了前所未有的智能可能性。因为网络在历史上第一次集齐了算力、算法和算料三要素。它甚至还能进一步演变成为这个星球上最大的生命体。
因为云有遍布全球的基础设施,借助IoT技术和机器人技术,可以进一步为网络加上感知能力和响应能力,也就是进一步凑齐了所谓的sense-think-act(感知-思考-响应)智慧模型,到时候就分不清哪里是端,哪里是网,哪里是云,能感受到的整个基础设施具有灵性“活”起来了。
事实上,这不是科幻,而是正在润物细无声地发生着。
今天,我们已经能在商场、酒店、餐厅等各处看到有服务机器人在游走,虽然目前它们看上去还挺傻楞,会被大多数人无视,但它们的“感知-思考-响应”模式,绝非仅靠本体发展就能得到突破,而是必须连着边缘连着云。
①ECA(EdgeComputing Access),边缘计算接入网络,负责将本地网络接入到边缘计算系统。在短距离无线物联网场景中,本地网络也常被称为毛细血管网络(Capillary Network),这个名称可能更为形象,因为更能反映出在网络末梢进行算力和数据交换的本质。
②ECN(EdgeComputing Network),边缘计算内部网络,负责边缘计算系统的内部互联。
③ECI(EdgeComputing Interconnect),边缘计算互联网络,负责边缘计算系统之间,以及与各公有云、私有云之间的互联。
可以看到,与云网络相比,边缘计算网络最大的变化就是:网络这个所谓的管道,可能会在接入网、回传网、城域网、骨干网等各个层级被打开,因为需要放入计算嘛。
这种打开,对网络而言直接意味着,网络的连接复杂度以O(N2)级爆炸式增长。
根据Statista的预测[3],到2025年,每人每天将会产生4700多次连接互动,是2020年的近8倍。
这让传统网络的建联方式和安全方式,都面临着巨大的挑战。这也基本上意味着,网络遇到的问题,想延续老路在本领域内解决,已经变得几乎不可能了。
● 全球化:扩大协作规模是人类社会发展的基本规律,无论是原材料,劳动力,还是市场的全球化,都是企业发展或者说资本扩张的原始冲动。这些都是客观规律,不以人的主观意志为转移。懂王是想着阻挡一下,结果被华尔街的资本教育了。
● 移动化:网络的连接主体,包括人、物,甚至包括基础设施和应用本身,都在主动或被动地动起来。更为挑战的是,因为偏向2B和生产,很多场景在移动的同时,还要求保持极高的可靠性。
● 碎片化:出于投资规模、主权或者法规等限制,网络还不得不跨越多个域,多张网,多朵云。
为了简化,把所有这些挑战抽象成两个:
● 性能:网络的连接主体,逐步从人过渡到了机器,机器对快的要求就毫无人性了。边缘计算网络,尤其在近场侧,有逐步演变成为智慧应用内部总线的需要。这也正在得到整个生态的支持,诸如鸿蒙之类在设计之初就定位于万物互联的下一代操作系统,最大的特点之一就是可以将近场网络作为物物协同的分布式软总线。
屁股决定脑袋,每家公司对SASE的宣传,或多或少都会有些差别。所以,这里不会去对照某家公司的具体产品,而是会专注于趋势分析。
简单地说,SASE就是把网络功能云化,把安全功能云化,面对趋同的市场,在架构层面统一编排,并以云服务方式提供给最终用户。
听上去这似乎毫无新意,因为并没有看到任何单点技术上的任何突破。第一次看到SASE时,也是不自觉地在脑海中最先冒出那个段子:
马和骡子采访骆驼,“你如何穿越沙漠?”骆驼说:“认准目标,耐住性子,一步一步往前走,就到达目的地了。”“就这些?没有了?”马和驴问。“没有了,就这些。”“哎!”马说:“我以为它能说出些惊人的话来,谁知简简单单,三言两语就完了”。“一点也不精彩,令人失望!”驴也深有同感。
笑过之后就开窍了,这更像是一种范式层面的变化,或者说世界观的变化。人们容易觉得它平平无奇,正是因为它做起来极难。成年人应该可以理解:恰恰是学技术易,改世界观难。
那就让我们来挑几个比较典型的范式变化来看一下。你会发现,网络为了解决自身的问题,有意也好,无意也罢,变得越来越像云了。
传统的网络安全模型基于边界来构建,大致分为两步:
第二步,在各个区域的边界上,部署防火墙等设备进行边界访问控制,以此来构建一个纵深防御体系。
既然不再有清晰的边界,那么又凭什么认为所谓的“内部区域”会比“外部区域”更加安全更加值得信任呢?
这可是结构性致命的,因为只要能完成在跨越边界时的惊险一跃,之后就是一马平川,畅行无阻。
对此,SDP的想法就很直接:既然不再有清晰的边界,那我就不再费劲去找了,干脆就一不做二不休,把全世界都作为黑暗森林,把信任边界缩小到我自己。
这个想法经受住了实践的考验。2014年,CSA(云安全联盟)把SDP原型推向了全球黑客大会做公开测试,未被攻破;随后数年,CSA不断降低挑战难度,SDP还是未被攻破。
SDP为什么能这么牛?原理还得从撬锁说起。
不知道大家有没有忘带钥匙被锁家门外的经历,之前我有过一次。开锁师傅到达现场后,不到5分钟就把我家打开了,不留痕迹不破坏锁的那种,这让我当时很受触动:原来有两个平行世界,一个由循规蹈矩的普通玩家组成,一个由特殊技能的职业玩家组成。
所谓的门锁,在职业玩家面前,不过是高级一点的玩具而已。平时它们之所以有用,并不是因为它们有多强,而是因为《中华人民共和国刑法》的威慑力真的很强。
网络安全也是如此,看上去在各种边界装着各种精美的门锁,但在职业玩家面前,跟我家那把门锁相比,没有本质区别。
所以,不要想着去发明一把撬不开的锁,可能需要换种思路,比如让人摸不到锁。SDP未被攻破,就是因为黑客连SDP的门在哪都没找到。
这又是如何做到的呢?主要是基于云的方式,由SDP控制器来动态调整网络对于特定事件的闭合,从而将整个网络隐藏起来,构建了一朵外界无法看到的黑云(Dark Cloud)。
时间有限,不够讲技术细节,所以还是把“是什么”先讲透。如果能让各位有进一步去了解的兴趣,我想也就达到演讲的目的了。可以把SDP想象成《奇异博士》中的传送门:
两者都是一种按业务需要动态开启的隧道,它是动态的临时的,在它开启之前或者关闭之后,外界完全无法感知到基础设施的存在,也就谈不上攻击和破坏;
SDP比传送门更为强大的地方在于:传送门开启的空间隧道,任何人都可以看到都可以进入,包括敌人;SDP开启的网络隧道,只有特定身份在特定时间持有特定令牌才能看到才能进入。
这又有点像什么呢?它又有点像《哈利波特》中的九又四分之三月台,只有魔法师在霍格沃兹开学期间持有入学通知书才能进入。对于普通麻瓜而言,也就是普罗大众,只能看到你凭空消失了。除此之外,一无所知,所以就更谈不上去攻击和破坏了。
小结一下,SDP把基于边界的静态模型,通过架构层面的改造,变成为了基于身份的动态模型。
传统的网络安全模型,通常还会用网络地址来作为用户身份的隐式推断,比如,可能会在安全策略中,用某个IP地址来指代某个特殊人员。
但问题是,世界是丰富多彩的,场景是千变万化的,用一个干巴巴的IP地址,显然无法描绘一个有趣的灵魂——有趣的灵魂他的内心很复杂,行为也会很复杂。
与之相对的是,在SASE中身份成为了一个独立的核心业务元素。
所有的人、应用、设备都拥有一个独立的身份。以身份为中心,结合不同业务的动态上下文,例如登录时所使用的角色和凭证,登录时所处的时间和位置,登录时所用的设备类型和接入方式等,越详细越好,越立体越好,以此动态编排出所需的网络功能和安全功能,并将它们部署到身份的周围,由近到远包括:
1)分布式边缘,通常由物联网网关组合成,比如AWS的Greengrass;2)互联网边缘,通常由CDN节点改造而成,比如阿里云的ENS;3)互联网骨干,通常由运营商机房或云机房组成,比如各公有云的region。
听上去又没什么新意,以什么为中心,真的就那么重要吗?
是的,这可能是最能体现范式变化的地方。同一种业务,在不同世界观中导出的业务模型,会表现出极大的复杂性差异。
以身份为中心的作用,也是如此。范式无所谓对错,只不过当技术发展到一定程度时,就必然需要切换范式,否则无法支撑业务演进。比如,守着地心说,就无法诞生航天业务。
还有一个问题,以身份为中心,结合不同业务的动态上下文,必然会编排出非常多的网络功能和安全功能。
这么多功能,难道都要客户全部买下来吗?
设备商一听肯定会很兴奋,但用户肯定不乐意啊。客户心里想的是:不求天长地久,但求要时能有,随时要随时有。这不就是开篇所说的云嘛。
所以,你会发现,SASE特别强调云原生。云原生有着非常丰富的技术内涵,估计今天也肯定会有主题分享,所以我们还是先回到商业模式的层面来分析:
1)SASE的技术栈非常宽广,包含了大量的网络功能和安全功能,这意味着绝大部分用户都无力以传统设备的方式来自建自维,所以SASE主要会以云服务的产品形态存在;
2)因为主要以云服务的产品形态存在,为了维持云产品的核心价值,也就是敏捷、弹性、按量付费,就必然会出现所谓的轻分支重云端的趋势,也就是说,越来越多的基础设施,会从用户侧迁移到运营侧。所以,SASE不是像云,而就是一朵伪装起来的云。
可能你也发现了,我们原本是在聊网络了,但不知不觉又在聊云了,因为面向物联网和边缘计算的云网演进,让网络自己也逐渐演变成了云。
云,首先是一种商业模式,各种资源和技术,只是在提升这种商业模式的竞争壁垒而已。
显然,光靠中心云是不够的,最好是能靠近企业侧。那就又回到了NFV在企业侧遇冷的问题。
客户,供应商都在那盼望着能有这么一套分布式基础设施,但它就是在那若隐若现,若即若离。好像有,又好像没有;有时候觉得像是物联网网关,有时候觉得像是CDN节点。
但目前来看,他们都还显得有些散乱,有点像星星之火的燎原阶段。
那么有没有正规军呢?可能有,而且正在集结,它就是MEC。
云崛起的过往十年,计算已经把固网打开,翻箱倒柜折腾了一番,不过也几乎止步于此。
我想,这主要是因为:一来学计算机的多半会学计算机网络,但基本不会学移动通信;二来以往的移动通信系统,也基本是个黑盒,打开它可不是一件容易的事。
随着移动通信的并行演进,移动通信网这个黑盒正在被首次打开,面对这个庞然大物,计算和网络都很兴奋,因为在云网融合的大背景下,
MEC有着几个不可替代的优势:
1)最广的覆盖,不服可以问问今天到场的铁塔兄弟;2)最强的移动性,不服可以去打听打听在这个领域吊打IEEE的3GPP;3)全新生态,它对实现泛在智能而言太重要了,也太复杂了,必定会开辟出一套全新的软硬件生态。
当前的产品形态,基本都还停留在OP模式,也就是非常有限的私有化部署形式,还远未成熟,甚至还远未开始。
为什么,技术和产品成熟度是一方面,另一方面,还是因为大宗投资确实需要“羊毛出在狗身上,猪来买单”的模式。现在,“羊毛”和“狗”都还没找到,“猪”自然不愿意来买单。
也就是说,与当前绝大多数专深的技术领域一样,当前还缺乏足够多可以讲通的故事,所以还需要忍辱负重,需要更多耐心。不过好消息是,媒体在大力宣传的是5G,自媒体也还没盯上MEC,5G会在这个忍辱负重的阶段,替我们背负公众的骂名。
凭什么认为MEC可以拉动投资?毕竟要建这么多基础设施可真太贵了。但贵不贵这个问题,其实并不绝对。
问题可以转换为:是花6000块钱买个iPhone贵,还是花3000块钱买个诺基亚贵?
历史已经给出了答案:6000块钱的iPhone有人连夜排队,3000块钱的诺基亚无人问津。
为什么?并不是因为诺基亚的硬件不行,而是因为苹果太狡猾,他卖的就不是硬件,而是AppStore的使用权,硬件只是一个入口。能让iPhone显得不贵的局点是AppStore,能让MEC显得不贵的局点可能就是EdgeGallery。
我与EdgeGallery没有半毛钱关系,甚至都没参加过他们的活动,所以说不定对它的理解也有偏差。
我只是用EdgeGallery作为一个代称,是出于趋势分析的一种纯推荐。
我自己是在读协议时,总觉得有个逻辑没通:MEC要面对的是千行百业,各个垂直行业的差别极大,到哪去找这么多懂行的开发者?
传统程序员哪懂什么千行百业,他们甚至大多还停留在不知道自己不知道什么的阶段,千行百业的问题,可能还是需要靠发动千行百业的人自己来解决,那么可能还缺了一个统一的开发平台,最好还是低代码的,以及一个生态共赢的应用商店。
没过多久,忽然发现有个叫EdgeGallery的组织已经在干类似的事了,那种高兴,溢于言表。
这是一个基础设施大变革的时代,每个从业者都在匆匆前行。但现实是,网络也好,计算也罢,甚至包括AI,包括5G,每个单产品的成功,已经变得越来越困难了。
别忘了云带给我们的启示:客户要的从来就不是单产品,而是解决方案,是服务,是价值。
所以,欢迎在大融合的时代,多交流多合作,谢谢大家。
以下是演讲正文:
大家好,接下来由我为大家做一下分享,题目是《面向物联网和边缘计算的云网演进》。
7年无线接入网的产研经验,包括对C-RAN,Radio Cloud的一些探索和实践,对运营商的移动通信网有些了解。
4年云网融合的产研经验,包括对SDN、SD-WAN、SASE的一些探索和实践,对企业网市场也有一些了解。
目前,在华为做边缘计算网络相关的产品规划工作,方向与行业数字化转型有关。
很感谢边缘计算社区,提供了今天这次机会,能和大家交流一下关于网络演进的一些看法。以下观点仅代表个人,不代表任何组织立场。
网络需要边缘计算
● SDN产品社死
大概在今年8月份,朋友圈忽然被一条消息悲鸣刷屏:“Gartner宣布放弃SDN”。
作为一个从业者,觉得有些莫名其妙:因为这其实不是新闻,Gartner早在2019年就已经宣布过这个结论,但大家却一直憋到了2021年才情绪爆发,感觉像是一个寄托着全村希望的大小伙,在坚持了两年的委屈之后,终于破防,嚎啕大哭了一场。那大家为什么非要憋着劲呢?
因为Gartner给出的放弃SDN的理由有点奇怪:“迟迟不被市场所接受”。SDN的核心理念是“转控分离,集中控制,按需调度”,主要的产品形态是软件定义的高速通道。运营商、云厂商天然有着大量的基础设施需要运维运营,不可能不用SDN。
那么问题出在那呢?答案可能是云。
云起来之后,时代就变了。绝大部分企业都开始租用ICT资源,只需要使用云厂商和运营商提供的SDN服务即可,不会再有直接的SDN建设需求。所以,SDN更像是“产品社死,理念永生”。
● SD-WAN拥挤窒息
SD-WAN继承了SDN的遗志,把软件定义的范围,从机房内和机房间的高速通道,扩展到了机房外的广域网络,客户更加广泛。
不过,这里也有一个奇怪的现象:一方面,根据Gartner、IDC等知名机构的预测,SD-WAN2023年的全球市场规模,大致在40亿到60亿美元之间,不算太大。
但是,这里却集中了几乎所有的设备商,运营商、云厂商、CDN厂商,以及一大批细分领域的创业公司,挤得让人有点窒息。
每个巨头都守着一个千亿甚至万亿级别的市场,为什么还不放过创业公司的这点蚊子肉?
这到底是“道德的沦丧,还是人性的扭曲”?
其实都不是,还是因为那个趋势,云起来之后,巨头们忽然发现,原来的企业网慢慢不见了,SD-WAN似乎是这个领域唯一的救命稻草,要是现在不去抓一抓,那么以后企业网侧的任何机会,可能就会变成“热闹是他们的,我什么都没有”。
考虑到这一点,千军万马过独木桥,也就不奇怪了。
一方面,根据市场调研,企业纷纷表示,NFV是一个令人向往的趋势。不过当厂商开始提供NFV产品时,才发现企业原来是叶公好龙,嘴上说喜欢,身体很诚实,缺乏埋单意愿[1]。
这不是我说的,这是Gartner的调研报告说的。这个遇冷也不是一年两年了,至少在2020年还是如此。
为什么会这样?可能还是与云有关,NFV徒有云的外表,却没有云的灵魂。
网络功能是虚拟化了灵活了,但底层硬件的资产投入并没有啊。设备商说,老哥,这硬件你只用投资一次,以后就都可以复用了,老灵活了。
企业哪怕再没吃过猪肉,也是见过猪跑的,现在还没有成熟的NFV生态呢,买硬件不就是换种方式被绑定么,性价比还更低,赶紧说,不不不,你看我只要羊毛行不行,羊还是您自己留着。
归根结底,经过云的洗礼,大家都在想着只要羊毛不要羊。
● 5G风口浪尖
一方面,能感受到的是全球竞争,从国家到运营商到设备商。如果你去问设备商,最近5G的项目怎么样,设备商会表示压力山大。
这些压力真的像一些自媒体所说,来自所谓的国内政治任务吗?
至少不全是,海外运营商对部署5G的进度需求,也远超当年的4G。
另一方面,大众对5G的口诛笔伐就一直没停过,你要是敢在某乎喊一嗓子:“5G赋能千行百业很重要”,大概率会被嘲讽的口水喷死,几乎没有还嘴的可能。
为什么会出现这么搞笑的场面?
原因之一,可能是媒体和运营商对5G吹得太过了。
但更大的原因可能在于,5G与4G的性质全然不同。它在设计之初,就是以2B应用为主的。这意味着买方是极其理性的,要的是能解决实际问题的方案,而不是在那掰扯单点技术的先进性。
但从基础设施到行业应用,不是一个5G就能解决的,至少不是通信层面的5G能单独解决的,需要一系列的行业配套。
结果自然就是,枪打出头鸟,媒体把你捧得有多高,公众对你的反感就有多狠。
所以,如果单看网络,各有各的烦恼。
幸好,边缘计算来了,这是一个难得的有广泛共识的领域,大家都可以在这里找到自己的存在感。
网络需要往边缘计算,最大的需要,就是通过边缘计算来综合落地的需要。
边缘计算需要网络
这与一个更大的时代趋势有关,就是行业的数智化转型。
所谓数智化,分为三方面[2]:
数字化:通过对人、物、环境、过程等对象进行数字化,产生数据。根据IDC的预测,到2023年,会有70%的企业需要处理物联网数据;到2024年,会有380亿物联网设备在数字化这个世界。
谁相对爱提这个概念?互联网公司。
而网络化则是AIoT的支撑。什么叫支撑?做网络的朋友应该都知道,所谓支撑,就是平时没啥存在感,好不容易有存在感的时候,就是需要让我们来背锅的时候。
一个背锅的,是不配有高大上的名字的,所以我们长期被互联网公司叫做管道,业务跑好了,赢在我有互联网思维;业务出问题了,哎,你们这帮人连个管道都做不好。
好在边缘计算来了,这个所谓的管道,在各个层级被打开来承载计算。这时,也就出现了什么算力网络,算网融合之类的概念。
谁相对爱提这个概念?当然是苦管道久已的运营商。
不过,觉得这个词还是供应商视角的词,客户关心的是行业智能,并不关心谁跟谁融合;你爱跟谁融合跟谁融合,别在我面前绕来绕去。
好在5G又来了,借助移动通信的泛在连接,不知哪出来了个聪明人,发明了一个更加牛逼的客户视角的词,泛在智能。我很感谢他,网络终于在客户那,找到了一回时代级别的存在感。
云的启示
所谓大象无形,一个事物越是宏大,就越是不容易从具象上去分析,所以我们就从商业的视角来回顾一下,看看云可以带给边缘计算哪些启示。
第一个问题:云的产品本质是什么?
这个问题已经是老生常谈了,是IT的外包服务。
外包到基础设施层次,是IaaS,比如阿里云的ECS,提供的是一台带操作系统的电脑。
外包到开发平台层次,是PaaS,比如声网的RTE,提供的是一整套实时音视频软件开发平台。
外包到软件应用层次,是SaaS,比如微软的Office365,提供的是一个个具体的软件应用。
第二个问题:那为什么会有这么多IT外包需求呢?
时代级的产品必定有时代级的需求来支撑。答案是第三次产业革命。
第三次产业革命的核心正是信息技术,Information Technology,简称IT,所以海量的IT需求,正是这个时代的红利。
第三个问题:即使有海量的IT需求,那为什么产品形态会是外包服务呢,而不是客户去自建自维?
这意味着买卖双方之间,必定达成了某种强烈的商业契合。
先看买的方面,随着产业革命滚滚向前,各种业务创新越来越快,越来越复杂,承载业务的IT系统不再是几台电脑了事了,也是跟着越来越复杂,越来越庞大。
比如,谁能快速说清像滴滴打车之类应用,需要哪些IT基础设施吗;谁能快速说清高铁外卖,就是在高铁上点外卖,需要哪些IT基础设施吗。
很多专注于业务创新的客户只负责天马行空,寄希望于供应商能够提供相关的参考方案,这也进一步强化了云的服务本质,就是云特别重视解决方案,而不局限于单个产品;很多时候,这才是客户接触云的第一界面。
1)资源的规模优势,比客户自己单独去购买资源更有优势,这主要体现在全球的供应链积累以及价格谈判能力上;
2)运维的效率优势,比客户自己单独去运维基础设施更有效率,这主要体现在拥有一个庞大且专业的IT团队,足以碾压任何一个客户。
如此一来,在买方诉求和卖方优势的共同作用下,外包成为了一种理性的商业选择。同时,云产品的核心价值也就推导出来了:
1)敏捷,客户可以无需关心基础设施,可以在分钟级别内完成全球部署,从而专注到自己的业务创新;
2)弹性,客户不需要再去规划容量,预留资源,可以随时进行伸缩;
3)按量付费,客户可以将一次性的CAPEX投入变成细水长流的OPEX支出,不使用时不付费。
把这三点翻译成大白话就是:不求天长地久,但求要时能有,随时要随时有。这的确是一种理想的IT外包。
云网演进
让我们来俯瞰一下,网络发生了哪些变化:
机房内,集中了海量用户,网络需要在超大租户规模的情况下,依然具备超高带宽,超低时延,从而发生了一系列变化:
首先,网络的架构变了,传统的“接入-汇聚-核心”三层架构,更多关注的是南北向流量,不适合以东西向流量为主的云机房,Spine-Leaf架构开始大流行;
接着,网络的设备变了,传统设备在接口和性能等规格方面不再匹配,设备商被迫卷入,开始研发新的款型;
然后,网络的协议也变了,比如出现了GENEVE之类的更为灵活的Overlay协议。
并且,云在一定程度上引爆了人工智能,人工智能反手就来补一刀,为云机房招来了大量的异构算力,进一步要求网络既要有硬件的性能,又要有软件的灵活,各类智能网卡、DPU开始流行起来,这个趋势还远未结束。
机房间,传统的自组织的网络架构和网络协议显然无法满足互联网业务的抽风特性,业务开始要求网络选边站表忠心,要么继续效忠传统的网络协议,要么服从业务软件的统一指挥,SDN开始流行起来。
机房外,SD-WAN,尤其是广义的SD-WAN,像病毒一般席卷了设备商、运营商、云厂商、CDN厂商,以及众多像声网之类的新兴厂商。
答案是总线。
既然总线可以像网络,那么网络为什么不能像总线呢?
云化的网络在某种程度上可以看成是计算机总线的外延:机房内和机房间的Fabric网络,可以看成是靠近核心计算层的总线;机房外的接入网络,可以看成是靠近外设层的总线。
只不过,计算机内部总线的承载内容,是指令和数据;计算机外延总线的承载内容,演变成了算力和算料。
这一演变,让网络拥有了前所未有的智能可能性。因为网络在历史上第一次集齐了算力、算法和算料三要素。它甚至还能进一步演变成为这个星球上最大的生命体。
因为云有遍布全球的基础设施,借助IoT技术和机器人技术,可以进一步为网络加上感知能力和响应能力,也就是进一步凑齐了所谓的sense-think-act(感知-思考-响应)智慧模型,到时候就分不清哪里是端,哪里是网,哪里是云,能感受到的整个基础设施具有灵性“活”起来了。
事实上,这不是科幻,而是正在润物细无声地发生着。
今天,我们已经能在商场、酒店、餐厅等各处看到有服务机器人在游走,虽然目前它们看上去还挺傻楞,会被大多数人无视,但它们的“感知-思考-响应”模式,绝非仅靠本体发展就能得到突破,而是必须连着边缘连着云。
边缘计算网络
①ECA(EdgeComputing Access),边缘计算接入网络,负责将本地网络接入到边缘计算系统。在短距离无线物联网场景中,本地网络也常被称为毛细血管网络(Capillary Network),这个名称可能更为形象,因为更能反映出在网络末梢进行算力和数据交换的本质。
②ECN(EdgeComputing Network),边缘计算内部网络,负责边缘计算系统的内部互联。
③ECI(EdgeComputing Interconnect),边缘计算互联网络,负责边缘计算系统之间,以及与各公有云、私有云之间的互联。
可以看到,与云网络相比,边缘计算网络最大的变化就是:网络这个所谓的管道,可能会在接入网、回传网、城域网、骨干网等各个层级被打开,因为需要放入计算嘛。
这种打开,对网络而言直接意味着,网络的连接复杂度以O(N2)级爆炸式增长。
根据Statista的预测[3],到2025年,每人每天将会产生4700多次连接互动,是2020年的近8倍。
这让传统网络的建联方式和安全方式,都面临着巨大的挑战。这也基本上意味着,网络遇到的问题,想延续老路在本领域内解决,已经变得几乎不可能了。
网络面临的挑战
● 全球化:扩大协作规模是人类社会发展的基本规律,无论是原材料,劳动力,还是市场的全球化,都是企业发展或者说资本扩张的原始冲动。这些都是客观规律,不以人的主观意志为转移。懂王是想着阻挡一下,结果被华尔街的资本教育了。
● 移动化:网络的连接主体,包括人、物,甚至包括基础设施和应用本身,都在主动或被动地动起来。更为挑战的是,因为偏向2B和生产,很多场景在移动的同时,还要求保持极高的可靠性。
● 碎片化:出于投资规模、主权或者法规等限制,网络还不得不跨越多个域,多张网,多朵云。
为了简化,把所有这些挑战抽象成两个:
● 性能:网络的连接主体,逐步从人过渡到了机器,机器对快的要求就毫无人性了。边缘计算网络,尤其在近场侧,有逐步演变成为智慧应用内部总线的需要。这也正在得到整个生态的支持,诸如鸿蒙之类在设计之初就定位于万物互联的下一代操作系统,最大的特点之一就是可以将近场网络作为物物协同的分布式软总线。
安全接入服务边缘 SASE
屁股决定脑袋,每家公司对SASE的宣传,或多或少都会有些差别。所以,这里不会去对照某家公司的具体产品,而是会专注于趋势分析。
简单地说,SASE就是把网络功能云化,把安全功能云化,面对趋同的市场,在架构层面统一编排,并以云服务方式提供给最终用户。
听上去这似乎毫无新意,因为并没有看到任何单点技术上的任何突破。第一次看到SASE时,也是不自觉地在脑海中最先冒出那个段子:
马和骡子采访骆驼,“你如何穿越沙漠?”骆驼说:“认准目标,耐住性子,一步一步往前走,就到达目的地了。”“就这些?没有了?”马和驴问。“没有了,就这些。”“哎!”马说:“我以为它能说出些惊人的话来,谁知简简单单,三言两语就完了”。“一点也不精彩,令人失望!”驴也深有同感。
笑过之后就开窍了,这更像是一种范式层面的变化,或者说世界观的变化。人们容易觉得它平平无奇,正是因为它做起来极难。成年人应该可以理解:恰恰是学技术易,改世界观难。
那就让我们来挑几个比较典型的范式变化来看一下。你会发现,网络为了解决自身的问题,有意也好,无意也罢,变得越来越像云了。
软件定义边界 SDP
传统的网络安全模型基于边界来构建,大致分为两步:
第二步,在各个区域的边界上,部署防火墙等设备进行边界访问控制,以此来构建一个纵深防御体系。
既然不再有清晰的边界,那么又凭什么认为所谓的“内部区域”会比“外部区域”更加安全更加值得信任呢?
这可是结构性致命的,因为只要能完成在跨越边界时的惊险一跃,之后就是一马平川,畅行无阻。
对此,SDP的想法就很直接:既然不再有清晰的边界,那我就不再费劲去找了,干脆就一不做二不休,把全世界都作为黑暗森林,把信任边界缩小到我自己。
这个想法经受住了实践的考验。2014年,CSA(云安全联盟)把SDP原型推向了全球黑客大会做公开测试,未被攻破;随后数年,CSA不断降低挑战难度,SDP还是未被攻破。
SDP为什么能这么牛?原理还得从撬锁说起。
不知道大家有没有忘带钥匙被锁家门外的经历,之前我有过一次。开锁师傅到达现场后,不到5分钟就把我家打开了,不留痕迹不破坏锁的那种,这让我当时很受触动:原来有两个平行世界,一个由循规蹈矩的普通玩家组成,一个由特殊技能的职业玩家组成。
所谓的门锁,在职业玩家面前,不过是高级一点的玩具而已。平时它们之所以有用,并不是因为它们有多强,而是因为《中华人民共和国刑法》的威慑力真的很强。
网络安全也是如此,看上去在各种边界装着各种精美的门锁,但在职业玩家面前,跟我家那把门锁相比,没有本质区别。
所以,不要想着去发明一把撬不开的锁,可能需要换种思路,比如让人摸不到锁。SDP未被攻破,就是因为黑客连SDP的门在哪都没找到。
这又是如何做到的呢?主要是基于云的方式,由SDP控制器来动态调整网络对于特定事件的闭合,从而将整个网络隐藏起来,构建了一朵外界无法看到的黑云(Dark Cloud)。
时间有限,不够讲技术细节,所以还是把“是什么”先讲透。如果能让各位有进一步去了解的兴趣,我想也就达到演讲的目的了。可以把SDP想象成《奇异博士》中的传送门:
两者都是一种按业务需要动态开启的隧道,它是动态的临时的,在它开启之前或者关闭之后,外界完全无法感知到基础设施的存在,也就谈不上攻击和破坏;
SDP比传送门更为强大的地方在于:传送门开启的空间隧道,任何人都可以看到都可以进入,包括敌人;SDP开启的网络隧道,只有特定身份在特定时间持有特定令牌才能看到才能进入。
这又有点像什么呢?它又有点像《哈利波特》中的九又四分之三月台,只有魔法师在霍格沃兹开学期间持有入学通知书才能进入。对于普通麻瓜而言,也就是普罗大众,只能看到你凭空消失了。除此之外,一无所知,所以就更谈不上去攻击和破坏了。
小结一下,SDP把基于边界的静态模型,通过架构层面的改造,变成为了基于身份的动态模型。
以身份为中心
传统的网络安全模型,通常还会用网络地址来作为用户身份的隐式推断,比如,可能会在安全策略中,用某个IP地址来指代某个特殊人员。
但问题是,世界是丰富多彩的,场景是千变万化的,用一个干巴巴的IP地址,显然无法描绘一个有趣的灵魂——有趣的灵魂他的内心很复杂,行为也会很复杂。
与之相对的是,在SASE中身份成为了一个独立的核心业务元素。
所有的人、应用、设备都拥有一个独立的身份。以身份为中心,结合不同业务的动态上下文,例如登录时所使用的角色和凭证,登录时所处的时间和位置,登录时所用的设备类型和接入方式等,越详细越好,越立体越好,以此动态编排出所需的网络功能和安全功能,并将它们部署到身份的周围,由近到远包括:
1)分布式边缘,通常由物联网网关组合成,比如AWS的Greengrass;2)互联网边缘,通常由CDN节点改造而成,比如阿里云的ENS;3)互联网骨干,通常由运营商机房或云机房组成,比如各公有云的region。
听上去又没什么新意,以什么为中心,真的就那么重要吗?
是的,这可能是最能体现范式变化的地方。同一种业务,在不同世界观中导出的业务模型,会表现出极大的复杂性差异。
以身份为中心的作用,也是如此。范式无所谓对错,只不过当技术发展到一定程度时,就必然需要切换范式,否则无法支撑业务演进。比如,守着地心说,就无法诞生航天业务。
云原生
还有一个问题,以身份为中心,结合不同业务的动态上下文,必然会编排出非常多的网络功能和安全功能。
这么多功能,难道都要客户全部买下来吗?
设备商一听肯定会很兴奋,但用户肯定不乐意啊。客户心里想的是:不求天长地久,但求要时能有,随时要随时有。这不就是开篇所说的云嘛。
所以,你会发现,SASE特别强调云原生。云原生有着非常丰富的技术内涵,估计今天也肯定会有主题分享,所以我们还是先回到商业模式的层面来分析:
1)SASE的技术栈非常宽广,包含了大量的网络功能和安全功能,这意味着绝大部分用户都无力以传统设备的方式来自建自维,所以SASE主要会以云服务的产品形态存在;
2)因为主要以云服务的产品形态存在,为了维持云产品的核心价值,也就是敏捷、弹性、按量付费,就必然会出现所谓的轻分支重云端的趋势,也就是说,越来越多的基础设施,会从用户侧迁移到运营侧。所以,SASE不是像云,而就是一朵伪装起来的云。
可能你也发现了,我们原本是在聊网络了,但不知不觉又在聊云了,因为面向物联网和边缘计算的云网演进,让网络自己也逐渐演变成了云。
云,首先是一种商业模式,各种资源和技术,只是在提升这种商业模式的竞争壁垒而已。
多接入边缘计算 MEC
显然,光靠中心云是不够的,最好是能靠近企业侧。那就又回到了NFV在企业侧遇冷的问题。
客户,供应商都在那盼望着能有这么一套分布式基础设施,但它就是在那若隐若现,若即若离。好像有,又好像没有;有时候觉得像是物联网网关,有时候觉得像是CDN节点。
但目前来看,他们都还显得有些散乱,有点像星星之火的燎原阶段。
那么有没有正规军呢?可能有,而且正在集结,它就是MEC。
云崛起的过往十年,计算已经把固网打开,翻箱倒柜折腾了一番,不过也几乎止步于此。
我想,这主要是因为:一来学计算机的多半会学计算机网络,但基本不会学移动通信;二来以往的移动通信系统,也基本是个黑盒,打开它可不是一件容易的事。
随着移动通信的并行演进,移动通信网这个黑盒正在被首次打开,面对这个庞然大物,计算和网络都很兴奋,因为在云网融合的大背景下,
MEC有着几个不可替代的优势:
1)最广的覆盖,不服可以问问今天到场的铁塔兄弟;2)最强的移动性,不服可以去打听打听在这个领域吊打IEEE的3GPP;3)全新生态,它对实现泛在智能而言太重要了,也太复杂了,必定会开辟出一套全新的软硬件生态。
当前的产品形态,基本都还停留在OP模式,也就是非常有限的私有化部署形式,还远未成熟,甚至还远未开始。
为什么,技术和产品成熟度是一方面,另一方面,还是因为大宗投资确实需要“羊毛出在狗身上,猪来买单”的模式。现在,“羊毛”和“狗”都还没找到,“猪”自然不愿意来买单。
也就是说,与当前绝大多数专深的技术领域一样,当前还缺乏足够多可以讲通的故事,所以还需要忍辱负重,需要更多耐心。不过好消息是,媒体在大力宣传的是5G,自媒体也还没盯上MEC,5G会在这个忍辱负重的阶段,替我们背负公众的骂名。
EdgeGallery
凭什么认为MEC可以拉动投资?毕竟要建这么多基础设施可真太贵了。但贵不贵这个问题,其实并不绝对。
问题可以转换为:是花6000块钱买个iPhone贵,还是花3000块钱买个诺基亚贵?
历史已经给出了答案:6000块钱的iPhone有人连夜排队,3000块钱的诺基亚无人问津。
为什么?并不是因为诺基亚的硬件不行,而是因为苹果太狡猾,他卖的就不是硬件,而是AppStore的使用权,硬件只是一个入口。能让iPhone显得不贵的局点是AppStore,能让MEC显得不贵的局点可能就是EdgeGallery。
我与EdgeGallery没有半毛钱关系,甚至都没参加过他们的活动,所以说不定对它的理解也有偏差。
我只是用EdgeGallery作为一个代称,是出于趋势分析的一种纯推荐。
我自己是在读协议时,总觉得有个逻辑没通:MEC要面对的是千行百业,各个垂直行业的差别极大,到哪去找这么多懂行的开发者?
传统程序员哪懂什么千行百业,他们甚至大多还停留在不知道自己不知道什么的阶段,千行百业的问题,可能还是需要靠发动千行百业的人自己来解决,那么可能还缺了一个统一的开发平台,最好还是低代码的,以及一个生态共赢的应用商店。
没过多久,忽然发现有个叫EdgeGallery的组织已经在干类似的事了,那种高兴,溢于言表。
这是一个基础设施大变革的时代,每个从业者都在匆匆前行。但现实是,网络也好,计算也罢,甚至包括AI,包括5G,每个单产品的成功,已经变得越来越困难了。
别忘了云带给我们的启示:客户要的从来就不是单产品,而是解决方案,是服务,是价值。
所以,欢迎在大融合的时代,多交流多合作,谢谢大家。
参考资料