基础设施处理器(IPU):云服务提供商的全新战略资源
扫描二维码
随时随地手机看文章
越来越多的现代云数据中心内的工作负载正在按照微服务集合的结构进行整合。虽然微服务导向的架构有很多好处,但也因为聚合的特点而造成了大量的通信开销,而用于这种基础设施开销的CPU循环不会为云服务提供商产生收入。Srirama、Dhanota等人近期发表的一篇论文发现, 超大规模数据中心的微服务开销高达31-83%1,如下图所示。
在某些情况下,绝大多数CPU循环用于开销
英特尔近期发布了基础设施处理器(IPU)。通过基于IPU的架构,云服务提供商可以把基础设施任务从CPU转移到IPU,而释放的服务器CPU循环可用于处理能够产生收益的任务,这样就可以将从数据中心获得的收入最大化。通过把基础设施任务转移到IPU,云服务提供商可以把服务器CPU全部租赁给客户。
云数据中心就像酒店,而不是家
我们可以用酒店和家进行简单的类比,这有助于解释工作负载所有权的划分,而正是这种划分推动了IPU的发展。在我的家里,我希望能够轻易地从客厅走到厨房或餐桌,因此我们设计了一个开放式的厨房,将所有功能都集中在一个大房间中,这样我们就可以轻松地从一个区域转移到另一个区域。
酒店则不同,客房、餐厅和厨房是不同的区域。酒店员工的工作区域与酒店客人的餐饮、休憩和会议区域严格分离。通常,酒店里会有很多道门将内部不同的功能区分开,有时出于安保原因,你甚至需要佩戴胸牌才能穿过宾客区和员工区之间的门。
酒店和独立住宅拥有不同的设计
类似于酒店划分住客和员工活动的不同区域,包含IPU的数据中心架构也对租户和云服务提供商的工作负载进行区隔。通过把IPU引入数据中心来实施基础设施功能,云服务提供商的基础设施工作负载将在IPU上运行,这就解除了服务器CPU的负担,使其用于运行更多租户的应用。
基于IPU的数据中心架构具备以下几大优势:
• 可以严格分离基础设施功能和租户的工作负载,更好地隔离这些功能将大大加强系统安全。
• 租户可以全面掌控服务器CPU,并获得其全部的性能。
• 基础设施工作负载的飙升不再会造成服务器CPU的性能问题。如上面的统计所示,这一问题在传统数据中心的架构模式下日趋严重。
• 通过把基础设施任务从CPU转移到IPU,可以让服务器CPU处理可以产生收益的任务,云服务提供商可以从数据中心获取最大化的收入。通过把基础设施任务转移到IPU,云服务提供商可以把服务器CPU全部租赁给客户。
• IPU专门处理基础设施任务而不是通用任务,它可以应用硬件加速并更精细地优化计算,从而大幅提高性能和能效。
• IPU能够让云数据中心实现全面的无磁盘服务器架构。在传统的企业数据中心架构中,每台服务器拥有自己的一套磁盘驱动器和固态盘。
由于难以预测每个租户的存储使用情况,在传统数据中心架构中,每台服务器必须超额配置存储资源,才能应对高峰期存储负载。在无磁盘服务器架构下,中央服务为所有租户提供存储资源。下图显示了一种可能的无磁盘服务器架构。
通过网络利用虚拟存储进行扩展
管理一项中央存储服务比管理数据中心中数十万台服务器的存储资源要容易得多,效率也高得多。
数据中心演进
几年来,英特尔与包括微软、百度、京东和 VMware 在内的大型云服务提供商紧密合作,持续推动数据中心产品的创新与演进。通过基于英特尔® 至强® D处理器、英特尔® FPGA 和以太网组件的产品,我们成为IPU市场的量产领先者。英特尔与超大规模合作伙伴联手,设计推出了第一代 基于FPGA的IPU 平台,并且已经部署在多个云服务提供商自有并负责运营的数据中心内。
在FPGA产品进入IPU领域的五年间,我们观察到超大规模云服务提供商正在分阶段实现IPU的价值:
• 第一阶段:加速网络——把虚拟交换机和防火墙等常见网络任务从服务器CPU转移到IPU。把流量查找和封装/解封等用户面功能(UPF)从CPU转移到IPU,从而释放CPU循环。
• 第二阶段:加速存储——把存储堆栈从服务器CPU转移到IPU,提高了存储吞吐量,并降低了存储的复杂性、开销和管理负担。
• 第三阶段:加速安全——转移加密/解密、压缩和其它消耗服务器CPU循环的安全功能。(这些安全功能经常与第二阶段转移的存储功能搭配)。此外,IPU可以开启主机系统的启动和配置,而通过隔离安全功能和提供与CPU分离的信任根,此举可以进一步加强安全。
• 第四阶段:基础设施处理——或许是最精妙的用途,把虚拟机管理程序服务管理功能从CPU转移到IPU。
目前的基于FPGA的英特尔IPU 将英特尔® Stratix® 10 FPGA 和英特尔至强 D 处理器进行整合。它们将优化的加速器(基于可配置、基于 FPGA 的数据路径)与软件可编程 的CPU 相结合,可以安全地加速和管理数据中心的基础设施功能。
这种混合 IPU 架构可以以硬件的速度进行网络管理,其超高的软件灵活性可以使用户更轻松地实施控制面功能。使用 FPGA 板载资源的基于硬件的数据路径和基于软件的控制平面与 IPU 的板载处理器上的基础设施 OS 堆栈一起运行的可编程性使这些 IPU 变得强大。基于硬件的数据路径(使用FPGA的板载资源)和基于软件的控制平面(与IPU的板载处理器上的基础架构操作系统堆栈一起运行)所提供的可编程性使得IPU具有强大的性能表现。 而IPU 与 SmartNIC 的不同之处在于,它是一个安全、独立的控制点,租户工作负载无法直接访问。
英特尔未来的IPU和智能网卡
未来,我们将推出更多基于FPGA的IPU平台和专用 ASIC,这些解决方案建立在强大的软件基础之上,使云运营商和生态系统厂商能够构建领先的云编排软件。在近期举行的英特尔架构日上,我们为IPU系列引入了两个新的成员——Mount Evans 和 Oak Springs Canyon,以及此前代号为 Arrow Creek的英特尔 N6000 加速开发平台。
作为成功的 Big Spring Canyon 平台的后续产品,Oak Springs Canyon(OSC)是一个基于英特尔® Agilex™ FPGA的平台,其目前在性能、功耗和工作负载效率方面领先整个FPGA行业2。OSC 与基于英特尔至强CPU的服务器协同工作,提供卸载2x100G 工作负载所需的基础设施加速。OSC 拥有丰富的软件生态系统,并针对英特尔® CPU进行了优化,同时还采用了英特尔开放 FPGA 堆栈,这是一个可扩展、开源软硬件基础设施堆栈,使我们的合作伙伴和客户能够开发定制的解决方案。OSC的能力和特性能够满足新兴云服务提供商对于部署100GB工作负载的需求。
英特尔的另一个新开发项目是此前的代号为 Arrow Creek的英特尔 N6000 加速开发平台,它是一个基于 FPGA 的智能网卡100GbE网络加速开发平台(ADP)。它是在英特尔® FPGA 可编程加速卡(英特尔® FPGA PAC)N3000取得成功的基础之上开发的,后者目前已经被部署在一些世界顶级通信服务提供商运营的数据中心内。基于英特尔Agilex FPGA 和英特尔® 以太网控制器E810,这个全新的英特尔N6000加速开发平台,将能够与基于英特尔处理器的服务器搭配使用,并支持多种类型的基础设施任务,以帮助电信运营商提供灵活的加速工作负载,例如Juniper Contrail、OVS 和 SRv6。
英特尔宣布了第一款 ASIC IPU,代号为Mount Evans,是我们与大型云服务提供商联合设计开发的。Mount Evans IPU基于同类最佳的数据包处理引擎,能够在ASIC上进行实例化,它支持大量的现有使用场景,例如vSwitch卸载、防火墙和虚拟路由,并为未来使用场景留出显著空间。通过扩展英特尔经过验证的高性能傲腾NVMe控制器而开发的另外一项技术让Mt. Evans能够模拟NVMe设备。 在FPGA IPU上运行的相同英特尔基础设施操作系统也将能够在Mount Evans上运行。
下一代可靠传输协议以及我们先进的加密和压缩加速器也都是 Mount Evans IPU的其它技术创新。我们与云服务提供商合作伙伴在下一代可靠传输协议上进行了联合创新,以解决有损网络上的长尾时延问题。
IPU:云服务提供商新的战略性资源
IPU是英特尔云计算战略中的一个战略性组成部分。我们领先的IPU产品组合为通用基础设施奠定了基础,使我们的云客户能够在不久的将来,在异构数据中心架构中充分利用其通用计算、XPU和加速资源。这些功能的融合完美契合了持续的微服务发展趋势,并提供机会来构建与高速硬件网络组件和通用软件框架相匹配的优化、基于功能的基础设施。IPU 为云服务提供商提供了重新布局数据中心架构、加速云计算以及在数据中心的每个服务器 CPU上托管更多创收服务,即在虚拟机上运行租户应用程序的机会。
凭借其提高性能、降低成本和提供更好的云数据中心架构的能力,我们认为 IPU 将成为未来数据中心设计的战略元件。
作者:Patricia Kummrow,英特尔公司网络与边缘事业部副总裁兼以太网产品部总经理