有DPU了,为什么英特尔还要出IPU?
扫描二维码
随时随地手机看文章
数据量跨越式增长时代下,许多额外的工作涌入云数据中心服务器,而其中存在并非应用级的处理,仅仅是将数据包进行传输处理。这些工作会挤占CPU资源,将大量CPU处理能力耗费在应用之外。因此,SmartNIC(智能设备)就诞生了,为了卸载被挤占的网络、存储和计算资源。
一些厂商坚定站队FPGA,将FPGA的SmartNIC做到了一体化,一张卡实现网络、存储和计算加速融合。一些厂商则重新定义DPU(数据处理芯片),解决服务器数据交换效率低、数据传输可靠性低、数据中心模型执行效率低、I/O切换效率低、服务器架构不灵活以及网络不安全的问题。
英特尔则重新定义这种技术为IPU((InfrastructureProcessingUnit,基础设施芯片),“在大多数情况下,IPU从财务角度来说对于云服务提供商极具吸引力”,Guido Appenzeller英特尔公司数据平台事业部首席技术官如是说。
为什么偏偏是IPU
在介绍IPU之前仍需探求根源,既然业界已经存在了SmartNIC,英特尔为什么要做IPU?Guido告诉记者,从术语上来看,IPU相比SmartNIC具有本地控制平面。这意味着,IPU在本质上是可以控制CPU的,当CPU想在网络上发送数据包时,IPU将确保此数据包位于特定的虚拟覆盖网络上,由IPU控制PCI总线,将虚拟设备展示给CPU。SmartNIC更偏向卸载,一切都由CPU编程,CPU将会管理这一切的加速流程。
另外,一些企业命名DPU,为什么英特尔要叫IPU?根据Guido的分析,二者最终的目的是相同的,但IPU的作用是处理基础设施功能,这是与众不同之处,而DPU的命名将范围缩小到“数据”这一范围,反而并不是非常准确的描述。
实际上,英特尔的IPU不仅在命名上更加清晰,在整体产品线上也非常清晰,非常贴合英特尔自身的IDM优势。
英特尔官方将IPU定义为一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器(CPU)方面的开销,并充分释放性能价值,它能够对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能。利用IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
换言之,过去软件都在相同的芯片上运行,现在把不同任务分开到IPU和CPU两种芯片上运行。Guido为记者举了一个非常易懂的例子:“这有点像家和酒店的区别,在家中,客厅、厨房、餐桌都在一个大区域内,可以方便地从一个地方移步到另一个地方。但在酒店中,客房和餐厅是分开的,客房内没有厨房,而作为客人的也不会进入厨房。我在餐厅吃饭,而厨师在厨房中工作。酒店客人和工作人员是分开的。数据中心也是这样的发展趋势,运行租户工作负载的芯片和运行云服务提供商的软件的芯片正在逐步分离。”
而具体从优势上来说,IPU拥有三大优点:
1、IPU充当服务器的控制面。这意味着它运行的是云服务提供商的软件,可以保护、控制CPU或将其进行隔离。
2、IPU针对基础设施功能进行了优化,效率极高。
3、可以过渡到无磁盘架构。“IPU非常聪明的地方在于,存储服务器和服务器上的工作负载之间的实际存储流量是在高速路径上进行的,这意味着不会涉及IPU或CPU上的任何CPU内核”,Guido这样为记者介绍。
IPU的两种实现形式
英特尔是业界唯一拥有CPU、独立GPU、ASIC、FPGA、各种加速器的企业,因此从实现来说,英特尔也非常贴合自己的优势,分成了两类。一类是ASIC IPU,另一类是基于FPGAIPU。在2021年的架构日上,英特尔发布了全新的IPU架构产品,也包含了一款非IPU的智能网卡。
1、ASIC IPU
据Guido介绍,MountEvans是英特尔的首个ASICIPU。MountEvans是与一家顶级云服务提供商共同设计和开发的,它融合了多代FPGASmartNIC的经验。
Guido为记者介绍了这款产品的强大之处,MoutnEvans支持200Gb/s的吞吐量,能够最多四个至强主机连接起来。英特尔意识到云对性能的需求,将推动存储、消息处理和高性能计算等很多应用迁移到基于RDMA的协议上,通过实现ROCEv2以及我早前提到的全新可靠传输技术,英特尔可以轻松完成这种迁移。另外,Mount.Evans提供InlineIPSec,以保护网络上发送的每一个数据包。
尤为引起注意的是,其上的计算复合体是基于ARMNeoverse架构的N1Ares内核。这16个高频率内核附带由三个LPDDR4控制器支持的大型系统级缓存。这个计算复合体与网络子系统密切结合,使得网络子系统加速器能够把系统级缓存用作最后一级缓存,以及提供两者之间高带宽、低时延连接;并能够灵活地整合硬件和软件数据包处理。
当然,这一IPU还吸收了至强处理器的优势,Lookaside加密与压缩引擎源作为英特尔的QuickAssist技术,IPU针对使用模式对其进行了修改,其中包括对Zstandard压缩算法的支持。
2、FPGA IPU
据Guido介绍,OakSpringsCanyon是一个IPU参考平台,基于英特尔®至强D处理器(Intel®Xeon-D)和拥有业界领先的功率、效率、性能的英特尔®Agilex™FPGA构建。Guido非常自豪地为记者说:“我们对这款产品非常有信心,它适用于超大规模云部署。”
具体来说,OaksSpringsCanyon是一个基于FPGA的IPU,其中采用了英特尔的AgilexFPGA和Xeon-D片上系统。值得一提的是,AgilexFPGA拥有业界领先的功率、效率和性能,搭配至强服务器,提供卸载2x100G工作负载所需的性能以及专为x86优化的丰富软件生态系统。
OakSpringsCanyon采用了英特尔®开放式FPGA开发堆栈(英特尔®OFS),这是一个可扩展、开源软硬件基础设施堆栈。OakSpringsCanyon能够满足新兴云服务提供商对于部署100GB工作负载的需求。
3、SmartNIC
除了IPU,英特尔还发布了一个非IPU的产品,称之为智能网卡。即英特尔N6000加速开发平台,代号为“ArrowCreek”,这款产品也是基于FPGA的。
Guido为记者介绍,ArrowCreek没有CPU,是一个基于Agilex FPGA和e810 100GB以太网控制器的加速开发平台,并不能用作IPU。这款产品更多地用于通信服务场景。
IPU未来将走向何方
从产品中,能够看到英特尔将产品分为ASIC和FPGA两类。根据Guido的解释,FPGA对比ASIC有各自的优劣势。
“如果FPGA带来最大的灵活性。如果你希望实施一个特别的算法,就可以用FPGA。这对于很多云来说很重要,因为目前排名前八的云全都使用不同的专有存储协议。如果是只有您使用的专有协议,那么选择FPGA是合理的,因为专用芯片很明显不支持这种做法。而FPGA的一个劣势是,它们很难编程。因此,您需要一个相当强大的团队。吞吐量、功耗在一定程度上受到限制。我们认为,随着带宽变高,趋势是使用更专用的ASIC IPU”,他这样为记者分析。
简言之,想要最高的灵活性就使用FPGA IPU,想要更高的带宽并且拥有专用的协议就使用ASIC IPU。不过Guido认为,绝大多数云未来会更加偏向使用ASICIPU。
业界拥有一些厂商在整合IPU和GPU以及其他器件,Guido认为,目前不确定英特尔会不会这么做。他表示,对于英特尔来说,特别是在云上,云服务提供商最感兴趣的是同类最佳的单用途设备,所以可能选择IPU来搭配图形加速器,也可选择IPU搭配AI加速器,或者选择IPU搭配CPU,但基本上专用的系统。所以未来可能将是IPU和其他种类加速器结合的趋势。
从整体市场来看,Guido表示,IPU或是DPU已成为一些创业公司的热门方向,有几家创业公司正在开发该领域的技术,且拥有许多有趣的技术和有趣的产品,这对所有厂商来说都是非常有益的。同样,英特尔也对自身所处的市场地位非常满意,他认为这将是一个大市场。从长远来看,云端的几乎每个服务器都会有类似IPU的东西。
“这显然是一个很大的市场。渐渐地,这不再是一个初创市场,而是一个由大公司主导的市场”,Guido如是说。