赛灵思:下一代数据中心将会注重可组合性
扫描二维码
随时随地手机看文章
“摩尔定律放缓”甚至激进派的”摩尔定律已死”这种说法自从十几年前就广为“传颂”,面对这种瓶颈,主流厂商所走的路一条是异构计算,另一条则是“小芯片”或名为“芯粒”(Chiplet)。由此,数据中心所引发的新一轮计算革命掀起。
事实上,观察行业巨头“小芯片”的行径,最终走向总归是组合化的。“小芯片”正是因为像搭积木一样,将预设特定功能芯片裸片进行封装复用以构建新IP,这种集成系统能够成为一种新型“超异构系统”,这种灵活性不失为延续摩尔定律的“组合拳”。
这种组合式的思路不仅适合于芯片发展,同样也适用于数据中心。“我们相信下一代的数据中心,会对组合性有非常高的要求,从基础设施一直到器件这个层面,都会要求可组合性”,日前,赛灵思(Xilinx)数据中心事业部网络与存储产品管理总监Kartik Srinivasan在赛灵思的2021春季新品发布会上如是说,围绕可组合性数据中心也推出了三个具体的解决方案。
可组合的SmartNIC
去年三月同期,赛灵思宣布推出业界首款一体化SmartNIC平台Alveo U25,旨在卸载数据中心内部横向流量的问题,防止挤占CPU资源。彼时该款产品拥有2个25Gb以太网端口,且是ZYNQ级器件,拥有超过52万+LUT。
今年三月,赛灵思继续推出Alveo SN1000(下文简称SN1000),这是业界首款硬件可组合式SmartNIC。该款产品最大的亮点是其可组合性,支撑SN1000的是三个坚实的“地基”:
其一,SN1000基于UltraScale+ FPGA架构,拥有赛灵思FPGA的灵活应变能力,是保障其性能的“底气”;其二,拥有控制面与数据面分离的特性,是赋能硬件可组合的充要条件;其三,拥有vitis Networking软件,让用户充分利用可组合式功能,进行软件定义硬件加速,软件不仅支持P4高级语言编程,也支持C/C++对Arm进行控制和流量管理。
在参数上,以太网端口升级成2个100Gb,拥有1M LUT、2x QSFP28的封装尺寸和75W的低功耗,搭载核Arm SoC的NXP LX2162 16-core A72。
Kartik Srinivasan为记者介绍,SN1000是一款开箱即用且即插即用的产品,其背后的秘诀是赛灵思预先对硬件进行了OVS加速、网络虚拟化安全加速和存储加速等。
对于其重点可组合性上,Kartik Srinivasan介绍表示,SN1000支持客户根据不同要求进行灵活组合和加速,这归功于内存既支持数据面也支持控制面,通过这样的双向支持能够让数据面实现管理和加速,在控制面实现ARM的CPU进行加速,以达到高效便捷的安全分离和迁移,是行业积极拥抱异构计算的典范。
专家预测2024年可编程的SmartNIC将占市场的70%,那么以FPGA为核心的SmartNIC有什么不同?Kartik Srinivasan表示,从传统或标准的NIC到卸载NIC再到可编程SmartNIC,最早采用SmartNIC技术的是超大规模的数据中心和云服务提供商,包括百度、阿里、腾讯,这些提供商在快节奏的变革和多样化网络功能中,拥有很多要求,特别是线速性能的数据包处理方面,以实现加速网络、安全和存储卸载这三个功能。
SmartNIC主要包括FPGA、ASIC、CPU/SoC三种,但ASIC的实现方案缺乏定制能力,很难跟上每间隔12-18个月就产生很大变化的速度演进,CPU/SoC又难以实现硬件加速的要求和性能。因此,FPGA的灵活性和强大的加速能力成为了首选。
在SN1000这一“萌新降生”后,目前Xilinx在NIC系列上拥有X2、U25、SN1000三个平台,分别应对不同对场景和供客户选择。
可组合的AI视频分析
本次发布会,赛灵思还发布了赛灵思智能世界视频分析平台Xilinx Smart World,之所以发力这一方面是AI视频分析对时延和算法复杂性拥有极高要求,诸如口罩检测、人员计数、病患监控、工业安全、零售分析、门禁控制等方面均有强劲需求。
根据赛灵思数据中心部亚太区数据中心战略营销经理Guruprasad M. Parthasarathy的介绍,该解决方案着重两个关注点:其一,去掉FPGA硬件开发,客户只需相关应用开发即可;其二,赛灵思联合生态合作伙伴提供了随时可部署的视频分析解决方案,方案支持智慧城市、智能医疗、智能零售等重要领域部署。
赛灵思智能世界坚实的后盾是其Alveo器件系列,方案拥有两个优势:其一,拥有总拥有成本(TCO)优势,据Guruprasad介绍,与其竞品英伟达T4 GPU相比,能够降低30%的总拥有成本;其二,拥有时延优势,与其竞品英伟达T4 GPU相比能够在16流上提速77%,32流上提供71%。
值得一提的是,赛灵思智能世界应用将可在VMSS平台上直接进行应用的开发,这是一个高度可扩展的平台,该平台不仅拥有极低的时延,还拥有极强的扩展性,在机器学习和人工智能算法复杂性增时也可同时并行多种模型和算法,不会影响端到端的性能。
Guruprasad表示,平台拥有许多合作伙伴,包括Mipsology、deepAI、Aupera,这些伙伴开发的视频解决方案能够成功帮助客户应用搭建,并且各个伙伴的视频解决方案各具特色,可供客户按需选取。
Guruprasad列举了腾讯WeLink的智能楼用例,该方案采用了合作伙伴的Aupera的解决方案,采用方案之前视频流和互联网数据都会放腾讯云汇总进行处理,这不仅拥有极高的成本也过度消耗了云计算。在采用Aupera方案后,实现在本地边缘推断,大大降低了时延,同时使得带宽的成本降低了90%,目前方案已成功部署5000个摄像头,实现了人脸识别、口罩检测等功能。
通过该方案可以看出,赛灵思智能世界的核心是开箱即用和即插即用,赛灵思正在赋能Alveo加速卡在应用层面的可组合,以充分发挥其成本和低时延特性。
赛灵思加速算法交易
赛灵思还推出了赛灵思加速算法交易,这一解决方案的核心概念也是开箱即用和即插即用,即在应用开发上的可组合。不过赛灵思智能世界聚焦的是AI视频分析,赛灵思加速算法交易则着重“算法交易”或“HFT高频交易”领域。
据赛灵思数据中心市场营销总监Ed Wright介绍,当今的算法交易其实主要存在硬件算法交易和软件算法交易两种,二者在能力和性能上拥有重大鸿沟,且软件算法交易如若想转换成硬件算法交易的门槛是极高的,需要专门的硬件开发商在IT进行架构和设计。这样势必拥有极高的成本和极长的交付期,伴随而来的风险是极高的。
赛灵思加速算法交易便可在无需硬件开发情况下,实现非常复杂的策略,且让交易者能以少于微秒(sub-microsecond)的时延实施先进策略。
Ed Wright表示,在赛灵思的vitis平台上,开发者可用模块化的方式构建部署基于FPGA的Alveo加速卡,平台不仅支持库的自由组合,还支持非常广泛的算法交易用力,在此层级上可继续部署算法交易的框架和IP。
在算法交易市场上,之前多是CPU驱动,但相比FPGA使用CPU仍然拥有较长的交付期和较高的成本。值得一提的是,CPU驱动的算法交易缺乏市场竞争,在FPGA突入这样的市场空白之下,既能够缩短上市时间还能提供强力有力的竞争。
赛灵思加速算法交易适用于经纪人、交易所、市场数据厂商、销售侧厂商、自营交易商等不同机构用户,能够为其提供算法迥异、智能订单路由、市场数据门户、FIX门户、进行交易、交易前风险、会场数据加速器等服务。
部署赛灵思加速算法交易也非常便捷,只需通过赛灵思渠道的经销商和分销商购置Alveo U50或Alveo U250,从Xilinx.com下载开源算法,无需任何许可证费用即可立即使用赛灵思加速算法交易。
总结
在可组合上,本次赛灵思2021年春季发布推出了Alveo SN1000 SmartNIC、赛灵思智能世界、赛灵思加速算法交易三款可组合式数据中心平台产品,聚焦于软件定义和硬件加速。
除此之外,Xilinx App Store也一并被发布,根据Ed Wright的介绍,该应用商店不仅能够方便地消费选择应用,还能方便地将方案推给客户,预计赛灵思应用商店将成为客户优选的购买和部署加速应用的新方式。
在可组合概念逐渐深化之下,行业掀起一股新的浪潮,赛灵思的三款平台产品也拉开了可组合性数据的序幕。通过赛灵思的部署来看,三款新平台的核心除了可组合,还聚焦了开箱即用和即插即用这一概念。彼时,FPGA开发因其入门难度抵挡了许多开发者的脚步,赛灵思着重降低硬件开发的比重,从而让开发应用成为“主战场”。
记者认为,当FPGA普适于不同层级的开发者,开发重点愈发趋向应用本身,FPGA的低延时、高性能、灵活性和总拥有成本的优势将逐渐填补传统计算领域空白,使得开发者有更广的选择空间。