Arm推出人工智能优化的Arm终端计算子系统以及新的Arm Kleidi软件,重新定义移动端体验
扫描二维码
随时随地手机看文章
● Arm® 终端计算子系统(CSS)作为新的计算解决方案,结合了Armv9架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新Arm CPU和GPU实现,可赋能芯片合作伙伴快速创新,并加快产品上市进程。
● 凭借新一代Arm Cortex®-X CPU,人工智能(AI)优化的Arm终端CSS带来最高的IPC同比提升,性能提高36%;新的Arm Immortalis™ GPU的图形性能提高37%。
● 新的KleidiAI软件与热门的人工智能框架集成,致力于提供无缝的开发者体验;搭配Arm CSS 的 KleidiAI通过Neon™、SVE2和SME2等一系列Arm的加速技术,能显著提高计算应用的性能。
5月30日,Arm控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)宣布推出Arm终端计算子系统(CSS),以提供领先的人工智能(AI)体验,助力芯片合作伙伴更轻松、快速地构建基于Arm架构的解决方案,并加速其产品上市进程。Arm终端CSS为旗舰系统级芯片(SoC)提供基础计算要素,其具备最新的Armv9 CPU、Arm Immortalis GPU、基于三纳米工艺生产就绪的CPU和GPU物理实现,以及最新的CoreLink™ 系统互连和系统内存管理单元(SMMU)。此外,今日同步推出的Arm Kleidi将有助于软件开发者无缝取得Arm CPU上的最佳性能,其包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。
Arm高级副总裁兼终端事业部总经理Chris Bergey表示:“Arm平台秉承了Arm DNA的能效理念,随着AI时代的加速发展,它正为下一波计算需求奠定根基。Arm终端CSS在平台功能方面实现了显著进步,持续突破高端移动端体验的极限。”
前所未有的CPU和GPU性能和效率
Arm终端CSS是迄今速度最快的Arm计算平台,提升了30%以上的计算和图形性能,以应对要求苛刻的实际用例中的安卓工作负载,同时也提高了59%的AI推理速度,适用于更广泛的AI/机器学习(ML)和计算视觉工作负载。
Arm终端CSS的关键在于Arm目前性能最强、效率最高、功能最广泛的CPU集群,带来最佳的性能和能效。新的Arm Cortex-X925实现了Cortex-X系列推出以来最高的同比性能提升,该CPU利用了领先的三纳米工艺节点,在3.8GHz的时钟速率和最大缓存大小的条件下,与2023年旗舰智能手机的四纳米SoC相比,其单线程性能大幅提高36%。而在AI性能方面,Cortex-X925取得了惊人的41%性能提升,可显著提高如大语言模型(LLM)等设备端生成式AI的响应能力。
新的Arm Cortex-A725 CPU将对前沿性能的不懈追求与出色的效率相结合,该CPU将针对AI和手游用例的性能效率提高了35%。这一改进也得益于更新后的Arm Cortex-A520 CPU和更新后的DSU-120,使得采用最新Armv9 CPU集群的消费电子设备可提升能效和可扩展性。
新的Arm Immortalis-G925 GPU是Arm性能最强、效率最高的GPU,在各款领先的手游应用中实现了37%的性能提升,并在多个AI和ML网络上提升了34%的性能。Immortalis-G925面向旗舰智能手机市场,而包括Arm Mali™-G725和Mali-G625 GPU在内的全新高可扩展性GPU系列,则面向从高端手机到智能手表和XR可穿戴设备等广泛的消费电子设备市场。
为实现卓越的开发者创新优化软件
Arm始终关注全球数百万的开发者,确保他们能够获得打造下一波AI应用所需的性能、工具和软件库。为了使开发者能够以最高性能快速实现这些创新,Arm推出了Arm Kleidi,其中包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。KleidiAI是一套面向AI框架开发者的计算内核,使他们能够在各种设备上轻松获得Arm CPU上的最佳性能,并支持Neon、SVE2和SME2等关键Arm架构功能。KleidiAI与PyTorch、Tensorflow、MediaPipe等热门AI框架集成,旨在加速Meta Llama 3、Phi-3等关键模型的性能,并且还可前后兼容,以确保Arm在引入更多技术时依然能适用未来市场的需求。
面向未来AI的计算平台
通过将前沿的CPU和GPU技术、生产就绪的物理实现和持续的软件优化独特结合,Arm终端CSS加之Kleidi软件,将为未来AI提供计算平台,而Arm正是这一未来的基石。
###
合作伙伴证言
“英特尔代工与Arm深度合作,此次发布彰显了Arm在终端业务上的进展。我们双方在Intel 18A工艺等前沿技术节点上密切合作,以提供一流的功率、性能和面积指标,并基于新的Arm终端CSS赋能新一代移动端SoC产品。”
——英特尔代工副总裁兼生态系统技术办公室总经理Suk Lee
“我们将于今年下半年推出新一代旗舰移动芯片天玑9400,该芯片将搭载最新的Armv9 Cortex-X925 CPU和Arm Immortalis-G925 GPU。我们与Arm保持着长期而紧密的合作关系,致力于不断提升移动芯片的性能和功能,共同推动计算技术的快速发展。”
——联发科技资深副总经理、无线通信事业部总经理徐敬全博士
“在移动端设备中嵌入生成式AI功能是客户的主要需求,这就需要将顶尖的芯片技术与领先的计算解决方案相集成。Arm Cortex-X925 CPU解决方案与三星代工厂最新的三纳米GAA工艺节点相结合,可以满足这一需求。我们与Arm的长期合作伙伴关系使我们能够在最大化DTCO和PPA方面从早期便开始展开紧密合作,从而按时交付芯片,并满足性能和效率需求。”
——三星电子执行副总裁兼代工设计平台开发主管Jongwook Kye
“三星与Arm不断挑战技术现状,并持续突破移动端的发展极限。AI的日益普遍改变了整个行业和社会,我们将继续开发前沿技术,以促进和丰富人们的日常生活。我们很高兴能与Arm合作,共同开启移动端AI的新篇章,让世界各地的人们都能在其设备上享有更多的AI计算性能。”
——三星电子总裁兼移动体验(MX)业务主管卢泰文(Roh Tae-moon)
“AI优化的Arm CSS是Arm与台积公司的一个合作典范,共同助力芯片设计商实现前所未有的性能和能效,突破面向AI的半导体创新极限。通过与Arm以及我们开放创新平台(OIP)生态伙伴携手合作,我们能够提供最先进的工艺技术和设计解决方案,赋能客户加速AI创新。”
——台积公司生态系统与合作联盟管理部门负责人Dan Kochpatcharin
“vivo非常注重用户体验,在Arm CSS的技术基础之上,我们与Arm的密切合作,共同推动开发者生态,使手机更流畅更好用,同时也为设备端带来了前沿的AI体验。我们很高兴看到Arm终端CSS所引入的新方向,以及通过Armv9 CPU与Arm GPU,这套计算子系统将赋能新一代设备端生成式AI,从而实现沉浸式的智能移动端解决方案。”
——vivo首席芯片规划专家夏晓菲