Arm 2023全面计算解决方案,为移动开发带来无限可能!
扫描二维码
随时随地手机看文章
在AI技术的加持下,智能手机的应用软件逐渐增多,其功能也越来越强大。目前,AI在手机中的应用有智能语音、生物识别、图像识别,以及视觉和触觉交互等。然而,在智能手机开始应用AI技术的同时,也对计算与存储能力提出了更高的要求。
为了满足日益增长的AI算力需求,近日Arm推出了2023全面计算解决方案(TCS23),旨在赋能下一代旗舰智能手机,助力拓展数字生活新生态。
据了解,该解决方案集三大优势于一身,即采用了全新的第五代GPU架构、涵盖了全新的Armv9 CPU集群,以及实现了软件开发的创新升级。
为了让大家全面地了解这一解决方案,在Arm技术媒体沟通会上,Arm高级副总裁兼终端事业部总经理Chris Bergey以及Arm中国区业务全球副总裁邹挺对其进行了详细的介绍,并探讨了相关领域的终极用户体验,以及未来计算的发展方向。
▲Chris Bergey(右)与邹挺(左)共同发布Arm 2023全面计算解决方案
全新第五代GPU架构,为移动用户带来卓越的视觉体验
首先,在性能方面,该解决方案在设计之初就充分考虑了智能手机的需求,通过基于全新第五代GPU架构的旗舰级Arm Immortalis™ GPU,为移动用户带来了最佳的视觉体验。
据介绍,作为手机设计至关重要的组成部分之一,GPU目前已经达到了更高的技术水平。去年Arm推出了基于第四代Valhall架构的Arm Immortalis,将安卓手游体验推至全新的高度。本着不断突破的创新精神,今年Arm又推出了全新的第五代GPU架构。
“Arm第五代GPU架构专为满足多种图形用例而设计,为基于Arm GPU的未来几代视觉计算技术夯实根基。”邹挺强调,这是Arm有史以来效率最高的GPU架构,在设计时还兼顾了CPU和系统。
该架构重新定义了部分图形管道,显著减少了内存带宽,从而让总体系统效率与功耗优化高达14%。“如此巨幅的提升,有助于在相同的功率预算下实现更出色的视觉效果;或者在节省功耗的情况下,提供更持久的沉浸式移动体验。”邹挺表示。
另外值得一提的是,Arm在第五代GPU架构中还引入了延迟顶点着色(Deferred Vertex Shading,DVS),重新定义了GPU中的图形数据流。在Arm看来,这一技术将成为未来图形和几何复杂工作负载的关键,有助于Arm的合作伙伴扩展内核数量,并在未来达到更高的性能水平。
与此同时,Arm全新的GPU架构,还将使下一代游戏和实时3D应用成为可能,让游戏体验更顺畅,并让复杂的PC端和游戏主机体验在移动设备上实现。
据邹挺介绍,Arm首款基于第五代架构的GPU——Immortalis-G720,是Arm目前性能和能效表现最为出色的GPU,专为旗舰智能手机而设计。与上一代产品相比,其面积仅仅增加了2%,但是性能和能效却分别提高了15%,而系统级效率更是跃升了40%。这样的设计有助于实现更出色且持久的帧率,并最终带来更高质量的图形渲染,实现更身临其境的视觉感受。
全新Armv9 CPU计算集群,助力打造智能AI新体验
除了旗舰级Arm Immortalis™ GPU,全新的Armv9 CPU计算集群作为2023全面计算解决方案的一部分,同样具有许多创新性特点。
据介绍,该集群包含了Cortex-X4、Cortex-A720、Cortex-A520,彰显了Arm对提供领先CPU性能的坚定承诺。另外,全新的Armv9 Cortex® CPU计算集群在连续三年实现两位数性能增强的同时,效率也得到了显著提升。
“新的Cortex-X4是Arm的第四代Cortex-X内核,是我们打造过性能最快速的CPU。与去年推出的Cortex-X3相比,Cortex-X4的面积同样也仅仅增加了10%,但性能却提高了15%,并带来了一个可以显著降低功耗多达40%的高能效微架构。”邹挺指出,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。不论是更快速的即时应用响应,或是更流畅的网页浏览体验,Cortex-X4的增强性能都将为设备带来显著的升级。
要知道,能效是高效运行此类用例必不可少的关键,Arm领先的CPU性能也扩展至其全新大小核,即Arm Cortex-A720和Cortex-A520。
“我们全新的大核处理器Cortex-A720和全新的小核处理器Cortex-A520,与其上一代相比,双双在能效方面都提高了20%。其中,Cortex-A720是业界主流的CPU IP,可提高持续性能,是新CPU集群的核心主力;而Cortex-A520是Arm最出众的高效性能核心。”邹挺介绍说,为了完善全新的CPU集群,Arm也推出了全新的DSU-120,专门为了满足高要求的多线程用例而设计。有了新的CPU集群,移动用户就可以在需要的时候获得所需的性能和能效。
据悉,Arm通过与台积电(TSMC)这样优秀的工艺制造伙伴紧密协作,在新一代CPU设计中,Arm在TSMC N3E制程工艺上顺利完成了业内首个Cortex-X4流片,双方共同为类似Cortex-X4的Arm内核打造定制IP,为充分利用制程工艺和处理器带来的PPA优势做好准备。
“这项合作进一步深化了双方长期合作的伙伴关系,并为未来奠定了夯实的基础。届时,我们将通过设计分区和利用先进的封装技术,一同协作提高系统性能和能效。”邹挺表示,得益于端到端的系统优化,我们将全新旗舰级Arm Immortalis™ GPU和全新Armv9 CPU集群等元素全部结合在2023全面计算解决方案中,使整个SoC的系统性能得到了显著提升。
简单来说,Arm的全面计算战略就是通过一整套针对特定工作负载而设计和优化的IP。这些IP可作为一个完整的系统,无缝地协同工作。作为全球领先的IP供应商,Arm始终站在技术前沿,通过不断提升硬件的机器学习功能,让开发者能够充分利用人工智能(AI)和机器学习(ML)工作负载的优势。
持续提升软件能力,让移动开发变得更简单高效
为了体现Arm对开发者的重视与支持,邹挺以最新的智能手机平台为例,进一步介绍了Arm的全面计算战略。“Arm CPU和GPU的性能提升带动了AI处理能力大约每两年便会翻一番,基于Arm架构的AI平台出货量远远超过其他终端计算架构,因而成为了全球开发者在为其应用程序引入AI和ML时最容易访问和锁定的平台。”
例如,Arm的开源软件库Arm NN和Arm Compute Library可支持开发者在Armv9 CPU和Arm GPU上优化ML工作负载的执行。自今年年初以来,Arm NN和Arm Compute Library已在安卓平台上面向Google Apps开放,目前拥有超过1亿的日活用户。
“计划明年年初,这些Arm技术库将通过谷歌移动服务向第三方应用程序的安卓开发者开放访问。也就是说,每位安卓开发者都将能访问最新的Arm技术和软件更新,确保他们在Arm架构上获得出色的AI性能。”邹挺介绍说,凭借Armv9架构的可扩展性,我们得以继续探寻AI和ML的优化方法,并预计未来的发展速度将会更快。
当前,全球有近900万个移动开发者在基于Arm架构、且为Arm架构应用进行开发。对此,邹挺感慨道:“从高端游戏到区域性应用,我们为编写更便利、更简单、更安全、更快速的软件提供了所需的灵活性和通用性,为此我们感到无比自豪!”
作为2023全面计算解决方案的一部分,Arm确保开发者能够充分释放其创造潜力,为现代工作负载充分发挥设计才能。与此同时,Arm还提供了64位计算性能支持安全创新,以抵御更先进的数字威胁,并且提供了可扩展的解决方案,为更广泛的市场带来更多高级的功能。
除此之外,Arm的内存标记扩展MTE功能还支持开发者在应用部署前后都能检测和避免内存安全漏洞,从而为用户提供了功能安全及信息安全的数字体验。据悉,Armv9架构CPU的MTE功能已经努力消除占所有软件漏洞中70%的内存安全漏洞。
总之,Arm 2023全面计算解决方案是一个移动计算平台,其目的就是通过CPU和GPU技术,为沉浸式游戏体验和智能AI应用提供支持。
最后,Chris Bergey总结道:“2023全面计算解决方案的发布,对于Arm来说是一个非常重要的时刻。我相信它为Arm的合作伙伴生态系统提供了机会,包括芯片供应商和手机OEM。同时,我们还将对于性能和安全的承诺扩展到了在Arm架构上进行开发的900万移动开发者。我坚信,以Arm为基石的未来充满了希望和无限可能性。”