全面计算雄心!一文解构“十年磨一剑”的Armv9新架构
扫描二维码
随时随地手机看文章
近日,在由易维讯主办的第九届年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨才新发布的针对不同层次算力需求、机器学习(ML)发展路径的全新一代Armv9架构,其不仅是Arm架构演进的又一个里程碑,也将成为Arm未来十年及更远时代推进行业创新的基础。
安谋科技高级FAE经理邹伟现场演讲
Armv9:凭何改变高性能计算方式?
纵观半导体设计在过去十多年的发展,特别是在终端消费等领域,算力带来的生产力的提升,通过移动互联网把大量的计算力放到每一个消费者的手中。与此同时,传统依赖于人工采集和分析数据的过程在第五波计算浪潮中正演变成机器对机器之间的数据采集、存储、分析和服务。由此产生的海量数据需要在云端、边缘侧配置更为强大的算力,并通过数据中心对获得的数据进行分析、构建和决策。
Arm在成为移动浪潮主流架构之外,已进入到边缘端和云端等新场景,其独特的定位可为行业实现稳固的安全基础,同时确保开发者以最简便、快速的方式来使用Arm的安全技术。据邹伟介绍,截止至2020年底,基于Arm IP的芯片累计售出1800亿颗,涵盖在各行各业每一个角落,每一个地方。共享的数据一定会有一个或多个环节经过Arm处理器计算,无论是数据采集的IoT设备,还是日常使用的手机、智能电脑,甚至服务器、超级计算机等。
据Arm预测,未来十年合作伙伴基于Arm芯片的出货量将超过3000亿,100%的共享数据将在Arm芯片上进行处理,无论是在终端还是在云端。因此,亟需一款全新的处理器架构在未来十年内改变计算的方式,以提供更高的性能、改善安全功能并增强工作负载功能。
邹伟现场介绍全新Armv9架构特性
“为此,Arm正式推出了面向未来十年的新一代架构Armv9,是在目前已经广泛使用的Armv8的基础上,继续使用AArch64作为基准指令集,保持了向下兼容性,在此基础上分别在安全性、AI与ML以及可伸缩矢量扩展和DSP上做出改进,扩展了应用范围。”邹伟表示,“Armv9构架实现的处理器可用于移动计算、HPC高性能计算、汽车和AI等市场等,以满足全球对功能日益强大的安全、人工智能和专用处理的需求,这意味着基于 Arm 架构的计算技术也将在智能手机以外的市场上获得领导地位,借助移动生态系统带来的巨大规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。”
Arm全面计算解决方案赋能终极数字体验
尽管近些年全球半导体产业风云变幻,但提供先进算力始终是产业发展的根本目标。从这个角度来看对芯片设计企业又将面临哪些挑战呢?邹伟分析道,首先是CPU的负载越来越复杂,多样化不同的场景中会需求不一样,每个环节面临的挑战都不一样;而摩尔定律虽然减缓,但市场对性能、功耗的追求依然没有停歇,这也是一大挑战;此外,高昂的掩膜价格以及生产周期变长,设计一款5纳米的芯片成本会非常高、生产周期又非常长。“我们希望芯片设计不仅覆盖当前的应用,也能覆盖以后的应用,以获得更长的生命周期,这要求我们通过架构、设计、IP来应对这些客户遇到的挑战。”他强调道。
如果赋能终极的数字体验是Arm构建未来计算愿景的驱动力,那Arm提出最新全面计算解决方案则是开启Armv9时代未来十年之旅的第一步。Arm全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。
作为Arm全面计算解决方案的基石,全新的Arm Cortex CPU包括Arm目前性能最强大的Arm Cortex-X2、首款基于Armv9架构的大核CPU Arm Cortex-A710以及Arm过去四年来推出的首款高效率小核Arm Cortex-A510和Armv9-A CPU 群集。为支持生态系统对于性能的需求,Arm的全球合作伙伴正在努力确保所有app都将在今年年底前支持64位。正如邹伟在演讲中所述,算力多样化时代,Arm认为CPU的算力水准依然非常重要,它搭建了数字未来的基础底座。
而在每代CPU性能动辄20-30%的大幅提升背后,是Arm对频率、带宽、时延、缓存、工艺水平等各项指标一点点提升的不懈追求,在计算基础架构的创新上一直牵引着行业的进展。因此除了提升CPU性能之外,Arm全面计算解决方案同样希望做系统级的提升,为客户带去更好的设计体验。
此外,视觉体验是消费者与设备交互、并享用设备的关键。据悉,最新的Arm的Mali系列GPU正搭配全面计算解决方案中的Armv9 CPU,可以提供卓越的用户体验。据邹伟透露,未来Mali系列GPU也将持续超越大家的期待,带来光线追踪技术、可变速率着色VSR技术以及其他高级渲染技术等。
Arm 的互连技术对于提高系统性能同样至关重要。最新的CoreLink CI-700一致性互连技术和CoreLink NI-700片上网络互连技术与Arm CPU、GPU和NPU IP无缝搭配,可跨SoC解决方案增强系统性能。CoreLink CI-700和CoreLink NI-700对新的Armv9-A功能提供硬件级支持,并支持更高的安全性、改进的带宽和延迟。
引入全新安全性功能,守护数据核心资产
随着全球联网设备激增,芯片的安全性日益重要。对安全性的根本需求是重新思考如何处理安全性,而Armv9架构则通过引入Arm机密计算体系结构(Confidential Compute Architecture, CCA)来重新设计安全应用程序的工作方式。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。
邹伟进一步解释道,Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,是存储数据和执行代码的动态安全区域,与操作系统或管理程序的特权模式分离,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。Arm机密计算体系结构建立在Arm的TrustZone技术之上,是软件容器的硬件版本,允许应用程序轻松地在不同的系统上运行。例如在非安全区的运行的应用程序可以动态申请机密领域,以保护自己的算法或数据。
“Arm还与合作伙伴共同开发平台安全架构PSA,作为一套标准的威胁模型、措施及时间,提供给终端设计人员使用,它与分级认证相结合后可以让此设备的采购者对资产的安全性更放心。例如在国内我们便和中国信息通信研究院泰尔实验室等联合,以支持基于PSA框架的安全物联网解决方案大规模部署。” 邹伟补充道。
打造新计算时代的大计算平台
除了安全性之外,机器学习也被视为Armv9的重要组成部分,因为在未来几年中越来越多的机器学习工作负载将变得司空见惯,在机器学习方面Armv9架构支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习;可伸缩矢量扩展2(SVE2)的引入,则能够更好地帮助开发者对高阶的应用场景进行开发,在处理 5G、虚拟现实和增强现实以及图像和语音识别等任务负载时具有很大增益。
放眼瞬息万变的数字世界,智能终端不仅需要具备灵活性强、功耗低的特点,同时还要满足AI/ML的工作负载需求,这些挑战正推动更安全和专用处理的发展,也是打开新市场、抓住新机遇的关键。Armv9架构的发布与全面计算解决方案以安全技术作为基础,将解锁整个生态系统的新体验,为未来十年构建可信的数字化服务。
邹伟总结到:“新一代Armv9架构将赋能开发者通过弥合软硬件之间的关键差距,构建和编程未来的可信计算平台,帮助我们的合作伙伴在更快的上市时间和成本控制之间取得平衡。安谋中国则致力于从技术到生态全面推动算力革命,并将在自研架构上加大投入,持续携手生态合作伙伴,依托领先的Arm全球生态深入做强本土研发,持续赋能本土产业创新的企业战略。”