当前位置:首页 > 原创 > 21ic专访
[导读]十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的则是日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。实际上,Armv9架构的推出也与正预示着行业的发展方向。凭借新架构,Arm提出了3000亿的目标。

Arm架构在如今的电子行业中可以说是无处不在。自1990年Arm公司正式成立Armv4架构到2011年Armv8架构,短短21年架构经过了5次重大升级。而Armv8意味着Arm正是从AArch32迈进AArch64,凭借强大的实力在过去的五年基于Arm架构的设备出货量超过了1000亿。

十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的则是日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。实际上,Armv9架构的推出也与正预示着行业的发展方向。凭借新架构,Arm提出了3000亿的目标。

华为也能用的Armv9,引发市场新的竞争力

Armv9的三个技术特性

根据Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite的介绍,Armv9架构是基于Armv8既往成功的基础,并增添了针对矢量处理的DSP、机器学习ML、安全等这三个技术特性。

Armv8之所以“统治”市场十年之久,最大的升级点便是引入了64架构,即AArch64,这也是Arm版本升级最大的一次改变。除此之外,AArch64摒弃了此前的处理器模式、优先级级别等传统概念,提出了ELException level),并在兼容设计上定义了两套运行环境ESExecution state)。这些也都被Armv9所继承,可以说Armv9是集大成者,将Arm三十多年的核心完美继承下来。

矢量处理的DSP、机器学习ML处理能力提升要归功于可伸缩矢量扩展(SVE2)和矩阵乘法指令的引入。相比SVE128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此才有如此魔力可以增强对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力。

根据Richard Grisenthwaite的介绍,SVE2增强多项DSP和机器学习ML处理能力,例如Scatter-Gather DMA直接存储器访问,把它放到CPU架构中,能实现更多的循环,更大的DSP处理能力,从而支持更多的并行化。

安全能力提升则主要是通过Arm推出的全新的机密计算架构CCAConfidential Compute Architecture)实现,根据介绍CCA通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。同时还将基于此前的TrustZone安全技术引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。

华为也能用的Armv9,引发市场新的竞争力

Armv9在算力上的提升

提到架构的升级,就离不开算力这一个话题,Armv9架构能够为Arm后两代产品提供30%的性能提升。根据介绍,以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78这一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架构及Makalu架构会保持30%以上的IPC性能提升。

华为也能用的Armv9,引发市场新的竞争力

除了CPU性能以外,Armv9还非常重视整体的性能提升,包括降低内存延迟(从150ns降至90ns)、频率提升(从2.6GHz到3.3GHz)内存带宽(从20GB/s到60GB/s)、缓存等。

Richard Grisenthwaite强调,Arm在新一代架构Armv9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。,这个数据是根据业界标准评测工具来衡量的,而且这样30%的算力提升完全是凭借于本身的架构而不是借助于制程工艺来实现。

另外,随着摩尔定律正在放缓,如何进一步提升算力呢?他认为,Arm将通过最大化地提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU性能。

除了CPUArm还表示Mali GPU会增加更多高级功能,例如VRS可变帧率渲染、RT光线追踪及其他高级渲染技术等。

Armv9引发的市场竞争力

实际上,在去年Arm发布Arm® Cortex®-M55处理器和Arm Ethos™-U55神经网络处理器(NPU)两款重磅“性能炸弹”时,就已开始蓄力发展人工智能(AI)。Cortex-M55是Arm历来AI能力最为强大的Cortex-M处理器,能够大幅提升DSP与ML的性能,同时更省电。

反观行业趋势,应用开始要求提供更高的数字信号处理(DSP)性能,实时算法的复杂程度增加和浮点算法趋势下,DSP核或硬件加速单元越来越多被部署内嵌在器件之中。DSP一直影响着下一代产品创新,这是因为许多算法在字长和动态范围有着很高的要求,DSP可免去定点到浮点的转化工作加速产品上市,另外DSP浮点计算成本越来越接近定点计算。正因如此,便形成了Arm+DSP内核的黄金搭档。

另外,行业也正在将越来越多的机器学习工作负载变得更加普遍,虽然机器学习有着许多专用的加速器,不过相比来说大量的小范围机器学习的主力仍然是CPU,因此矩阵乘法指令成为关键。

在安全性能上,Arm曾在此前进行了多维度的功能增强,包括PSA认证、TrustZone等。目前PSA认证已经有有超过35个合作伙伴提供的60多种认证产品,而新推出的CCA则也将基于TrustZone提供更加安全的架构。

Armv9着眼的点来看,行业正逐渐对算力功耗平衡性和安全性能要求提高。Arm架构可用在物联网的大部分设备之上,因此对这两项要求更加吃紧。大数据时代爆炸量的信息增长下,一方面将计算分成了多个维度,另一方面将会对数据安全提出更高的要求。

华为也能用的Armv9,引发市场新的竞争力

根据Arm的介绍,搭载ARMv9处理器的芯片最快在2021年年底就会面世,物联网发展日趋成熟,这个时间点恰好提升竞争力的好时机。市场或将拥有追求极致计算性能的高端产品、超低功耗的省电高手、主打安全可靠的产品。而Armv9经过架构的更新,能够从底层和非制程方向进行大改革,相信能为市场带来新的竞争力。

而在广为受关注的国内授权问题上,Arm强调:“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。Arm已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭