Arm全新Ethos-U AI加速器及物联网参考设计平台,为软件开发者带来无限可能!
扫描二维码
随时随地手机看文章
随着物联网设备的不断增多,边缘AI也将迎来爆发式增长。根据QYResearch调研团队发布的《全球边缘AI芯片市场报告2024-2030》显示,预计2030年,全球边缘AI芯片市场规模将达到81.3亿美元,未来几年年复合增长率(CAGR)为16.5%。
边缘AI发展潜力巨大,有望助力多个领域的持续智能化演进与转型。但与此同时,我们也应该看到,由于边缘AI的应用场景复杂多样,需要具备强大的适应性和可靠性,这一趋势变化也对芯片设计、计算能力等提出了更高的要求。
在此背景下,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。
(Arm推出新一代Ethos-U AI加速器及全新物联网参考设计平台)
NPU家族再添一员——Arm® Ethos™-U85
所谓边缘AI,就是在边缘计算环境中实现人工智能的一种方法。它允许在生成数据的设备上进行计算,而不是在集中的云计算设施或远程数据中心进行计算。这种本地化处理方式使得设备能够在几毫秒内做出决策,而无需互联网连接或云服务。此外,本地化处理计算还能通过高响应时间,强化用户体验,并增强隐私数据安全的保障。
据Arm物联网事业部业务拓展副总裁马健(Chloe Ma)介绍,Arm Ethos NPU系列是业界首款AI加速器,目前英飞凌、恩智浦半导体、奇景光电(Himax)、Alif Semiconductor和Synaptics等领先企业均已推出了搭载Ethos-U的量产芯片。而此次推出的全新Arm Ethos-U85,与上一代产品相比,不仅为高性能边缘AI应用带来了4倍的性能提升,以及20%的能效提升,同时还保持了一致工具链,实现了无缝的开发者体验。
除此之外,Arm Ethos-U85还支持从128到2048个MAC单元的配置,在最高性能配置下,可以提供4TOPs的AI算力,非常适用于工厂自动化和商用或智能家居摄像头等需要更高性能的边缘AI应用。
(Arm Ethos-U85提供卓越的神经网络加速功能)
另外值得一提的是,Arm Ethos-U85还增加了对Transformer架构网络的支持,这是优化大模型边缘落地微调时间、提升模型泛化的一个关键特性。
针对这一关键特性,马健指出,Arm Ethos-U85不仅仅提供卷积神经网络(CNN)所需的权重矩阵乘的运算,同时还支持矩阵相乘,这是Transformer架构网络的一个基本组成部分。基于Transformer的模型具有优异的泛化功能,它将更快地驱动新AI应用的发展。
“Transformer在视觉和生成式AI用例中,比如视频理解、图文结合,以及图像增强与生成、图像分类和目标检测等方面都极有价值。Transformer架构网络的注意力机制容易利用并行计算来实现,提高硬件使用效率,使得这些模型能够部署在计算资源有限的边缘设备上。开发者可以通过选用针对Transformer架构网络优化的设计,发掘边缘AI的新机遇,使这些应用享有更快的推理、更优化的模型性能和可扩展性。”马健解释说。
(Arm Ethos-U85支持Transformer架构和卷积神经网络)
事实上,Arm Ethos-U85不仅支持低功耗MCU系统中的AI加速,在高性能边缘计算系统中,也越来越多地应用在处理器、诸如Linux等标准操作系统,以及高级开发语言的部署中。这种模式更有利于云原生开发和云边端负载调度,尤其是在处理数据量日益增长的AI应用系统中,这一趋势尤为显著。
“Arm Ethos-U85能够很好地支持这些需求,加之我们领先的Armv9 Cortex-A CPU,将为基于应用处理器的智能物联网平台上运行的AI任务实现加速。这将使Arm Ethos-U85能够在工业机器视觉、边缘网关、可穿戴设备和消费类机器人等应用中,带来高效能的边缘推理。”马健如是说。
(Arm Ethos-U85为高性能边缘AI应用提供有力的支持)
参考设计平台再升级——Arm Corstone™-320
为了简化系统开发、加快上市时间,Arm还推出了全新物联网参考设计平台——Arm Corstone™-320,以加速实现语音、音频和视觉系统等边缘AI应用的部署。
据了解,该平台不仅集成了Cortex-M系列最高性能的嵌入式处理器Cortex-M85,以及全新的Ethos-U85 NPU AI加速器,还包含了Arm Mali-C55 ISP。而Arm之所以这样设计,一是引入了针对实际工作负载优化加速的设计理念,参考用例包括部署在智能家居中的电池供电摄像系统,以及在工业和零售系统中的低帧率网络摄像头;二是为了提供具有安全保证的软硬件组合,帮助合作伙伴能够顺利通过PSA Certified Level 2认证,实现对区域和全球安全标准的合规。
Arm坚信,通过全新Corstone-320预先集成、预先验证的参考设计模版,一定能够帮助合作伙伴减少边缘智能芯片开发的成本与时间。
(Arm助力加速边缘AI设备部署进程)
“正如之前推出的Arm物联网参考设计一样,Arm Corstone-320不仅可以提供芯片计算子系统IP组合,还附带了软件、AI模型库和开发工具,以实现软件的复用,并利用了Arm强大的生态系统。”马健谈到Corstone-320时分享:“它还附带了仿真Corstone-320完整系统的Arm虚拟硬件,以及单独的CPU和NPU的固定虚拟平台(FVP)模型,可以简化开发并加速产品设计,支持软硬件并行协同开发,从而有助于我们的合作伙伴聚焦于打造差异化价值。”
对于任何一款产品而言,只有做到了简单易用,它才更适于普及推广,这也是为什么随着边缘AI的持续扩展,物联网生态链上下游的芯片与系统供应商、算法软件开发者与集成商们越来越汇聚在Arm计算平台。Arm计算平台致力于为合作伙伴提供AI从云到端、现代敏捷开发和部署流程中所需的特性与功能,实现基于量产验证的一致架构,并采用统一工具链的AI转型。
(基于Arm平台的AI软件生态系统)
作为一种新型的计算方式,边缘AI虽然给系统和芯片设计带来了巨大机遇,但同时也带来了许多挑战。比如,如何平衡计算能力与能效、功耗与成本之间的关系?如何确保数据安全和隐私保护?如何应对边缘用例五花八门、传统市场存在碎片化问题?
为了更好地统一多样化的应用要求,达到规模化效益,软件定义和适于软件移植的标准更是必不可少。Arm在IP、参考设计和软件标准上持续投入,可以帮助整个边缘AI生态应对这些挑战。
正如Arm此次推出的新一代Ethos-U85和Corstone-320物联网参考设计平台,不仅可以满足边缘AI用例对更高性能计算的需求,还为最新的AI模型、框架提供了原生支持,并沿用了Arm软件与AI开发者已经熟知的工具链,具有投资复用、上手容易等优势。
与此同时,本次发布的新产品与参考设计加入Arm丰富的IP产品和技术组合,也使Arm技术能够覆盖更广泛、多样化的智能物联网应用,并满足最新边缘AI市场的性能、成本和能效需求。
据悉,目前全球范围内Arm已有超过1000个生态系统合作伙伴以及1500 万名Arm生态开发者。凭借广泛的软件支持和工具,Arm简化了开发流程,从而助力市场轻松扩展边缘AI的部署。
(Arm技术正在构建边缘AI的未来)
在技术革新的道路上,Arm永不止步
“我们已经看到,生态系统中的开发者在树莓派设备上评估运行包括LLaMA等在内的大模型,边缘部署大模型和生成式AI用例指日可待。为此,我们已经做好了准备来挑战物联网与大模型、多模态AI结合的性能与效率极限。”马健表示,AI的普及、大模型和生成式AI的迅猛发展,为Arm物联网生态系统的伙伴们带来了前所未有的发展机遇。凭借Arm丰富的经验和领先的技术广度,能够最有力地支持合作伙伴们拥抱边缘AI机遇。
可以预见,随着全新Ethos-U85和Corstone-320的登场及 Arm 在技术、生态中的不断投入,未来Arm无疑将成为全球最普遍的AI计算平台之一。届时,越来越多的开发者和软件厂商将加入到这一生态系统中,共同推动边缘AI的创新和发展。