Arm公布 Project Trillium 提供业界最具扩展性、应用范围最广的机器学习计算平台
扫描二维码
随时随地手机看文章
Arm公司近期宣布了其Project Trillium项目,这是一套包括新的高度可扩展处理器的Arm IP组合,这些产品可以提供增强的机器学习(ML)和神经网络(NN)功能。当前的技术产品主要针对移动设备市场,将让全新的搭载机器学习功能的设备具有先进的计算能力,包括最先进的目标检测功能。
Arm IP 产品事业部总裁 Rene Haas 表示:“随着人工智能快速部署到终端设备,大量提升计算需求的同时,也要求保持出色的能效表现。 基于这样的需求,Arm宣布推出全新机器学习平台Project Trillium。 新的设备需要高性能的机器学习与人工智能能力,这正是这些全新处理器可以提供的。 结合我们的平台提供的高度灵活性和可扩展性,我们的合作伙伴将可针对多种设备进行创新,创造无限可能。
现在的机器学习技术通常是针对特定的设备类别或某个市场领域的需求。Arm的Project Trillium则通过提供最佳的可扩展性来改变这一点。虽然最初的发布是针对移动处理器的,但未来的Arm 机器学习产品系列将会按照性能需求满足不同应用场合的需求,包括从传感器、智能音箱,到移动设备、家庭娱乐以及其他领域的应用。
性能
Arm全新的机器学习和目标检测处理器不仅相比于独立的CPU, GPU和各种加速器有了显著的效率提升,而且远胜像DSP这样的传统可编程逻辑处理器。
Arm 机器学习处理器是专门针对机器学习而重新设计的。它基于高度可扩展的Arm 机器学习架构, 并达到了机器学习应用场景要求的最高性能和效率:
· 在移动计算领域,Arm 机器学习处理器可以提供每秒超过4.6万亿次的运算能力。
· 凭借智能数据管理,每秒万亿次的运算(TOPs, Trillion Operations Per Second)在实际应用中可以进一步实现2~4倍的有效吞吐量的提升。
· 在散热和和成本受限的环境下,Arm 机器学习处理器能够以超过每瓦特每秒3万亿次运算操作的效能(TOPs/W)达到无以伦比的性能。有关Arm机器学习处理器的更多细节可在我们的网站上找到。
Arm 目标检测处理器是专门为高效识别人或其他物体而设计的,它能够在每帧图像中识别出的物体对象的数目几乎不受限制:
· 在全高清分辨率下可以做到实时每秒60帧的检测。
· 性能可以达到传统DSP的80倍,并且相对于以往的Arm技术,检测质量有了显著提高。有关Arm 目标检测处理器的更多细节可在我们的网站上找到。
组合使用时,Arm深度学习处理器和目标检测处理器性能表现会更好,它们搭配能够提供高性能、高能效的人物检测和识别解决方案。基于这些技术,用户们将会在省电的模式下,在他们的智能设备上尽情体验高分辨率的,且实时、精细的人脸识别功能。
当和Arm Compute Library和CMSIS-NN一起使用时, Arm神经网络(NN)软件库专门为神经网络运算(NN)进行了优化,并且无缝的把如TensorFlow、Caffe和Android NN等神经网络框架和全系列的Arm Cortex® CPU, Arm Mali™ GPU, 和机器学习处理器高效连接在一起。这样开发人员能够充分利用底层Arm硬件的能力和性能,从而从ML应用中获得最高的性能。关于Arm NN软件的更多细节可在我们的网站上找到。
新的Arm机器学习IP套件将于今年4月有早期预览版本提供给客户,在2018年中会发布通用版本。