测试数据说话,麒麟980性能大起底
扫描二维码
随时随地手机看文章
前三个CPU测试项使用了NNAPI尚未支持的函数的模型,影响性能的仅仅是CPU性能以及性能响应时间,这意味着DVFS和调度器响应等机制可能对结果产生巨大影响,比如Galaxy S9上的表现就要明显优于同为Exynos 9810处理器的Note9。六周年
尽管如此,将麒麟970与麒麟980进行对比,依然能够展示Cortex A76的性能,以及华为的DVFS /调度器可能的改进。
接下来的测试项基于8位整数量化的NN模型。不幸的是,华为手机的NNAPI驱动程序似乎仍未提供硬件加速,这些测试没有使用麒麟处理器上的NPU,测试结果展示的依然是CPU性能,华为表示计划在未来版本的驱动中修正这个问题。
在使用骁龙845的设备中,一加6和Pixel 3在性能上遥遥领先,甚至相比同为骁龙845的Galaxy S9+也是如此,原因是这两款手机都使用了高通公司最新更新的NNAPI驱动程序,该驱动程序与Android 9/P BSP一起发布,可通过HVX DSP加速NN应用。
接下来的FP16测试项终于启用了麒麟处理器的NPU,并且在新老两代处理器上都取得了领先的成绩。在这里麒麟980的双核NPU终于得以体现,Mate 20展现出了巨大的领先优势。不过一加6似乎在其NNAPI驱动程序中出现了一些非常奇怪的问题,使得它的性能比其他平台差一个数量级,不知道这项测试是跑在了其CPU上还是GPU上。
而在最后的FP32测试项中,大多数手机都再次回到CPU上进行运算,麒麟980的改进有限。
总体而言,AI-Benchmark至少验证了华为对NPU性能的一些宣传,不过从这些测试结果中得出的真正结论是,大多数具有NNAPI驱动程序的设备目前本身尚不成熟且功能仍然非常有限,与苹果如今的CoreML生态系统相比相差甚远。
麒麟980的CPU性能表现应该在很大程度上可以代表下一代骁龙8150的情况,高通或许会在CPU频率上稍稍提升一些,但最大的问题在于内存子系统方面,高通能不能解决L4系统缓存引入的延迟惩罚问题。
而Cortex A76对于三星来说就实在是太可怕了,如果Exynos 9820所用的Exynos M4架构只是一次常规迭代,说实话在Cortex A76面前是没什么竞争力的。三星需要在性能和能耗比两个方面均作出重大改进,才能与麒麟980相匹敌。
GPU方面,虽然Arm玩GPU确实比从桌面端过来的Imagination和高通(GPU团队来自ATI)差得远,但这个锅恐怕还没办法直接甩给Arm的Mali G76架构,因为三星Exynos SoC的GPU能耗比要明显好于麒麟SoC,两家分别选择了牺牲面积换性能和牺牲功耗换性能的方式。
三星Exynos 9810和8895虽然GPU面积很大(24.53mm² & 32mm²),但由于频率只有560MHz左右,因此功耗表现尚可,Exynos 9810的能耗比甚至非常接近于骁龙845。而与三星的狂堆核心数相比,麒麟970则只使用了中等数量的核心,然后通过拉高核心频率来榨取性能。
每种核心架构在某一工艺下,都有一个能耗比最佳的频率区间,越过这个区间后,继续拉高频需要付出极大的功耗代价。麒麟970的Mali G72 MP12频率为746MHz,功耗上升非常明显,能耗比仅略高于使用Mali G71的Exynos 8895。
因此在理论上说,对比三星Exynos SoC,华为的麒麟SoC从未曾表现出Arm Mali GPU应有的能耗比。不过,据悉三星集成NPU的Exynos 9820也只采用了Mali G76 MP12的配置,远不如以前动辄MP18或MP20那么豪迈了。由此来看,华为“少核高频”的策略,是为了给NPU腾地方不得已而为之吧,或许只能等三星Exynos 9820的具体参数和测试成绩公布后才能进一步揭秘了。
NPU方面,回顾一下此前麒麟970的测试,在麒麟980上仍然没有看到NPU对用户有明显的好处,因为我们还没有可用的软件来使用这部分硬件。我们不清楚华为是怎样使用NPU进行相机处理的,但除了这些自带的第一方软件外,NPU目前对设备体验仍然处于一种薛定谔状态。