CEVA-X4大曝光,零距离深度探究人工智能
扫描二维码
随时随地手机看文章
无论是 《机械公敌》 里的终极大BOSS还是POI的the machine,无论是深蓝还是alpha Go,从影视作品到现实产物人工智能都是以极其庞大的“身形”示于世人。CEVA推出的新型CEVA-X4 DSP首度把深层神经网络引入嵌入式系统,将人工智能“装进”了移动设备,让AI成为每个人都能“玩得起”黑科技。CEVA-X4大曝光,零距离深度探究人工智能。
而要想让AI真正住进移动设备,我们还要了解当下移动设备还有哪些难题需要现代科技去克服。在基带方面面所临着得三大挑战,首先是需要调制解调器PHY来实时调度加速器,处理器和协处理器之间的工作,要求PHY组件在不增加的情况下能够实现超低延迟的响应;其次是需要提高处理复杂声音的性能,这要求VoLTE(EVS)的复杂性相较于传统的编解码器要增加4-5倍,与AMR相比内存要增加10倍;当然,要将大量高精度的工作用于移动设备,超低能耗调制解调器的设计始终是个不可回避的难题,这要求调制解调器空闲阶段需要特殊掉电模式,要在提高工作复杂性的情况下保证电池寿命。
CEVA-X4是全球首款针对LTE-Advanced的Pro和5G调制解调器的多RAT PHY控制IP处理器。在PHY控制上结合了控制平面处理与先进的DSP功能,可扩展的VLIW/ SIMD架构可以支持定点运算和浮点运算。
(CEVA-X4基带设计简图)
总结起来与前代相比,三大支柱擎起了新款CEVA-X4:
强大的DSP处理:每秒160亿次运算(GOPS)的计算能力显着提高了DSP性能,两倍于前代产品提高2倍超高性能能够支持LTE工作负荷。新的DSP架构充分考虑了控制流程处理和数字信号处理的需求,可用于高端智能手机、机器通信和无线连接芯片设计。
高效控制能力:4.0CoreMark/ MHz的CUP性能效率,将控制能力提高3倍。128位宽 VLIW/SIMD处理器在4个相同的标量处理单元(SPU)中具有8个MAC,并有10段流水线,且采用16nm工艺以1.5GHz运行。
先进的系统控制:CEVA-X4采用智能调度系统实现高QoS和低延迟,与前代产品相比,减少了50%的功耗。
(一张图看懂CEVA-X4卓越性能)
除了基带设计的难题,让我们再聊聊人工智能都需要什么?那当然是一个智慧的大脑啊!大脑上什么最重要?当然是神经网络啊!而在这样一颗具有智慧的人造大脑上制造深层神经网络就要靠这颗神秘XM4的来实现了。
(深层神经网络工作机制)
CEVA在嵌入式平台上运行AlexNet进行实时演示,这是业界首款嵌入式CNN演示。深层神经网络AlexNet作为世界上最广泛的网络基准,CEVA结合了CDNN展示了AlexNet可在XM4上运行的可操作性。
(CEVA-XM4与PC端对比图)
从上图看出,CEVA-XM4成像和视觉DSP结合在移动设备上的功耗与PC端的功耗相比并没有很大的差别。CEVA-XM4可以在一定程度上实现将人工智能搬运到移动设备上的设想。“计算机视觉研究人员采用了NVIDIA的CUDA并行计算平台上开发了相同的卷积神经网络(CNN)对象的识别模型”,CEVA市场营销及企业发展副总裁Eran Briman表示:“CEVA-XM4可以比其他任何授权的VPU相比能够提供更多的整数运算性能。CEVA VPU凭借其更深的14级流水线的,更宽的4096位VLIW架构,和64位数据类型的支持,这减轻了在CNN的饱和问题。”
(CEVA市场营销及企业发展副总裁Eran Briman)
目前,CEVA已经与展讯展开长期合作为LTE系统级芯片瞄准中高端智能手机,CEVA成像和视觉DSP移动设备同样也受到众多手机厂商的青睐并与之展开合作。人工智能到底什么时候能够真正实现我们并不知道,但是我们在探索的路上已经做出了充分的准备。