低功耗物联网应用的处理器配置
扫描二维码
随时随地手机看文章
系统架构要求
为了执行高级系统功能,系统设计经常要求升级应用处理器的性能水平,但同时还要维持类似8位微控制器系统的功耗。把它想象成用发条玩具的电量提供一个智能手机的大脑。能配置处理器实现这些似乎有冲突的目标,至关重要。本文说明通过选择和配置处理器,降低系统功耗的技术和方法。
把 DSP 处理与 RISC 处理相结合
物联网设备的定义是根据它们的能力,包括吸收或“感知”真实世界的信号,通过互联网或本地网络对关联数据和通信结果进行操作。大多数通用 RISC 处理器可以成功地处理信号,但是专用的 DSP 处理这些任务的功耗效率更好,延迟更低。另一方面,RISC 处理器很适合传递数据和设置通信通道。用分离的多个独立的处理器是一个选择,但是它会增加系统的成本和板级空间,开发和调试还要用多种环境与工具。如果一个芯片兼具两种功能,就可以降低复杂性和成本。
语音触发、语音控制、语音回放和惯性传感器处理等主要功能在实时启动和低功耗环境中已经是必需品了,这就要求系统的DSP指令能够在满足低功耗目标下实现诸如滤波、快速傅立叶变换(FFT)和插值等任务。
DesignWare® ARC® EMxD 系列处理器面对这些挑战,通过向 ARC 可配置处理器核心增加有 ARCv2DSP指令集架构(ISA)的 DSP 引擎,在一个统一的架构里进行 RISC 和数字信号处理(图 1)。它们功耗低,对语音控制用的语音检测功耗可以低于 1 微瓦。
ARC EM DSP 处理器高度可配置,以便每个用例都可以量身定制,最好地平衡目标应用的 DSP 性能和 RISC 性能,以及功耗效率和面积效率。例如,ARC EM5D 和 EM7D 很适合需要约 50% DSP 处理的应用,而 EM9D 和 EM11D 支持 XY 存储器,用于 DSP 敏感的应用很理想。ARC 处理器扩展(APEX)技术还让设计工程师能创建用户定义指令,支持集成定制的硬件加速器,提高特定应用的性能,同时又降低耗电量和减少需要的存储器数量。
图 1:ARC EMxD 框图
包括支持多组存储器
在RISC + DSP处理器中用来实现典型的 DSP MAC 操作的代码,包括从存储器加载数据,然后按加载的操作数执行 MAC 操作。如图 2 所示,先是通过加载指令获得两个数据值然后紧接着进行MAC操作,本架构的最大吞吐量可以达到每个周期1/3 MAC。
图 2:RISC + DSP 架构中的 DSP MAC 操作
增加一个 XY 存储器系统,可以支持需要更大吞吐量的 DSP 应用。一个基于 XY 存储器的系统一般包括多组存储器和带有指针和更新寄存器的自动化地址生成单元(AGU)。AGU 置于指令流水线中,允许一条指令执行三个数据移动、一个 MAC 操作和三个地址指针更新,支持多址指针升级模式。这种方法使用一个基于 XY 存储器的系统架构,可以实现每个周期一个 MAC 操作的有效吞吐量,显著提升性能(图 3)。因为 XY 存储器系统不需要单独加载和递增指令,还能减少代码。
图 3:有 XY 存储器的 RISC + DSP架构里的DSP MAC 操作
除了提高吞吐量和减少代码外,降低耗电量是常常被忽视的一大优势。如图 4 所示,DSP 函数通过使用 XY 存储器(EM9D)可以大幅节省电量,因为同样的函数需要的时钟周期数更少,尤其是为 RISC + DSP 架构量身定制时,允许 RISC 和 DSP 同时访问。
图 4:随着 DSP 需要的增加,有无 XY 存储器的耗电量比较
用紧密集成的存储器
物联网应用对性能和处理能力的要求不断提高,推动了从紧密集成 8 位微处理器的嵌入式系统转向基于总线的 32 位处理器嵌入式系统的发展趋势。这个趋势对系统的功耗和面积产生了负面影响,违背了物联网产品随着大规模应用变得更小更便宜的主要需求。向 32 位嵌入式处理器系统紧密集成的扩展,移除较为低效的总线基础架构,可以同时实现所有这些系统目标。处理器可以直接访问各个存储器和外部寄存器,降低延迟和需要的时钟频率,从而会降低执行这些功能所需要的电量。
降低情况的示例如图 5 所示,图中比较了基于总线的处理器子系统和紧密集成的系统处理传感器数据的用电情况。处理器核心访问辅助寄存器用一个时钟周期,而在基于总线的系统里,外部寄存器要用四个周期。
图 5:紧密集成的系统中处理传感器数据的省电情况
DMA
降低处理器系统功耗的另一种方法是使用直接存储器访问(DMA),这种方法使周边设备不用涉及 CPU 就能移动数据。要确保系统面积优化,DMA 必须面向处理器和应用进行高度优化。因为内部 DMA 移动数据进出 XY 存储器不会影响处理器通道,所以把 DMA 和多级存储器结合起来,甚至会节省更多电量。
Synopsys 的 ARC EM 系列处理器的 µDMA 法完全以物联网应用为目标,只包含这种类型的嵌入式系统需要的特性。µDMA 控制器通过让 EM内核休眠来降低电量操作,而 µDMA 围绕芯片从周边设备向存储器移动数据,或在存储器之间移动数据时,并且只在必要时才唤醒内核。另外多种的休眠模式可以用来自定义最小的可运行功耗。
软件算法加速
如上所述,物联网应用的要求不断扩张,其中一个重要的关键是安全性。不过,安全算法会使系统更复杂,而系统的功耗和面积预算已经非常紧张。通过减少时钟周期来加速安全算法可以降低功耗。对系统需要的任何常见或常用功能来说,确实如此;通过提高执行效率,用得越多越省电。
ARC EM 处理器系列使用 APEX 技术,使 SoC 设计工程师可以简化和自动化处理设计和验证常见功能的扩展,像加密软件算法或客户专用代码,从而使执行这些常用算法耗费的时间、存储器和电量更少。
图 6:使用APEX加速对传感器应用软件运行时的耗电量降低和周期数减少情况
结论
为物联网应用设计芯片时,设计工程师为了满足性能要求的不断发展,经常要考虑牺牲耗电量。设计工程师可以选择架构方法达到需要的性能而不牺牲能量效率。选择处理器架构时,关键要看灵活性和可配置性,还要能扩展以适应不断变化的应用要求。
ARC EM 系列处理器可以扩展,能提供不会过时的产品路线图,能灵活找出最佳的性能功耗比。能用 APEX 技术定制处理器,就能在物联网市场竞争中差异化你的产品。