当前位置:首页 > 物联网 > 《物联网技术》杂志
[导读]摘 要:在信号频谱分析试验中,通过FPGA实现FFT。在MAX+plusH系统环境下,介绍了流水线结构FFT的蝶形单元 设计,详解了旋转因子的生成,通过地址产生单元和块浮点单元实现了运算结果的输出,并将其输出结果与Matlab结果进行比较。

0引言

FPGA实验中,主要是用FPGA来实现FFT,使其完 成对信号的频谱分析。流水线结构FFT的设计主要是蝶形单 元的设计,通过旋转参数的生成,将运算结果写入地址并完 成输出。

1实验原理及步骤

1.1 Quartus H开发环境

Quartus H是Altera公司提供的FPGA/CPLD集成开发软 件,在Quartus 口上可以完成设计输入、HDL综合、布新布局(适 配)、仿真和选择以及硬件测试等流程,它提供了一种与结构 无关的设计环境,使设计者能方便地进行设计输入、开始处 理和器件编程。Quartus 口具备仿真功能,同时支持第三方的 仿真工具(如 ModelSin)。此外,Quartus 口与 Matlab 和 DSP Builder结合,可用进行基于FPAG的DSP系统开发,是DSP 硬件系统实现的工具EDA工具。

Quartus 口设计与开发的流程如图1所示。

图1 QuartusII设计与开发的流程

1.2快速傅里叶变换(FFT)

FFT是DFT的快速算法。设离散的有限长时间序列为x(n),0 < n < N— 1,则其离散的傅里叶变换为:

其中:(n)为时域点;X(k)为频域点Wn为旋转因子;(n)、 X(k)、Wn都是复数。完成整个DFT运算共需要N次复数乘 法以及N(N-1)次复数加法运算。当N很大时,运算量很大, 对于实时信号处理,要求CPU运算速度很高,难以工程实现。 因此,出现了快速傅里叶变换(FFT)算法。FFT算法的基本 思想是利用旋转因子Wn的周期性、对称性、特殊性以及周期 N的可互换性,将长度为N点序列的DFT运算逐次分级为较 短序列的DFT运算,并将相同项合并,因为DFT的运算量与 N2成正比,当N减小时,就大大减少了运算量,提高了运算 效率。N=2n个点的DFT复数乘法量由N次降为(N/2) logzN 次,复数加法由N(N-1)次降为(N/2) log2N次。

FFT算法种类很多,基本上可分为两大类:一类是针对 N等于2的整数次幂的算法,如基2算法、基4算法和分裂 基算法等;另一类是针对N不等于2的整数次幂的算法,以 Winograd为代表,它们有重要的理论价值,但是不适于硬件 实现。基2算法结构简单,但运算量大。基4算法相对于基 2算法更为复杂,但是计算量减少了。FFT算法按分解方式的 不同又可以分为时域抽取算法(decimation in time,DIT)和 频域抽取算法(decimation in frequency,DIF)两种。这两种 算法在本质上都是一种基于标号分解的算法,在运算量和复 杂性等方面完全一样。考虑到本设计FFT运算的点数不是太 多,故选用了时域抽取基2算法(DIT)。

1.3按时间抽取的基2-FFT算法(DIT-基2-FFT)原理

FFT运算的基本单元是蝶形运算单元,基2蝶形运算符 号如图2所示。设蝶形运算输入数据为A=Ap+Aqj,B=Bp+Bqj,

FFT算法由多级蝶形运算构成,具体运算流图也有多种 形式。本设计选用了输入倒序、输出顺序的运算流图,图3所 示为N=8点时的DIT-FFT运算流图。这种运算流图是同址运 算,其优点是:在同一级运算中,每个蝶形的两个输入数据只 对计算本蝶形有用,而且蝶形的输入输出数据节点又同在一条 水平线上,这就意味着计算完一个蝶形运算后,所得输出数 据可以立即存入元出入数据所占用的存储器。因此,在硬件实 现时可以节省存储单元。

一个长度为 N 的序列 x(n),满足 N=2M,M 为整数。那么此序列 x(n)的 FFT 运算流图由 M 级蝶形运算构成,每一级有 N/2 个蝶形运算,第 L 级蝶形运算中使用旋转因子的个数为 2L,L=0,1,2,…,M-1。64 点 FFT 运算,分 6 级,每级有 32 个蝶形运算。

1.4 FFT处理器结构设计

FFT 算 法 的 FPGA 硬 件 实 现 在 Altera 公 司 的MAX+plusⅡ系统环境下开发完成,选用基于查找表结构内嵌存储器的 APEX20 系列 FPGA 器件。图 4 为 FFT 处理器的结构图。本设计采用单元结构设计思路,整个处理器由数据接收单元、运算单元、旋转因子存储单元、地址产生单元和中央控制单元 5 个单元组成,各单元在中央控制单元的控制下协调工作。其中,内部接收单元采用乒乓 RAM 结构,扩大了数据吞吐量,计算单元采用流水与并行结合的结构,加快了运算速。

1.5 中央控制单元

中央控制单元是整个系统的控制核心,其主要功能是控制数据流向,协调各单元之间的运行。中央控制单元根据系统时钟确定当前蝶型运算所处的级数m和个数n,并把m、n传送给地址产生单元。地址产生单元产生蝶型运算两个输入数据和旋转因子的地址,并把地址传送给运算 RAM 和旋转因子存储器。在中央控制单元读使能信号控制下两个输入数据和旋转因子被读出。读出的数据进行必要的延迟和定标处理后,送给运算单元。经过蝶型运算后,运算结果按原址写入RAM。

1.6 数据接收单元

数据接收单元主要功能是按帧接收外部数据,并将每帧数据按码位倒置的顺序乒乓存入接收 RAM1 或接收 RAM2。中央控制单元交替的对接收 RAM 中的数据进行处理,当中央控制单元将接收 RAM1中的数据取出,经过蝶型运算,结果存入运算 RAM1 的同时上一帧数据的 FFT 运算结果从运算 RAM2 取出。接收 RAM 用 FPGA 的片上双口 RAM 实现,接收单元控制写端口,中心控制单元控制读端口。

1.7 运算单元

运算单元由蝶型运算器和运算 RAM 组成。蝶型运算器完成对输入数据的蝶型运算,运算 RAM 作为 FFT 的中间数据缓存。蝶型运算器输入数据为 A=Ap+Aqj,B=Bp+Bqj,旋转因子 WrN=Wp+Wqj,蝶型运算输出如式(3)所示。根据式(3),蝶型运算器可由一个复数乘法和两个复数加(减)法器组成。为了提高运算速度采用并行运算,用四个实数乘法器、三个实数加法器、三个实数减法器组成。蝶型运算器实现框图如图 5 所示。蝶型运算各个模块利用 MAX+plusⅡ开发软件中所提供的宏单元生成。

运算 RAM1 和运算 RAM2 作为 FFT 的中间数据缓存。两块 RAM 交替作为数据读出和运算结果写入单元,直到第 6 级蝶型运算完成。

1.8 旋转因子存储单元

旋转因子存储单元,存储 FFT 运算所需要的旋转因子WrN,WrN=e(-j2π/N)r(r=0,1, …,N/2 - 1)。 旋 转 因 子 先 在Matlab 中分实部和虚部产生,转化成 16 位定点数,并将结果保存成 hex 文件格式。利用 MAX+plusII 软件提供的 ROM 宏模块"lpm_rom”产生两个(N/2) X16 b的ROM,并分别用 旋转因子实部和虚部对应的hex文件对两个ROM初始化,这 样旋转因子的值就固化在了 FPGA中。对应不同级的蝶型运算, 地址产生器产生相应的地址送给ROM将旋转因子读出。

1.9地址产生单元

地址产生单元产生蝶型运算两个输入数据和旋转因子的 地址。实现的方法是根据地址产生的算法,通过逻辑运算产生。 前面已介绍本设计FFT实现结构为同址运算,即蝶型运算的 结果仍然写回输入数据读出单元。因此,将读数据地址延迟 若干时钟周期,就可作为运算结果写入地址。对于N点FFT 运算,用 m G (0 A log2N— 1), n G (0 A N/2— 1)表示第 m 级的第n个蝶型运算。addr_4, addr_B (addr_』<addr_B)分 别表示数据AB的入口地址。随着级数m不同,每一级蝶型 运算可分为若干组(0,…,n/2m+1— 1,N/2— 1),每组2m个 蝶型运算,两个输入数据共占用2m+1个地址。则m级的第n 个蝶型运算位置为第n/2m组的第n%2m个。因此地址应为:

基于FFT谱分析测频算法的FPGA实现


式中:(n/2m) X2m+1描述为将n的低m位清零,再左移 一位。n%2m描述为取n的低m位。蝶型运算所对应的旋转因 子存储器入口地址设为addr_w,对于N点FFT共需要N/2个 旋转因子,W N = e(-j2"/N)r(r=0, 1,…,N/2 — 1)根据第 m级 蝶型运算所需旋转因子的排列规律,旋转因子存储器入口地 址应为:

基于FFT谱分析测频算法的FPGA实现

64点FFT旋转因子有32个,共需要5位表示地址。第m级、 第n个蝶型运算的旋转因子地址可由逻辑移位的方法快速得 到。将n(5位)左移位(5-m),低位补0,得到了在(0〜31) 中的 addr_w。

1.10块浮点单元

块浮点单元的实现思路是每级蝶型运算结果动态扩展但 最大扩展2位。块浮点单元对蝶型运算结果的高3位进行检测, 判断当前结果动态范围扩展位数,记录当前级的最大扩展位 数。下一级蝶型运算时,根据前一级的最大扩展位数,对读 出的数据进行定标,选取数据送入蝶型运算器。块浮点单元 将每一级运算结果动态范围扩展位数进行累加,和FFT运算 结果一同输出。

1.11 FFT处理器功能仿真与设计验证

仿真结果如图6所示:

由仿真结果可以看出,该FFT处理器为串行流水线结构, 各级运算模块没有实现并行运行。

图6时序仿真图

2实验情况记录

为验证仿真结果的正确性,采用上述方法实现256点 FFT处理器,同时为提高精度将输入数据的实部和虚部采用 16位二进制数。对函数:

基于FFT谱分析测频算法的FPGA实现

以120 MHz的频率进行抽样,取256点作为FFT处理器 输入数据进行快速傅里叶变换,并将其输出结果与Matlab结 果进行比较,结果如图7〜图9所示。

图7抽样函数及Matlab计算频谱

图8 FPGA计算频谱

图9各采样点相对误差

3结语

由于处理器采用定点运算,在进行乘法和加法运算时不 可避免地造成一定误差,尤其是在功率谱接近零值的这些点 上,相对误差较大,但是在我们更为关心的功率谱幅值点上, 相对误差仅为1%上下,完全可以满足大多数应用对于运算精度的要求。

20211223_61c34fb10fe36__基于FFT谱分析测频算法的FPGA实现

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭