图像自适应分段线性拉伸算法的FPGA设计

时间：2010-07-21 11:22:44

关键字： FPGA设计线性 BSP RAM

手机看文章

扫描二维码
随时随地手机看文章

[导读]为改善红外图像的视觉效果和后续处理质量，需要对图像进行增强处理。在此介绍并实现了一种空间域图像增强算法，自适应分段线性拉伸算法。首先简要分析算法原理，对该算法基于Xilinx公司XC4VLXl5系列FPGA的实现方法进行了研究，以兼顾系统实时性和集成度为目的，提出灰度直方图统计和拉伸运算等关键模块的解决方案。通过试验结果分析，对压缩因子的选取提出建议。该设计的输出延迟仅为62.-5ns，且具有实现简单、集成度高、功耗低等优点，适合在精确制导武器和导航系统中应用。

0 引言
    由于红外图像的成像机理以及红外成像自身的原因，红外图像有对比度低、图像较模糊、噪声大等特点。因此抑止噪声，提高图像信噪比，以及调整红外图像对比度，以利于后续图像分析、目标识别或跟踪，必须对红外图像进行增强处理。另外，在其他场合，若采用人机交互方式，则必须对原始图像进行预处理，改善图像视觉效果，使其更适合人机进一步的分析和处理。
    图像增强从作用域出发，分为空间域增强和频率域增强两种。频率域是一种间接增强的方法，由于存在域之间的变换和反变换，计算复杂，难以满足实时性要求。自适应分段线性拉伸算法是一种空间域图像增强方法，直接对图像像素灰度进行操作，由于运算过程简单、实现方便，目前的图像增强预处理电路大多选用这种算法。硬件实现上，最初是采用单片DSP芯片实现，其原理为：图像数据实时的传输给DSP，DSP接收完1块数据后，再对整块数据进行增强处理，这样势必会造成时间的延迟，不能满足精确制导武器系统实时性的要求。后来硬件结构发展为采取DSP，FPGA芯片相结合的方式。这样，有效结合了DSP的运算能力强与FPGA逻辑和存储资源丰富的优点；不足之处在于，DSP与FPGA之间的通信给设计工作增加了额外负担。与DSP相比，FPGA结构上的优势使得其更适合完成并行处理、及结构性强和高速的运算。本文基于这种算法理论基础，使用xilinx公司规模较大的XC4VLXl5系列FPGA，实现了红外图像的实时处理。

1 自适应线性分段线性灰度级拉伸算法
    图像灰度线性拉伸算法表达式为：

式中：i是图像数据行号；j是图像数据列号；Y(i，J)是拉伸后输出图像灰度值；X(i，j)是输入原始图像灰度值，为14 b二进制数；Xmin是输入图像数据的最小灰度值；Xmax是输入图像数据的最大灰度值；Zmax表明输出图像的最大灰度值，设计中拉伸后的图像灰度值用8 b二进制数表示，故Zmax=255。
    首先对红外图像做灰度直方图统计，低信噪比条件下，选取压缩因子为5％，将盲元和噪声的影响降到最低。分别搜索5％最大灰度值中的最小值作为Xmax，5％最小灰度值里的最大值作为Xmin。拉伸转换时，将大于Xmax的像素灰度置为Zmax，小于Xmin的像素灰度置为O。此算法将线性拉伸区间自适应地分为[O，Xmin)，[Xmin，Xmax]和(Xmax，255]三个部分。其中，[O，Xmin)和(Xmax，255]两个灰度区间的像素灰度分别被压缩为O和255。若图像中目标较小，且目标正好位于两个被压缩的区间内，就有可能被抑制。为避免这种情况发生，可视情况适当调整压缩因子5％的大小。

2 拉伸算法的FPGA实现
2．1 设计思路
    根据以上算法分析，FPGA设计思路如下：在每帧图像帧正程，用双端口RAM进行直方图统计，记录每个像素灰度值出现的次数，帧逆程即可统计得到此帧图像的Xmin和Xmax。因为相邻两帧图像近似度高，可用前帧得到的Xmin和Xmax来处理下帧图像。在帧逆程时，调用除法器计算出的值；在下帧正程时，只需计算Q·[X(i，j)-Xmin]，然后将得到的结果除以64(左移6位)，即对每个像素只需1次减法、1次乘法和移位就可完成拉伸运算。实现框图如图1所示，拉伸后数据的输出仅比输入延时62．5 ns，实现了对红外图像的实时处理。

2．2 硬件设计
    通过以上设计思路的分析，设计主要包括灰度直方图统计、除法和拉伸运算3部分。下面进行详细介绍。
2．2．1 双端口RAM
    XC4VLXl5芯片具有丰富的BlockRAM资源，用它构成双端口RAM，进行灰度直方图统计。像素的灰度值作为双端口RAM的地址，对应空间存储此灰度值在1帧图像里的频数。以320×256帧大小、灰度值为14 b的红外图像为例，在每个像素灰度值都相同的极限情况下，每个地址空间需要的存储的值为81 920，转换为二进制有17 b，故所需存储空间大小为17 b×214。对双端口RAM的操作分为三个阶段：
    (1)在帧正程时，只需对A端口进行读／写操作。根据接收到的像素灰度值，先读出RAM中对应地址空间的储值，加“1”后回写入原来的地址空间，这样在每帧正程结束时，就统计完了每个灰度值出现的频数，即完成了灰度直方图统计。
    (2)帧逆程时，要同时对A，B端口进行读操作。对于A端口，依次从高地址读取RAM中的数，将读取的数进行累加，当和大于帧像素个数的5％时，此时对应的地址值即为Xmax；类似地对B端口操作，从0地址开始读RAM，可找到Xmin。将得到的灰度值Xmin和Xmax存入寄存器，作为除法器和下一帧图像拉伸运算的输入。
    (3)每帧最后将双端口RAM清零，为下一帧灰度直方图统计做准备。由于双端口RAM没有整体清零功能，设计中采用从“O”地址开始。依次往高地址写零的方式清零。
2．2．2 除法器
    除法运算通过调用ISE IP Core Generator生成的15位定点除法器来实现，满足高精度要求，而不采用逼近法。一帧图像的拉伸只需调用一次除法器，提高了运算的效率。在帧逆程计算Q：=16 384／(Xmax-Xmin)的值，对于15位输入，除法器有18个时钟周期的延时，而这并不会影响图像处理的实时性。
2．2．3 控制时钟
    在1个像素时钟周期内要完成读RAM、加法计算和回写RAM的操作，RAM的控制时钟至少必须是像素时钟的4倍。控制时钟的选取还要考虑帧逆程的时间长度，要在逆程里访问RAM查找到Xmin和Xmax，还要完成RAM清零操作。FPGA系统时钟为96 MHz，分频后产生48 MHz，为像素时钟8倍，用它作为双端口RAM和除法器的控制时钟，可满足要求。
2．2．4 拉伸运算
    将式(1)进行简单变换，可以记为：

    Q值在上帧结束前已经得到，根据式(2)拉伸运算得到简化，只需1次减法和乘法运算，得到积的小数点左移6位后，截取低8位就得到拉伸后的灰度值。需要注意的是，截取前要判定乘法是否溢出，如果溢出，结果置为最大灰度值255。

3 系统验证
    采用飞机高空采集的地面红外图像作为验证模板，灰度拉伸前的原始图像如图2所示，整幅图像对比度低，细节极不明显。最大、最小灰度值按5％的比例选取，拉伸后的图像如图3所示，拉伸后可明显看出河流、道路、汽车等地物的轮廓，但图像中较亮和较暗的部分层次不清晰。若减小灰度值压缩比例为2％，图像的主要轮廓变化不明显，较亮和较暗的部分将会显现出一定层次，这表明被压缩的区间相对变小，按比例拉伸的图像范围扩大。分段线性拉伸的结果可好可坏，分段区间的选择是关键，选取时要考虑原始图像的质量。噪声和盲元数目较少时，被压缩的区间可适当调小。

该设计充分利用Virtex-4 FPGA的逻辑资源，实现了红外图像的自适应分段线性拉伸，对FPGA芯片资源占用情况如表1所示。整个设计完全在FPGA中实现，能最大限度地减少分立元件的使用。降低了系统的整体功耗，设计周期和开发成本也就能随之减少。算法完全采用流水线设计思路，处理后的数据相对输入延时小于一个像素时钟周期，最高系统时钟可达128 MHz。设计的性能和实时性满足预期目标，可用于精确制导武器或导航系统。

4 结语
这里简要分析了图像自适应分段线性拉伸算法，利用Xilinx Virtex-4 FPGA丰富的片上资源实现了这一算法。通过实验对设计的有效性进行了验证，图像对比度有明显提高，噪声和盲元被抑制。但该算法具有局限性，仅适用于大目标的图像增强。在天文学、计算机视觉、动态景物分析、超声及声纳图像处理等领域中广泛存在着点目标红外图像，由于点目标无形状、尺寸等可利用的信息，处理时须存储多帧图像，数据处理量大。在做图像灰度级拉伸时，目标有可能被作为噪声而抑制掉，从而丢失有用信息，今后需要对点目标红外图像的增强方法做进一步研究。