基于小波变换的视频图像压缩算法研究
扫描二维码
随时随地手机看文章
l 引 言
随着网络和多媒体技术的迅速发展,特别是3G技术的逐渐普及,多媒体信息特别是视频图像信息将越来越丰富。对数据量庞大的视频图像信息进行压缩是非常必要的,因此视频图像的压缩也一直吸引着广大研究者进行不断深入的探索。
小波变换具有良好的时、频局域性,并且由于其在非平稳图像信号分析方面的灵活性和适应人眼视觉特性的能力,已经成为图像编码的有力工具。应用三维小波变换进行视频压缩编码,需考虑选用时、空域2组小波滤波器组。时域选用阶数较低的滤波器组,而空域的滤波器组的选择与静止图像变换编码相似,常用的是双正交D 9/7滤波器组,但是它的计算量较大,因此采用提升方法来实现,并且对提升格式的参数进行调整,可进一步减少运算量。
2 基于提升格式的三维小波变换的视频编码系统
本文采用的视频编码系统主要是由三维小波变换、量化、熵编码和码流组装4个部分组成,如图1所示。设图像序列有M×N×L个像素,M,N分别为图像的列、行数,L为一组中的帧数。首先,对输入的L帧图像进行三维提升型小波变换。然后用基于HVS的视觉阈值曲线对各个子带的小波系数进行量化,且把每个子带进一步分成固定大小的块。之后对每个子块进行位平面熵编码,并得到各块的率失真曲线。最后,在码流组装过程中进行码流分配。该系统的解码过程就是其逆过程。
3 算法实现
(1)小波分解:本文采用提升型小波变换对视频信号进行3级的三维小波分解得到垂直、水平和帧方向的三维小波子带。得到一个低频分辨率的图像逼近LLL3和代表不同分辨率、不同方向上的视频序列细节信息的高频三维小波子带(LHHm,LHLm,LLHm,HLHm,HHLmHHHm,HLLm,其中m表示级数,即m=1,2,3)。低频子带LLLm代表视频序列时间轴方向的上下文信息,包含图像大部分的能量,需重点保护。对于时间轴上的高频子带采用本文的阈值量化法进行量化。时间轴低频子带的能量要高于高频子带,当运动剧烈时,经小波分解后的时间轴高频子带内的系数会急剧增大,会影响算法的整体压缩效果,而时间轴低频子带其积聚了图像信息的大部分能量,所以不能引入太大的失真。
(2)基于HVS的阈值量化:本文采用的量化方法是利用视觉门限曲线与小波系数的关系来构造单位小波变换系数的量化矩阵。空间变换小波是双正交D 9/7滤波器组,文献中给出图像压缩中最佳小波基D 9/7阈值量化因子矩阵,以该矩阵为基础推断三维小波变换系数的量化矩阵。当视频图像序列中物体的运动变化很快时,在三维小波变换系数时间轴上的高频子带中会产生较大的系数值,其量化后的数值依然很大,所以采用如下量化方法。在量化中设立一个阈值T,以小波分解系数的均方误差作为判断准则,设量化矩阵为Q,对系数按照下式量化:
其中R为量化步长。具体过程为:设PD是1个比特位,当M≤TPD=1时,输出码流中输出一位PD=0,则解码器以量化矩阵Q对输入码流进行反量化;当M>T时,输出码流中输出PD=1,然后输出量化步长R,用2个字节来表示,则解码器以量化矩阵Q(1+R)对输入码流进行反量化。
(3)熵编码:量化后的每个子带被进一步分成固定大小的块,并对每个子块采用位平面技术分别进行熵编码。嵌入式位平面编码器按照位平面从最高有效位N一1~0降序地进行编码,因此在截取压缩码流时,先保证所有系数的最高有效位平面的优先传输,保证码流的解码质量。在每个编码之后都同时记录当前编码的码率R和对应的失真D,得到的率失真曲线将用于后面的码流组装。
(4)码流组装:在所有的系数块完成编码后,根据最小化全局失真的原则用码流组装对各个块的码流进行码率分配。原始的码率控制方法采用全局最优的码率控制,会导致帧方向上质量的颤抖。本文结合率失真优化和帧方向上质量平稳2方面的要求,沿帧方向上采用新的码率分配方法,同时在沿水平和垂直方向上保持了率失真优化的方法。即对于同一时间轴小波子带的分块都采用同一斜率来选取截断点;对于不同时间轴小波子带的分块,按照不同的斜率来截断以调整时间轴方向的稳定性。可以根据式(2)的失真比例条件来调整截断点的斜率。
在中高码率环境下,各时间轴子带的衰减系数βn近似相等,因此可以简单的依照下等式通过控制各时间轴子带的率失真斜率来控制失真的比例。
此处δi为等式(2)给出的理论失真值,m为时间轴的小波子带个数。
前面的熵编码过程中已经计算并保存了每个块的率失真曲线。为了使先传输的码率对信息失真度的降低最快,需要保证率失真的凸性,因此按照文献中方法对每个块的率失真曲线采取凸包络处理。每个块的失真根据所处的小波子带乘上一个能量权重,以利用小波域的失真估计图像空域的失真:
此处w表示提升型小波合成滤波器带来的能量增益。对于双正交D9/7滤波器,低通增益wL=1.299,高通增益为wH=0.787。在三维方向上共经过n个低通和m个高通提升型滤波器的小波子带,能量增益为各层增益的乘积叫=wnLwmH。
对所有的块的率失真曲线,找出联合最优的率失真斜率点,并将码流在该点截断,然后将所有块中在同一斜率切点截断得到的码流片断组合成最终的压缩码流。最优斜率能够得出最接近目标码率的公共斜率,每个系数块的截断码率长度也作为头信息记录在压缩码流中,作为对压缩码流随机解码时的索引。
4 实验结果
本文利用上述的视频编码方法对QCIF格式的标准视频序列Foreman和Akiyo序列进行压缩编码,每帧176×144的像素,全长300帧,帧率为每秒30帧。在编解码过程中,取L=6帧为一组进行三维小波变换。可将Foreman和Akiyo序列分别压缩到0.4 bpp和O.1 bpp。根据式(2)可计算出时间轴平稳条件下各级D 9/7滤波器的理论时间轴R—D斜率比例,来控制时间轴率失真截断斜率。
比较该编码算法和MPEG一4的VM 16.O版本的性能。对于Foreman,其优于采用“IPP…”GOP结构的MPEG一4平均O.3 dB;其平均压缩质量Akiyo与相近。如图2所示,其中“一”代表本文中算法,“▲”代表“IPP…”GOP结构的MPEG一4。Foreman序列与Akiyo序列如图2所示。
由图2可以看出,新的视频图像编码方法对于像Foreman这样图像背景比较复杂,且场景中的物体运动较大的图像,该方法仍能在较大的压缩比下得到重建质量良好的视频图像,对于这种大部分区域的运动很少,时间轴上的颤抖不是很明显,可以保持三维小波变换编码的特点,在高的压缩比之下重建图像仍然能够得到较高的图像质量。这说明本文所提出的方法是有所改进的,特别是对于运动变化较快的图像。
根据文献提出的视频序列质量的评价方法,对Foreman和Akiyo这2段视频序列图像分别采用本文中的算法和MPEG一4的VM 16.O“IPP…”GOP结构重建后的图像序列进行评价。下面分别给出视频清晰度和流畅度评价结果。
(1)根据1段视频清晰度的评价公式,可得新算法和GOP结构对Foreman重建后的视频清晰度分别为27.37和28.64;Akiyo的视频清晰度分别为32.44和29.61。从视觉效果来看,新算法重建后的视频序列的清晰度还是较好,且Akiyo的清晰度更好。
(2)根据一段视频流畅性指标的评价公式,可得新算法和GOP结构对视频序列Foreman的流畅度10.56和12.13;Akiyo的原始和重建后的视频流畅度8.87和9.11。从视觉效果来看,新算法重建后的视频序列具有很好的流畅性,特别是对于Foreman序列。
5 结 语
本文利用视觉特性曲线对三维小波变换后的系数进行量化,采用具有时间轴稳定性的码率控制方法,通过控制各小波时间轴子带的失真比例来分配码率,均衡控制解码后时间轴信号的失真。实验结果表明,该方法的运算复杂度低,有效降低存储空间并提高运算速度。而且该编码器压缩的视频具有良好的时间轴平稳性,因而更加适合用户的视觉要求。同时,对于以往小波编码中质量较差的一些帧,压缩质量有所提高。