一种基于频域分析的图像测距算法
扫描二维码
随时随地手机看文章
引言
视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80%的信息是由视觉获取的。计算机视觉就是人类利用计算机实现人的视觉功能,从而对客观世界三维场景进行感知、识别和理解。计算机视觉是一个相当新而且发展迅速的研究领域。
在对生物视觉系统的研究中,人们早就注意到,几乎所有具有视觉功能的生物都有两只眼睛。用两只眼睛同时观察物体,会有深度或远近的感觉,我们称之为视差。因此,在计算机视觉系统中,也常用两台或多台摄像机从两个或多个视点去观察同一场景,从而获得在不同视角下的一组图像,然后通过同一场景点在不同图像中的视差,推断出场景中目标物体的空间几何形状和位置,这种方法称为立体视觉。它是计算机视觉的一个重要分支,也是计算机视觉的核心研究内容之一。
视频和图像是对物质世界客观事物的形象而生动的描述,是最直接且具体的信息表达形式之一,是人类最重要的信息载体。随着科技的日益发展,人们需要一种更加先进快捷的工作方式,另外,人们对工作环境和工作条件也提出了更新、更高的要求,视频测距系统便在这种背景下应运而生。
视觉测距技术的发展对于距离测量有重要的意义。在基于数字图像处理技术的视觉测距系统中,使用单个CCD(ChargeCoupleDevice)摄像机的系统称为单目摄像系统,而同时使用两台摄像机对同一景物进行摄像,并运用计算机分析两幅图像来确定物体的三维状况的系统称为双目摄像系统。双目摄像系统测量精度高,但计算速度较慢,成本较高。而单目摄像系统方法则比较简洁、快速,因此,本文对采用单目摄像系统检测目标物的测距方法进行研究。
1测距技术在国内外的研究现状
目前,国内外对视觉测距技术的研究仍在不断的进行之中,还并没有形成国际统一的标准模式,各种数字图像处理技术和算法之间孰优孰劣仍在不断的探讨和比较中。当前,国内外的研究机构主要研究的测距技术包括超声波测距技术、微波雷达测距技术、激光雷达测距技术和视觉测距技术。
1.1激光雷达测距
激光雷达测距具有测量时间短、量程长、精度高等特点,但激光雷达在恶劣天气环境下或逆光状态下的测距准确性降低,另外,其造价、耗能、对人眼安全等因素也对其进一步应用有一定影响。
1.2超声波测距
超声波是指振动频率在20kHz以上的机械波,具有声波传输的基本物理特性。超声波测距是根据超声波反射时间来计算与前方车辆之间的距离。超声波测距原理比较简单,成本低,但超声波的传输速度受天气影响较大,不同天气条件下的传输速度不同。
1.3微波雷达测距
微波雷达采用调频连续波雷达体制,微波雷达探测的性能比较稳定,不易受检测物表面形状和颜色的影响,也不易受天气影响,可以在恶劣的天气状况下获得距离信息。微波雷达测距主要是利用目标对电磁波的反射来发现目标并测定其位置。雷达系统的缺点是空间覆盖面有限,彼此之间可能产生电磁干扰。
1.4视觉测距技术
视觉测距通常采用CCD摄像机来模拟人眼的光电探测原理,以实现对外界环境信号的采集。捕获的图像被视为一个二维阵列,像素是其中的元素,其值即为灰度值或称亮度值,总体的灰度就形成视觉图像。获得数字图像后,运用数字图像处理技术对图像进行处理,再从图像数据出发,结合利用系统模型进行计算,即可完成对外界环境的检测。
2摄像机的工作原理
数字图像是计算机视觉的出发点,而摄像机是最常用的图像获取装置,它应用对象广泛,具有使用方便、灵敏度高、输入速度快等特点。摄像机通常由摄像镜头、摄像器件、电源、放大电路、偏转电路、同步信号发生电路等部分组成。
按照摄像器件的组成,可将摄像机分为很多种。目前计算机视觉系统中常用的是电荷耦合元件(ChargeCoupledDevice)摄像机,简称CCD摄像机。其工作原理是在硅单晶片上生成一层很薄的二氧化硅,再于其上蒸发一层间距很小的铝电极条。加电压于电极上后,电场穿透二氧化硅薄层,并排斥硅中多数载流子,从而在电极下的硅单晶片上形成电荷耗尽层,又称势阱。当硅改变电极电压,使势阱内的电荷从一个电极传送到另一个电极时,取出移动的电荷就会形成输出信号。扫描系统顺序扫描各像素,并在一个扫描周期内,用较长的时间感光、积累电荷,用极短的时间读取图像信号。由于图像各处的光亮不同,耗尽层内“捕捉”的电荷量存在差异,这就完成了图像的光电转换。
图1所示是摄像机工作原理图。事实上,景深原理在摄
像上有着极其重要的作用。正确理解和运用景深,有助于拍出满意的画面。光圈、焦距和物距是决定景深的主要因素。
变焦距镜头具有在一定范围内连续改变焦距而成像面位置不变的性能,现在已成为家用摄像机上运用最广泛的镜头。
自动聚集装置有四种工作方式,即红外线方式、超声波方式、海耐乌艾方式和佳能SST方式。它们都有较高的测量精度,分别被应用在不同类型的摄像机之中。
摄像机是一种把景物光像转变为电信号的装置。其结构大致可分为三部分:光学系统(主要指镜头)、光电转换系统(主要指摄像管或固体摄像器件)以及电路系统(主要指视频处理电路)。
摄像机光学系统的主要部件是光学镜头,它由透镜系统组合而成。这个透镜系统包含着许多片凸凹不同的透镜,其中凸透镜的中央比边缘厚,因而经透镜边缘部分的光线比中央部分的光线会发生更多的折射。当被摄对象经过光学系统透镜折射后,就可在光电转换系统的摄像管或固体摄像器件的成像面上形成焦点。光电转换系统中的光敏元件会把焦点外的光学图像转变成携带电荷的电信号。这些电信号的作用是微弱的,必须经过电路系统进一步放大,以形成符合特定技术要求的信号,并从摄像机中输出。
3聚焦测距分析
3.1光学原理
基于前面介绍的测距方法很多,由于受单镜头和无参考的约束,这里选择聚焦测量法。其原理如图2所示。
图中,P为目标物,P。为物像,"0为物距,V。为像距,/为焦距。这样,根据成像原理,则有:
丄=丄+丄fuVo
(1)
显然,只要知道V。和f,距离u就可以计算出来。
3.2视频原理
当自动调整焦距时,就可以利用自动测量所形成的视频图像的最佳清晰度瞬间来确定最佳焦距f,然后通过公式(1)计算出距离"。。设图像空域函数为fx,y),当镜头聚焦时,图像纹理最清晰的高频成分越丰富;散焦时图像模糊平坦,f(xy)的交流成分很少,尤其是高频成分。所以,可采用离散余弦变换DCT(DescriteCosineTransform)算法将f(x,y)转换成频域FQ,j):
/[(2x+1)]ri[(2x+1)]rj
F(i,j)=//f(x,y)cos5-^—cos5!\AGj\
式中,x,y是图像水平、垂直坐标;是图像画面正中nXn正方形图块参与的运算,x的最大值是n-1,y的最大值是n-1;i,j是频域矩阵数据编号,其中i是行序,是列序,i=。,1,…,n-1,j=0,1,…,n-1。|AC,j|是nXn的矩阵函数,是DCT运算结果。当i=0,j=0时,ACj=ACoo是直流分量;当i丰0,丰0时,ACj是交流系数。于是,其交流部分的能谱关系函数为:
kk
P(f)=//ACiji+0,j+0,kGn/2(3)
i=0j=0
式中,f是焦距变量参数,当连续改变f时,按公式⑶即可得到图3所示的视频能谱与焦距的关系曲线。
图3视频能谱与焦距关系曲线
从图3可以看出,当f=f最佳聚焦时,能谱最高。当f手f时,其能谱向两边偏离f逐渐散焦,P(f)也逐渐变小。图3曲线反映的是聚焦到散焦的变化规律,它的陡度取决于镜头的景深。景深越小,曲线变化越快,峰值越明显;景深越大,曲线就越趋向平坦(如图中红线所示)。视场角越小,图像纹理也越清晰,Pmf值越大,同时曲线也会更陡峭。曲线越陡峭,峰值f越易找准,测距越精确。
求出图像最清晰时的焦距值f代入公式(1),即可求出目标物的距离。
4结语
本文提出了一种新的视频图像测距方法,即在频域对信号进行分析,并完成目标物距离的测量。该算法在单镜头下就能实现。通过聚焦原理的分析可见,该方法计算速度快,并可降低对硬件的要求,同时又能使产品小型化。
20210917_6144175705703__一种基于频域分析的图像测距算法