视频中目标检测与跟踪算法综述
扫描二维码
随时随地手机看文章
引 言
在视频中人或运动物体行为理解的整个流程中,运动目标的检测与跟踪非常关键。通常一个视频监控系统大体可分解为四个不同的功能单元,即目标检测,搜索系统感兴趣的目标区域 ;目标跟踪,捕获感兴趣区域的运动轨迹 ;目标分类, 将被跟踪目标分为人,汽车或其他移动物体 ;目标行为识别, 对跟踪目标进行行为识别。目标检测作为视频监控的前提, 属于低层次的视觉问题,目前己有多种较为成熟的算法。而目标跟踪作为视频监控最基本的功能属于中等层次的视觉问题, 是当前制约视频监控系统性能的主要瓶颈之一。
1 主流的目标检测方法介绍
1.1 背景分割法
背景分割法适用于运动场景固定且比较简单的场合,通过建立背景模型,用图像序列的特征参数与背景模型比较, 分割出背景和前景,从而得到运动对象。背景差分图像的主要原理是通过现有图像对比已知背景图像,且背景图像中不含任何感兴趣的对象,是背景模型 [1]。该对比过程被称为前景检测。该过程将观测图像分为两个互补的像素集合,可覆盖全部图像,包括感兴趣的运动对象及前景与前景的补集,即背景。
背景减除法最大的缺陷是,没有成熟和高性能的规则来定义前景区域和对象,因此其使用范围受限。有许多背景减除算法是针对特定需求提出来的,因此对模型和分割策略也提出了特殊要求。如文献 [2],它必须适用于平缓或快速的光照变化,场景运动变化,复杂的背景或背景变化。由于部分场合要求由硬件承担背景减除功能,因此算法负载成为最基本的要求。对于户外视频监控系统而言,算法对噪声的鲁棒性以及算法对光照变化的适应能力是最基本的要求。
1.2 相邻帧间差分法
该方法选择相邻的两帧进行比对,选择参数可以是直方图,也可以是亮度或其他图像的特征参数,两个相邻的图像帧 进行减法运算,结果的矩阵值与预设的阈值进行比较,通过 差的绝对值与阈值大小来判断是否有运动。在这个原理的框 架下有更多的改进算法被提出,比如基于亮度假设检验和高 阶统计量的相邻帧差法等 [3]。
帧间差分法的优点在于可以很好地适用于存在多个运动 物体,或者当摄像机移动的情况。但是该方法对噪音干扰的 鲁棒性较差。
1.3 光流法
光流法(Optical Flow or Optic Flow)通过检测图像像素 点的强度随时间的变化情况来推断物体的移动速度及方向。 对于每个像素点,每一个时刻均有一个二维或多维的向量集 合,如(x,y,t),表示指定坐标在 t 点的瞬时速度。设 I(x,y, t)为 t 时刻(x,y)点的强度,在很短的时间Δt 内,x,y 分别 增加Δx,Δy,则光流变化的情况如公式(1)所示:
1.4 统计法
统计法通过建立统计模型来区分前景和后景。在魏波 [4] 的文章中,场景的统计,前景和后景的分布情况统计被作为基 础,建立了间断点的分布模型,此模型被用来实现运动目标 的检测。王长安,朱善安 [5] 在其论文中提出了改进的 GVF- Snake 模型与统计模型融合的算法思想,实验表明,融合后的 方法结合了 GVF-Snake 与统计模型的各自优点,对静态背景 的目标检测有很好的效果。各种文献资料都表明,统计法适 合在复杂场景中检测运动对象,且算法的时间复杂度低,易 于硬件实现,但由于检测效果受先验知识的影响,统计法的 准确度并不高。
1.5 小波法
数学界有一种公认的提法,即小波分析是近代数学的一项重要成就,它已经发展成为一个新的数学分支,是多学科结合的产物,包括泛函数值计算、Fourier变换等,是一种多尺度,多分辨的分析技术,在信息融合、语音处理、信号处理、大气模型、地震预测等诸多领域都有着广泛的使用价值,在目标检测方面亦有广阔的应用。在李红艳[6] 的文献中, Haar 小波变换的低Signal-to-Noise微小目标检测方法被提出, 仿真实验结果表明,李红艳提出的方法可以有效提高目标的Signal-to-Noise。小波分析的优势在于检测复杂场景下的微弱目标,但大规模成熟应用的情况还比较少。
2 主流的目标检测方法性能比较
几种典型目标检测方法的性能比较情况见表 1 所列 [7-10]。
3 主流的目标跟踪方法介绍
目标跟踪是机器视觉的关键功能步骤,在机器视觉的所有应用领域,如视频监控,视频压缩,人机交互,医学图像处理等领域都是极具挑战性的课题。目标跟踪除要在图像序列中检测出目标外,还需要获取目标的位置、速度、运动轨迹、加速度等运动参数,从而为下一步运动目标的行为识别与理解提供技术参数。经过多年的发展,出现了许多目标跟踪的方法,这些方法都各自有其优缺点。
3.1 基于特征匹配的跟踪方法
运动目标总会有一些区别于其他事物的属性,如几何形状, 外形轮廓,子空间特征等属性,这些属性具有可靠性,独立性, 稀疏性和可区分性等特点,可被用作目标跟踪的依据。特征点提取是该算法的关键,目前常用的特征点提取算法有SIFT算法,Kanade Lucas Tomasi(KLT)算法,Harris 算法及 SURF 算法等。
3.2 基于贝叶斯的跟踪方法
在文献 [11] 中,二阶 AR 模型被用来跟踪目标运动,一 阶 AR 模型被用来跟踪目标尺度变化,理论推导和仿真实验显 示,一阶、二阶融合的方法取得了较好的跟踪效果。在贝叶 斯跟踪方法中,Kalman 滤波(KF)是最早被成熟应用的方法, KF 具有准确预测平稳运动目标下一个时间点位置的特性,因 此在弹道目标跟踪中有成熟的产品应用。但 KF 的缺陷是只能 处理线性高斯模型,虽然 KF 有各种改进模型,但都不能处理 非高斯非线性模型。
3.3 基于动态轮廓的跟踪方法
动态轮廓跟踪方法的主要原理是先勾勒出运动目标的轮 廓,由后续帧不断更新轮廓进而达到跟踪的目的。文献 [12] 中, 视频图像中的汽车跟踪就采用了动态轮廓跟踪方法。该方法 其实是基于区域方法的一个变形,它比区域跟踪更具体,更 高效,但对动态轮廓跟踪方法初始值比较敏感,需要进行人 机交互,很难实现自动跟踪。
3.4 基于模型的跟踪方法
模型跟踪法的核心是建立的已知跟踪目标的精细三维模 型与待检测图像之间的匹配操作。其缺点是对模型过分依赖, 计算复杂,不利于实时处理。但基于模型的跟踪方法便于实 现自动跟踪,因此国内外学者对 3D 模型的跟踪方法和基于 深度估计的跟踪方法做了大量研究工作。VIEWS 系统是英国 Reading 大学开发研制的一种基于 3D 模型的道路车辆识别与 跟踪系统——VIE 系统 [13],基于 VIEWS 的研究经验,中科 院自动化所模式识别实验室自行设计了拥有自主版权的交通监 控原型 VStar,该系统在 PC 环境下运行,用以对车辆进行实 时跟踪,并对各种干扰因素如光线变化,斑马线干扰,边界遮 挡等都显示了较强的鲁棒性。
4 主流的目标跟踪方法性能比较
几种常见的目标跟踪方法的性能比较见表 2 所列 [14-16]。
5 结 语
就目标检测而言,其发展趋势是寻找算法时间复杂度低、 算法鲁棒性强、算法成熟度高和受先验知识影响小的算法。 就目标跟踪算法而言,寻找自动化程度高、先验知识依赖程度 低、计算复杂度低和应用成熟度高的算法是今后的发展趋势。