浅析人脸识别细分领域行人再识别
扫描二维码
随时随地手机看文章
目前,人脸识别主要分为两种,一是人脸识别,二是行人再识别,前者在技术上可以简单理解为将两张图片放在一起,区分是否两个人,而后者指的是是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。
行人再识别的深度学习方法通常有三个步骤:首先,在训练集上训练一个分类网络。然后在网络收敛之后,用它全连接层的输出作为特征表达。最后,对所有的图像特征,计算其欧氏距离,判断他们的相似性。
在公安部门追踪嫌疑犯时,虽然摄像头遍布城市大街小巷,但往往摄像头无法真正覆盖所有区域,同时许多摄像头的视野也没有重叠,导致追踪目标的轨迹出现较大的困难。很明显,在识别同一个目标时,由于视角、尺度、光照、服饰多样性、姿态多变性、分辨率不同以及部分遮挡问题,会导致不同摄像头间失去连续的位置和运动信息,影响目标的快速检索。
在实战中,视角的变化会带来场景中的物体与摄像头光轴呈现不同的夹角,导致二维图像中物体表象存在差异;而尺度变化则会导致不同目标在图像中所占图像区域的差异,要求算法对尺度具有一定鲁棒性,特征提取就会变得困难。这也被称为极具挑战性的问题“跨视阈重现目标识别”,但“行人再识别”技术的出现,让公安用户看到摆脱肉眼辨识的希望。
行人再识别的深度学习方法通常有三个步骤:首先,在训练集上训练一个分类网络;然后在网络收敛之后,用它全连接层的输出作为特征表达;最后,对所有的图像特征,计算其欧氏距离,判断他们的相似性。这个过程就出现了一个问题:卷积神经网络中全连接层的每一个权重向量,往往都高度相关。这导致了每个全连接描述中个体之间的相关性,在基于欧几里得距离时会影响检索性能。
任何一个高级的算法都迫切的需要跟实际行业紧密结合起来,才能真正实现技术服务于社会。比较显著的一点,在AI时代要让安防厂商用得起新技术,必须利用自主知识产权的核心算法,才能打造低功耗性能的智能前端产品。
在传统安防中,摄像机采集的数据要经过后台对其进行解码、抽帧、人脸识别与结构化应用,再进行特征码的提取、后期比对,整个过程使得计算压力全部集中在后台,因此如何实现前端在复杂环境下的数据智能采集和结构化变得至关重要。同时全国600多个大中城市视频系统建设已初具规模,安装摄像头2000万多支,监控系统26.8万个,如何实现传统产品的智能化改造成为迫切的需求。
目前不少企业针对以上情况,推出智能结构化前端盒子,通过搭载高性能AI芯片,可实现高速率采集、抓拍和人脸属性分析。能实现在不更换摄像头的前提下,更方便、快捷的实现前端智能,更好的实现后端分析向前端的过渡。
相信未来3年内,智能传感器、算法模型、语音识别、计算机视觉、智能机器人、智能安防将迎来快速增长。