千视通行人再识别精度破纪录
扫描二维码
随时随地手机看文章
人才济济的CV赛道,从来不缺黑马,千视通便是其中一匹。
近日,主打原创人工智能算法与视频深度学习技术的千视通,在Market 1501、DukeMTMC-reID、CUHK03这三个衡量Re-ID技术最通用的数据集测试中,获得了巨大突破。
这些数据集中有两项核心指标评判标准:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,缩写mAP,它反映检索的人在底库中的所有图片排在结果队列前面的程度)。
根据相关数据显示,目前千视通在Market 1501上的首位命中率(Rank-1 Accuracy)已经达到97.1%,超越人眼识别能力(94%),并刷新了今年4月公布的96.6%的世界纪录。
同时在CUHK03,Duke MTMC-reID两个数据集上也刷新了之前业内最高纪录,达到了行业state of the art的技术水平,特别是在CUHK03数据集上,Rank 1指标提高了10.7%。
注:以上数据由国家超级计算长沙中心测试验证。
人脸识别后,千视通用ReID“擦亮”AI天眼
成立于2011年的千视通是一家视频大数据结构化技术提供商。短短七年时间,其已经手握500家客户,在香港、深圳、苏州、长沙均设有研发中心,并于上月斩获近亿元A轮融资。
与所有赛道玩家一样,对于AI技术的深耕与落地是千视通的立业之本。
如果有人追问,在AI安防市场大局将定的下半场,千视通缘何还能逆风猛进,其CTO胡大鹏博士试图给出答案。
当包括AI在内的前沿科技成为所有企业的最强竞争力及核心生产力,那些痴迷于技术的工程师们便取代了此前数世纪的冒险家们成为商业之神赫尔墨斯的新宠。
作为一直在学术界耕耘的前沿学者,胡大鹏博士自香港科技大学毕业后,先后任职北京微软亚洲研究所、香港中文大学等科研机构。
之后,他带着在机器视觉技术产业转化和应用开发方面的丰富经验落地安防圈,让AI技术重塑已经尘封多年未做改变的安防市场。
在胡大鹏博士看来,以AI技术为代表的高新科技的发展为人们提供了越来越多的可能性。
它与传统安防行业的结合,不仅重新定义了产品的作业、体验方式,还不断颠覆与重塑着整个行业的价值链。
用他的话说,“得益于AI的发展,新的‘安防’时代正在诞生。”
2014年前后,成百上千家 AI初创企业陆续带着天赋杀入了这个稍显禁锢的传统产业,而后又纷纷折戟收场、炮灰使然。
抚今追昔,当人们还没来得及反思悲伤,千视通已经从新老巨头的争食中掘开一条血道,收获大批客户、斩获巨额融资。
而所有的一切原因在胡大鹏博士看来可以总结为一点:持续在自己最懂的行业中做最擅长的事。
持续便是没有理由的坚持,最懂的行业无疑则是安防,而最擅长的事便是包括Re-ID(跨镜追踪)在内的AI技术。
Re-ID全称为Re-identification,是近年来计算机视觉领域的一个重点研究方向。
作为人脸识别技术的重要补充,其发展内核便是在不同视频中且无法获取清晰人脸特征信息前提下,机器通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性。
八十字描述便准确说明了该技术的发展意义,但从0到1的研究、发展、应用过程中,Re-ID技术经历了较长的蛰伏期。
不同于人脸特征信息的唯一性,Re-ID技术在运行过程中遇到的难题与人脸识别技术可以说根本不在一个层级。
由于不同摄像设备之间存在差异,行人外观易受穿着、尺度、遮挡、姿态和视角等影响,行人再识别是一个既具研究价值同时又极富挑战性的课题。
在胡大鹏博士看来,“Re-ID是AI技术在安防行业纵横发展中必过的一道槛,不能因为难所以让其停滞不前。”
他解释说,目前人脸识别技术在安防行业落地较多,同时也的确是发展所向,但在很多实际场景中,人脸识别技术作用并不突出。
受限于视频监控探头的安装高度及密度,在实际运行过程中,它们更多拍到的是行人的头顶、后脑勺或者侧脸。其次,即便拍到人脸,摄像头拍摄的像素可能不高,尤其是远景摄像头里面人脸截出来很可能都没有32x32的像素。所以人脸识别在实际的重识别应用中很可能有限,无法看清。
相关数据统计,目前全国运行的视频监控探头中,能够准确、清晰捕捉到人脸特征信息的视频监控摄像头不到10%。
而这便出现了一个非常棘手且尴尬的问题:视频监控探头遍地都是,而大部分探头却看不清楚人脸,当监控中的人走入另外一台摄像机的监控范围,机器如何辨别“谁”是 “谁”?
“Re-ID技术便可以很好地解决这个问题。”胡大鹏博士说道。
AI通过机器学习输出的结构化信息,其实本质上是建立了一个多维向量模型。这时候,机器可以给每一个模型一个编号,做跨摄像头的人形追踪。
装载“人形追踪”技术的监控摄像头可以将一个人的行为轨迹还原;之后,只要出现在任何一台可以识别人脸的摄像头中,就可以被轻易锁定,不会出现“断片”现象。
和单点监控相比,Re-ID方案通过多组摄像机的轨迹还原及人员比对让安防工作变得更为立体,方便办案民警对目标嫌疑人的行为轨迹、出行规律进行分析,进而为案情线索和实施灵活布控打击提供依据。
胡大鹏博士判断,“现阶段大家都在展示视频结构化,其实更难的是基于跨摄像头的人形追踪。该技术的发展对于安防行业来说也具颠覆性作用。”
千视通卡视联动技战法,Re-ID+人脸识别助力高效办案
作为计算机视觉研究的热门方向,了解到,除了千视通之外,目前包括旷视、云从等厂商已经在Re-ID技术研究上发力。
但就该技术在过去一段时间的发展落地来看,不同厂商的技术比拼之间、该技术与人脸识别技术的准确率之间,效果都相差甚远。
对于不同厂商的技术实力比拼,胡大鹏博士透露,千视通之所以能够得到比较好的结果,最大的原因则是与传统的全局表征或设定好的局部分割方法不同。
一、一般算法只考虑了全局、多粒度及水平汇集讯息,而水平汇集讯息主要用于把图片对齐。在实际的情况下,摄像头的角度多变,同时人行是非刚体,所以,垂直方向也理应同时考虑。对于此种情况,千视通在网络设计上开发了自研的垂直汇集及其关联的算法层,用以更好的适应以上情况。
二、针对损失函数进行改良,千视通的 Re-ID 算法提出了新的方案,能一方面增大类间距离并同时最细化类内距离。这代表能提高所计算出的高维特征向量的唯一性,并能有效的提高可识别率。
而相较人脸识别技术准确率尚存差距,胡大鹏博士坦言,就Re-ID技术来说,其数据采集特点鲜明:
总结来看,互联网无法提供有效数据,而大规模搜集又涉及到隐私问题,由于受影响因素复杂多样且数据集规模小,该技术数据获取难度非常大,算法难度也较大。
也就是说,Re-ID技术的天然短板让其在相同时间内不能超过人脸识别技术。
他同时补充说,技术发展永远都是单向向上过程,绝无止境,在对于Re-ID技术的精进上,千视通不会轻言放弃,并于香港成立了AI研究院,投入大量资源进行相关技术研究、攻克。
此外,他还认为,深耕安防产业,做好单一算法的同时,还需要关注其他算法以及产品的最终形态,毕竟这才是与用户真正接触的部分,其也决定了产品的实用性及企业的业界口碑。
鉴于此,千视通基于多年实战经验,提出一种卡视联动技战法,结合人脸识别和跨镜追踪(Re-ID)各自的特点及优势,以少量的人脸卡口加大量的普通监控探头的部署,既可锁定嫌疑人身份,又能重现嫌疑人轨迹,这种创新的综合型技战法可以较大概率对监控范围进行覆盖,具有极强的实战价值,对安防行业具有颠覆性意义。
知己知彼方能百战不殆
对于千视通所深耕的安防行业,胡大鹏博士认知非常深刻。
他说,过去几十年中,安防行业的快速发展遇到了诸多阻碍。比如前端智能化不理想,目前国内传统天网绝大部分摄像头还是标清和制高点的高清。它们并不能清晰地拍到公安想要的角度的图像。
比如各个部门之间的数据难以打通。中国原有的IT部门都是建立一个一个的“烟囱”。“烟囱式”架构也就是垂直的体系结构,每一个IT系统都有自己的存储和IT设备,以及独立的管理工具和数据库,不同的系统不能共享资源,不能交付和访问,形成了资源孤岛和信息孤岛。
再比如业务流程难以改变。用户需要改变原有的作业模式,针对各个模式去调整工作机制。
与此同时,他也看到了安防行业未来的一些发展机会及技术发展趋势。
本次2018北京安博会,千视通也带来了以“IDs构建感知芯视界”为主题的全新产品技术亮相,与参会各方一起围绕智慧城市相关的大数据、云计算、loT话题展开热烈的讨论。
基于结构化数据提取的边缘计算作为智慧城市效率提升的重要承载,无疑将会成为大会瞩目的焦点。
智慧城市数据处理中心需要通过边缘计算的助力,来接受少量、精准、无损的结构化视频数据,减缓带宽压力,节约系统存储和计算资源,辅助信息快速检索、定向数据挖掘及系统联动的实现,从而在整体上提升系统的实时响应速度和分析精度。
在大量硬件厂商的支持和投入之下,目前市场上已经开始出现了一些低成本、高算力的深度学习运算芯片,能够把部分算力转移出来,甚至转移至前端。
“端+云”方案不仅仅是将算力转移这么简单,它能让前/后端发挥它应有的功能,前端感知、后端认知,分工明确、算力协同,从而降低存储成本、提升数据传输效率、减轻后端分析压力,提升人工智能生态系统综合服务能力。
对于未来的发展目标及规划,胡大鹏博士表示会坚定“技术落地,算法先行”战略。
无论市场上有何声音,千视通依然会与精度“较劲”、依然会在AI安防上持续深耕,解锁更多业务场景。