知道吗?AI处理的视觉数据中99%是无用的
扫描二维码
随时随地手机看文章
数据是新经济的源泉,是新的能量。我们用不同的单位来衡量数据,从最初的KB、MB,到如今的GB、PB、TB,数据量越来越大,单位层级越来越高。在过去10年中,每年产生的数据量比过去几年产生的数据总和都多。
2020年会怎么样?大数据将走向何方?AI又在其中扮演怎样的角色?
99%的无用数据是什么?
很多数据中心现在已经建成,它们在处理大量的数据的同时,要消耗能量。数据量每4年可能会翻番,数据中心的规模也会翻番。
这么多数据中,只有1%是真正的纯信息,99%的数据是无用的,其中80%的大数据来自摄像头或其它拍摄装置,大多数是图片。什么是纯信息数据?怎么区分?这些数据对于设备、对于机器人、对于各种应用场景是不是有用?为什么要收集、处理这么多数据?
我们一直在研究这些问题。
150年前一位英国人发明了摄像机。摄像机不能完整地捕捉整个运动的过程, 而是捕捉到一系列连续的画面,将画面连接起来才形成了类似连续的一段影像。直到今天,我们仍将视频视作一系列的图片。
因此,我们需要改变传统的数据收集和处理方式,从而在视觉领域做出更多的贡献。
利用AI技术捕捉关键数据
在汽车、超高速相机、实时游戏及工业应用中,我们关注两点:一是抓取真正有意义的图像,二是节省能源。
所有的视觉数据都是由传感器按预定的节奏获取的。传统的方式是获取海量数据, 通过一层层剥离来减少数据量,逐渐提取有价值的关键视觉信息并最终做出决策。
我们要减少无效数据的收集,有效利用资源,提高效率和安全性。
数码相机每秒大概30帧,在高速运转时,一些图像会出现边缘模糊的情况。如果提高精细度,则会面临增加消耗电能的问题。
我们利用AI的感知和处理,通过增强感应器的性能, 努力改善动态过程中边缘模糊的情况。同时优化取样,抓取相关性大的图像,并且通过过滤90%以上的无用信息,来实现节能。
现在的数据如同一种新形式的石油,非常珍贵。我们需要不断抓取有用的数据, 使这些数据服务于我们。
构建先进的仿生视觉系统
想一想人的眼睛。人眼是如何看东西的?我们捕捉动态信息,而非关注静止不动的部分,这时大脑和眼睛协调工作。人脑只收集有意义的信息,从而快速做出响应和决定,这非常高效。大脑要处理的信息量很大,而大脑的功率是25W,非常节能。
我们要打破传统方式,开发出与拍摄装置和AI结合的新技术,模拟大脑和眼睛的工作,依赖场景动态学, 仅捕捉关键信息,同时综合考虑时间、能量、计算成本等参数,让人与机器能够和谐共存。
例如,在自动驾驶中100%地避免事故,在永不关闭的监控系统上实现高安全性和效率,无人机凭直觉避免碰撞,甚至让失明的人都可以恢复视觉。
我们希望汽车能检测并绕开各种障碍以及道路上的其他汽车和行人。
交通场景下有一些动态过程,如汽车从隧道里开出来突然一亮,司机的眼睛被晃到就可能发生事故。运用芯片的感应器能够了解相关光照情况下的具体交通量, 如同神经形态传递。
我们利用基于事件的视觉系统来改革所有的动态应用,实现嵌入式事件流控制及被动边缘检测,采用低功耗传感器,并使用高时间分辨率重建。
我们的系统只感知场景核心,运算数据仅为传统方法的十分之一到千分之一;小于10mW的低功耗;微秒级的事件采样,等同于每秒10000帧图像;捕捉极端光照条件下的隐藏信息,大于120dB的高动态范围;每个像素异步曝光,不产生运动模糊。
我们的系统可以用于安防/人工智能机器人,提高机器和工艺生产率,调试和维护感兴趣的区域;在移动/可穿戴设备物联网中,实现智能存在检测以及实时高速SLAM ,进行眼动追踪;在无人驾驶中,用实时高速的机器视觉以及HDR和低数据速率来提高安全性,并降低系统的复杂性和成本。