图像处理与计算机视觉一体化:未来的必然趋势
扫描二维码
随时随地手机看文章
消费者和企业总想“以少获多”,并且总会这样做;这也在无形中推动了我们的市场发展,为技术创新者创造了无限机会。在系统领域,“以少获多”往往意味着“高度集成”。将更多功能集中到一个芯片中可以降低成本,使解决方案在价格敏感的市场上更具竞争力,还可以降低功耗,延长电池寿命,减少移动或远程应用的维护,解决充电难题。
我们已经习惯许多终端设备中使用AI驱动的计算机视觉(CV)。目前,许多ADAS(高级驾驶辅助系统)应用程序主要用于防撞(包括向前行驶和倒车)、车道偏离检测,当然,更多的是用于自动和半自动车辆。无人机不再依赖我们导航、感知和躲避障碍物。AR(增强现实)和VR(虚拟现实)设备需要与视觉结合的人工智能来感知我们的位置和姿势,以确保低延迟的优质体验(最大限度避免晕动病)。为了减少存储需求,用于运动/动作相机的摄像头正趋向于利用AI来捕捉重要的视频序列,。设施安全应用程序同样只需捕获重要序列,比如在画面中移动的人,更重要的是避免持续的人工监视。
为什么我们希望将图像处理添加到这些功能中呢?可以从任何需要一个广角视图,甚至是360度全景视图的用例开始,我们已经熟悉了在最近一些汽车的前/后视图屏幕上可以选择显示俯视图。这是如何做到的?其方法是通过拼接两个或多个相机的视图,然后进行矫正,以生成某种程度的无失真图像。当然,图像渲染的质量水平各不相同,有的图像明显没有其他图像那么清晰。其中一个重要应用是在倒车时利用后视摄像头检测障碍物,并自动触发刹车。
从中,我们可以更加深入地了解图像处理的重要性。OEM(原始设备制造商)不希望使用多个后视摄像头(成本高昂),他们更希望选用配备广角镜头的单一摄像头。你可能见过这些“鱼眼”镜头捕捉的图像有趣,但高度失真。这种失真的矫正处理(实时自适应去扭曲校正)不仅仅是为了美观,而是在通过神经网络处理图像以检测目标之前的必要步骤。许多安全应用程序同样需要做此类预处理。如果可以使用带矫正功能的单个鱼眼镜头,而不是多个摄像头,那么整个设备就会更便宜。
图像稳定是另一个重要应用,尤其是对于体育活动领域的消费者而言。如果你要从滑雪斜坡上滑下来,或者从岩石嶙峋的山腰骑车下来,你肯定不希望你的头戴式相机记录下颠簸的画面。大多数人都希望所有不平稳的动作能平稳成像。图像处理还可以帮助在低光条件下增强对比度,也可以支持自动对焦应用。虽然这些功能需要不同类型的处理元件,但是将它们组合到一个高效的嵌入式处理器中就可以集中实现所有性能,优化功率,更重要的是可以降低许多价格敏感性应用设备的成本。
这些想法很好,但是这样高度集成的解决方案会不会很快被下一代产品所淘汰?或者在下一次的网络训练中得到更差的处理效果?毕竟,神经网络算法的发展非常快。你将如何应对这些变化?首先,你需要图形编译器的支持。该编译器能够从行业标准的学习平台映射到目标网络,并通过选择每个层的定点位宽来优化目标网络。其次,你必须按要求重新设计神经网络架构,并且能够模拟更新,以优化功率和性能,然后重新运行编译器,将训练好的网络映射到你更新的设备上。
此外,还需要为图像处理提供充足的冗余,以便于可以充分利用最新技术。进一步了解CEVA NeuPro-解决方案如何实现该目标。