深度学习兴起,与计算机视觉相融合推动AI发展
扫描二维码
随时随地手机看文章
深度学习不断推动视觉物联网应用变革,将经典的计算机视觉与深度学习相结合进行的研究,则显示出了更好的成果。
计算机视觉是物联网(IoT)广泛应用的基础。家庭成员通过安装了摄像头的家庭监控系统就能了解家里的所有情况。机器人和无人机使用视觉系统映射环境并避免行进中的障碍物。增强现实眼镜使用计算机视觉来覆盖用户视图上的重要信息;汽车通过来自安装在车辆上多个照相机捕捉的图像,向驾驶员提供有助于防止碰撞的环绕或“鸟瞰”视图。各种应用案例数不胜数。
多年来,设备功能(包括计算能力、内存容量、功耗、图像传感器分辨率以及光学系数)的指数式演变提高了物联网应用中计算机视觉的性能和成本效益。伴随这些而来的是精密软件算法的发展和完善,例如人脸检测和识别、物体检测和分类以及同步定位和映射等。
深度学习的兴起和面临的挑战近年来,人工智能(AI),尤其是深度学习的发展,进一步加快了物联网视觉应用的激增。与传统的计算机视觉技术相比,深度学习为物联网开发人员在诸如目标分类等任务方面提供了更高的准确性。由于深度学习中使用的神经网络是“通过训练”而不是“编程”实现的,使用这种方法的应用通常更易进行开发,从而更好地利用当前系统中可用的大量图像和视频数据。深度学习还提供了卓越的多功能性,这是因为与针对性更强的计算机视觉算法相比,神经网络研究和框架的用途更广。
但是,深度学习的优势并非没有权衡和挑战。深度学习需要大量的计算资源,用于训练和推测阶段。最近的研究表明,不同的深度学习模型所需的计算能力与深度学习技术的精度之间存在紧密的关系。在基于视觉的应用程序中,从75%到80%的精度转变可能需要不少于数十亿次额外的数学运算。
使用深度学习的视觉处理结果也取决于图像分辨率。例如,为了在目标分类过程中获得最充分的表现需要高分辨率的图像或视频,从而提升了需要处理、存储和传输的数据量。图像分辨率对于需要在远处探测和目标分类的应用尤为重要,例如企业安防摄像头。
计算机视觉与深度学习结合以获得更佳性能传统的计算机视觉和深度学习方法之间有明显的折中。传统的计算机视觉算法已经成熟,经过验证,并且在性能和功率效率方面进行了优化;而深度学习能提供更高的精度和多功能性,但是需要大量的计算资源。
那些希望快速实施高性能系统的用户发现,将传统计算机视觉和深度学习相结合的混合方法可以提供两全其美的解决方案。例如,在安防摄像头中,计算机视觉算法可以有效地检测场景中的人脸或移动物体。然后,通过深度学习来处理检测到的面部或目标图像的较小片段,以进行身份验证或目标分类。与整个场景、每帧深度学习相比,节省了大量的计算资源。
充分利用边缘计算就像使用纯粹的深度学习一样,用于视觉处理的混合方法可以充分利用边缘的异构计算能力。异构计算架构有助于提高视觉处理性能和能效,为不同的工作负载分配最高效的计算引擎。当深度学习推断是在DSP上执行而不是在CPU上执行时,测试结果显示目标检测延迟降低了10倍。
与云计算相比,在物联网设备本身上运行算法和神经网络推断也有助于降低延迟和带宽要求。边缘计算还可以通过减少云存储和处理要求来降低成本,同时通过避免在网络上传输敏感或可识别的数据来保护用户的隐私和安全。
深度学习创新正在推动物联网突破,以及将这些技术与传统算法相结合的混合技术的发展。视觉处理只是一个开始,因为相同的原则可以应用于其他领域,如音频分析等。随着边缘设备变得更加智能和强大,创新者可以开始构建此前无法实现的产品和应用。