计算机视觉这么火,你真的懂吗?
扫描二维码
随时随地手机看文章
在学习期间调整生成器的权重,目标是使生成的图像与该类的真实图像尽可能相似,以至于判别器无法区分出来。
以下是最大的GAN(https://arxiv.org/abs/1809.11096)生成的图像示例。
关于GAN在keras上的实现,请参阅: https://github.com/eriklindernoren/Keras-GAN
计算机视觉所需硬件
要训练大型模型,需要用到大量资源。实现这一目标有两种方法。首先是使用云服务,比如google cloud或者aws。第二种方法是自己组装一台带有GPU的计算机。
只需1000美元,就可以组装一台相当好的机器来训练深度学习模型。
更多细节请参阅: https://hypraptive.github.io/2017/02/13/dl-computer-build.html
计算机视觉的用户界面
ownphotos的face仪表盘
Ownphotos 是一个令人惊叹的用户界面,允许您导入照片并自动计算脸部嵌入,进行目标识别和人脸识别。
它用到的算法:
人脸识别:face_recognition目标检测:densecap, places365
应用
计算机视觉有很多应用:
个人图片整理自动驾驶汽车自动无人机验证码识别/OCR过滤网站/应用程序上的图片自动标记应用程序的图片从视频(电视节目,电影)中提取信息视觉问答:结合自然语言处理和计算机视觉艺术:生成式对抗网络
结论
正如我们这里所见,上述视觉领域各方面的实现中诞生了许多新的有趣的方法和应用。
我认为人工智能最有趣的,在各领域尤其在视觉领域中,是学习可再使用的算法。让这些方法适用于处理越来越多的任务而不需要更多算力资源和数据 :
迁移学习 : 使快速重新训练预处理了的大型神经网络成为可能嵌入 (例如facenet) : 使识别许多类而无需对这些类进行训练成为可能