如何使用人工智能来大规模管理图像和视频
扫描二维码
随时随地手机看文章
(文章来源:教育新闻网)
AI正在发现图像和视频的多种用途,包括自动裁剪和调整大小,自动图像标记以及创建视频自动预览。本文研究了五个示例,这些示例说明了Cloudinary如何使用AI大规模实现图像和视频管理。
大规模管理图像和视频的生命周期已成为开发人员的巨大挑战。没有设计者和开发者的大军或应用自动化,维护拥有数千种媒体资产和大量用户生成内容的站点是不可能的。
我从个人经验中知道这一点。我最初是一个顾问团队,后来与我的Cloudinary联合创始人一再重复手动解决与图像和视频管理相关的请求。我们看到了自动化这些流程的巨大机会– Cloudinary诞生了。这是五个示例,说明了我们如何在整个平台上应用AI来实现大规模图像和视频管理。
鉴于存在大量的设备和浏览器,准确,快速且大规模地裁剪图像具有挑战性。它需要以许多高宽比传送相同的图像,并可能根据其尺寸在主要被摄体上更近或更宽地裁剪。
裁剪时,图像的最重要部分应保持可见,甚至位于中央。说起来容易做起来难。最近,一家时装零售商无意间剪掉了它要促销的鞋子,但是因为模特的脚不在框架的中央。另一种方法是基于数学像素分析来裁剪图像,在该图像上您将关注像素比其他像素更清晰的区域。尽管此方法功能强大,但通常还不够。
为了正确进行自动裁剪,您需要像肉眼一样观看图像。我们对视觉内容使用基于深度学习的媒体转换,以检测图像中最有可能引起人们注意的主题。为此,我们使用大量图像和相应的人工输入来提供图像自动裁剪深度学习机制。这教导机器识别图像中的重要区域,而不管其主题和布局如何。该过程涉及由基于GPU的硬件集群执行的高级计算,该集群可实时处理数百万种作物请求。
但是深度学习甚至可以做更多的事情。以零售商裁剪想要出售的鞋子为例。多亏了另一种深度学习算法,我们才能为特定对象或类别(例如鞋子)赋予最高的保存(“不裁剪”)优先级。