计算机视觉中的图像：检测和分割有什么区别？

时间：2020-08-21 21:36:19

关键字：人工智能图像计算机视觉

手机看文章

扫描二维码
随时随地手机看文章

[导读]图像检测和图像分割之间的区别。当我们可以有一组安全摄像头照片，在每张照片上，我们想要识别照片中所有人的位置。通常有两种方法可以用于此：目标检测(Object Detection)和图像分割(Image Segmentation)。

图像检测和图像分割之间的区别。当我们可以有一组安全摄像头照片，在每张照片上，我们想要识别照片中所有人的位置。通常有两种方法可以用于此：目标检测(Object Detection)和图像分割(Image Segmentation)。

目标检测-预测包围盒

当我们说到物体检测时，我们通常会说到边界盒。这意味着我们的图像处理将在我们的图片中识别每个人周围的矩形。

边框通常由左上角的位置(2 个坐标)和宽度和高度(以像素为单位)定义。

来自开放图像数据集的注释图像。家庭堆雪人，来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

1、如何理解目标检测方法?

如果我们回到任务：识别图片上的所有人，则可以理解通过边界框进行对象检测的逻辑。

我们首先想到的解决方案是将图像切成小块，然后在每个子图像上应用图像分类，以区别该图像是否是人类。对单个图像进行分类是一项较容易的任务，并且是对象检测的一项，因此，他们采用了这种分步方法。

当前，YOLO模型(You Only Look Once)是解决此问题的伟大发明。 YOLO模型的开发人员已经构建了一个神经网络，该神经网络能够立即执行整个边界框方法!

2、当前用于目标检测的最佳模型

YOLO、Faster RCNN

图像分割-预测掩模：

一步一步地扫描图像的逻辑替代方法是远离画框，而是逐像素地注释图像。如果你这样做，你将会有一个更详细的模型，它基本上是输入图像的一个转换。

3、如何理解图像分割方法?

这个想法很基本：即使在扫描产品上的条形码时，也可以应用一种算法来转换输入信息(通过应用各种过滤器)，这样，除了条形码序列以外的所有信息在最终图像中都不可见。

这是在图像上定位条形码的基本方法，但与在图像分割中所发生的情况类似。

图像分割的返回格式称为掩码:与原始图像大小相同的图像，但是对于每个像素，它只有一个布尔值来指示对象是否存在。

如果我们允许多个类别，它就会变得更加复杂：例如，它可以将一个海滩景观分为三类：空气、海洋和沙子。

4、当下图像分割的最佳模型

Mask RCNN、Unet、Segnet

对象检测：

输入是一个矩阵(输入图像)，每个像素有 3 个值(红、绿、蓝)，如果是黑色和白色，则每个像素有 1 个值。

输出是由左上角和大小定义的边框列表。

图像分割：

输入是一个矩阵(输入图像)，每个像素有 3 个值(红、绿、蓝)，如果是黑色和白色，则每个像素有 1 个值。

输出是一个矩阵(掩模图像)，每个像素有一个包含指定类别的值。

计算机视觉中的图像：检测和分割有什么区别？

阿维塔、赛力斯已入股！华为引望可能成“中国博世”

Trianz与AWS达成战略合作协议，彻底改变云采用和管理方式

人工智能驱动工具SODA V将颠覆汽车市场，使汽车开发时间和成本降低90%

从容应对未知风险----解密亚马逊云科技的韧性之道

中国游戏市场开始复苏！腾讯、网易等巨头缩减在日本投资

独立自主！华为董事：致力打造不依赖西方的技术

华为张平安：数字世界话语权最终由生态繁荣决定！

中国通信服务公布2024年中期业绩

NVI技术创新联盟成立！自主生态将带动产业链高速发展

软通动力与长三角投资达成战略合作共谋数字生态新发展

海南区6家凯悦系酒店与岚图达成战略合作，共同推动新能源出行体验

安岚携手妮可•巴菲特开启疗愈之旅在秋日红叶的浪漫中疗愈身心

不惧美国封锁！华为：我们给大家提供系统、存储等

尼尔森IQ深耕中国四十载，共绘未来新篇章

第二十二届跨盈年度B2B营销高管峰会2025聚焦"营销竞取，打破市场内卷实现认知进化"

恒久动力驰骋天地美孚1号携手周冠宇邀您纵擎驰骋，劲享驾趣体验

美通社母公司Cision发布CisionOne平台，进军亚太地区媒体监测市场

移远通信推出大模型解决方案，重塑千行百业智能边界

高途公布2024年第二季度未经审计业绩

华为发布AI百校计划：培养AI人才每年获最高100万支持