基于树莓派的目标检测使用TensorFlow和OpenCV
扫描二维码
随时随地手机看文章
在计算机视觉领域,设计一个能够在一张图像中识别多个物体的综合机器学习模型是一项具有挑战性的任务。然而,随着深度学习和目标识别系统的最新进展,开发这种多目标识别系统变得更加容易。在这里,我们将使用TensorFlow和OpenCV与树莓派构建对象检测模型。
TensorFlow的对象检测API是一个建立在TensorFlow之上的开源框架,它提供了一系列检测模型,在COCO数据集、Kitti数据集、Open Images数据集、AVA v2.1数据集和iNaturalist物种检测数据集上进行了预训练。
所以在本教程中,我们将使用TensorFlow和树莓派构建一个对象检测系统。我们将使用来自COCO的预训练模型,该模型包含大约330K个标记图像。
需求
•树莓派3(任何版本)
•Pi相机模块
这里只有树莓派和Pi相机使用TensorFlow来构建这个树莓派对象检测。我们以前用树莓派相机,并建立了几个项目使用它,如-
•网络控制树莓派监视机器人
•基于物联网的智能wifi门铃
•智能闭路电视监控系统
•实时车牌识别使用树莓派和Python
在继续项目之前,让我们看一下先决条件。这里我们需要TensorFlow,对象检测API,预训练对象检测模型,OpenCV, Protobuf,以及这个项目中的一些其他依赖项。
在树莓派上安装TensorFlow用于对象检测
在安装TensorFlow和其他依赖项之前,需要对树莓派进行全面更新。使用以下命令将树莓派升级到最新版本:
更新完成后,使用下面的命令通过pip3安装TensorFlow:
然后安装Atlas库以获得对TensorFlow、Numpy和其他依赖项的支持。使用以下命令安装Atlas:
在树莓派3上安装OpenCV
使用以下命令安装所需的依赖项,以便在树莓派上安装OpenCV。我们之前在一些项目中使用了OpenCV和树莓派来进行车牌识别和人脸识别。
之后,使用下面的命令在树莓派上安装OpenCV。
安装Protobuf
协议缓冲区是谷歌用于序列化结构化数据的与语言无关、与平台无关的可扩展机制——想想XML,但更小、更快、更简单。使用下面的命令在树莓派上安装Protobuf:
使用下面的命令安装其余的库。
现在创建一个项目目录。我们将把TensorFlow模型和Protobuf放在一个文件夹下。使用下面的命令创建一个名为ObjectDetection的新项目目录
现在使用cd命令移动到项目目录中。
并从Github下载TensorFlow的模型。
接下来,进入ObjectDetection,然后进入research文件夹,从那里使用以下命令运行protobuf:
现在要检查这是否有效,请转到models>object_detection>protos,在那里您可以看到每个proto文件都创建了一个python文件。
当本地运行时,ObjectDetection/models/research/和slim目录应该被附加到PYTHONPATH。这可以通过在ObjectDetection/models/research/中运行以下命令来完成:
在树莓派上安装SSD_Lite:
接下来,我们将从TensorFlow检测模型动物园下载SSD_Lite模型,该模型是在COCO数据集上训练的。Tensorflow检测模型zoo提供了在COCO数据集、Kitti数据集、Open Images数据集、AVA v2.1数据集和iNaturalist物种检测数据集上预训练的检测模型集合。COCO代表上下文中的公共对象;这个数据集包含大约330K个带标签的图像。我们需要在object_detection目录中安装SSD_Lite模型,所以首先使用下面的命令导航到object_detection目录:
现在使用以下命令下载并解压缩SSD_Lite模型:
在安装了所有依赖项和SSD_Lite模型之后,您需要在同一目录(object_detection)中创建一个新的python文件。使用下面的命令创建一个新的python文件:
使用TensorFlow的OpenCV对象检测的完整代码在本页末尾给出。复制代码,将其粘贴到该文件中,并使用Ctrl+X > Y > Enter保存更改。
Python代码说明
完整的python代码在本页末尾给出。为了更好地解释,我们在这里解释代码的重要部分。
因此,在代码的开头,我们导入了将在这个项目中使用的所有必需的库。
sys。Path函数是一个列表,用于包含指向我们想要导入的模块的新文件路径。这是必需的,因为工作目录是object_detection文件夹。
接下来,我们提供包含对象检测模块的目录和冻结检测图。pb文件的路径,其中包含用于对象检测的模型。
现在,我们要加载所有的标签。标签映射将索引映射到类别名称。
现在,将Tensorflow模型装入内存。
物体周围的每个框表示检测到一个特定的物体
分数显示在结果图像上表示信心。
现在,在while循环中初始化相机对象,并将分辨率设置为(640,480),帧率设置为10fps
然后以图像为输入,运行模型,执行目标检测。
通过在被检测对象周围画一个带有置信度百分比和被检测对象的类标签的方框,可视化检测结果。
测试基于TensorFlow的对象检测
设置好一切后,导航到程序目录并启动对象检测程序。您将看到一个窗口,显示您的相机的实时视图(可能需要20到30秒)。已识别的对象周围会画一个矩形,如下图所示:
本文编译自iotdesignpro