一种基于服务机器人的视觉系统设计
扫描二维码
随时随地手机看文章
刘京诚,廖智勇,朱木健 摘 要:通过采用图像传感器ov7635采集图像,帧存储器al422b进行数据缓存,cpld控制时序,dsp进行图像处理,构建了一个图像采集的硬件系统。在图像软件处理中,采用阈值向量判断法和改进的种子填充法来完成彩色图像的识别和分割,在分割中计算图像的几何矩,利用全局图像的几何矩特征量构建图像雅可比矩阵,并用推导的图像雅可比矩阵完成一个图像反馈与目标运动自适应补偿的视觉跟踪系统。系统采用了tft液晶来直观显示视觉识别和跟踪的效果。 关键词:视觉系统;阈值向量;种子填充;图像矩;雅可比矩阵 随着计算机科学和自动控制技术的发展,越来越多的不同种类的智能机器人出现在工厂、生活当中,机器人视觉系统作为智能机器人系统中一个重要的子系统,也越来越受到人们的重视。它涉及了图像处理、模式识别和视觉跟踪等领域。不同种类的机器人由于工作的重点不一样,它的视觉系统在软件或硬件上都有着细微的差别。本文研究基于服务机器人的单目视觉系统。它处理的是二维图像,是基于对无遮挡物体颜色和形状的识别以及3d目标物体的平动跟踪。 视觉系统是一个非常复杂的系统,它既要做到图像的准确采集还要做到对外界变化反应的实时性,同时还需要对外界运动的目标实时跟踪。因此,视觉系统对硬件和软件系统都提出了较高的要求。目前比较流行的足球机器人技术,它的视觉系统属于比较典型的快速识别和反应类型。一般情况下,它是通过彩色标志定标的方法来达到对队员和目标的识别,以及通过扩展卡尔曼滤波器的预测功能来实现对目标的跟踪功能。在硬件上,采用一个现成的摄像机来实现一个机器人的图像采集系统。 本系统在设计上采用cmos图像传感器代替ccd类型传感器进行采集图像,dsp处理芯片tms320vc5509a进行图像处理以及作为cpu控制,在设计过程中,为了直观显现机器人视觉系统识别和跟踪的效果,专门采用了一个tft格式的液晶来直观显示。软件上,采用了一部分足球机器人的视觉技术来达到对目标的快速识别,通过全局的特征矩构建的雅可比矩阵达到对目标的自适应跟踪。1 硬件部分设计 图1为系统硬件电路的功能模块框图。1.1 图像采集 视觉镜头把外部的图像信息成像在图像传感器的面阵单元上。目前流行的图像传感器有面阵ccd(charged coupled device,电荷耦合器件)型和面阵cmos两种。相比较ccd型的图像传感器,cmos图像传感器的有源像素单元为每一个像素提供了放大器,只需一个单供电低逻辑电平电压,功耗只相当于ccd的十分之一。cmos图像传感器内部集成了a/d转换部分,直接输出数字信号。基于这些因素,本系统采用了omnivision公司推出的cmos彩色图像传感器ov7635。 ov7635的分辨力为640x480,能输出3种格式的8位数据:ycbcr4:2:2模式、rgb4:2:2模式和rgb原始数据模式。输出vga格式最大可达到30fps(fps:每秒帧数)。能工作在逐行扫描下和隔行扫描下。ov7635有主模式和从模式两种工作模式。在主模式下,同步信号和时钟不由外围设备控制。在从模式下,ov7635的场同步信号vsync,行同步信号href以及系统的晶振频率xclk均由外部设备控制。本系统采用的是主模式。ov7635通过i2c总线配置片内寄存器,使其输出原始数据。系统上电复位后,由dsp芯片的i2c总线信号对cmos寄存器初始化。然后ov7635就按要求输出图像信号。包括行同步信号href,场同步信号vsync,像素时钟信号pclk,数字图像信号。1.2 液晶显示 为了很直观的看到视觉系统对人的识别和跟踪效果,采用了一片innolux公司的pt035tn01液晶显示屏。为了不增加对dsp的负担,同时也为了实时看到对外界目标物体的跟踪效果,液晶显示的数据不经由dsp,直接通过传感器ov7635输出的图像数据信号和cpld控制时序来进行显示。pt035tn01是3.5英寸tft格式的液晶,分辨力为320×3(rgb)×240,液晶if1、if2两输入控制脚对输入的数据格式进行选择:串行rgb格式、ccir601格式、ccir656格式。液晶的扫描模式有4种。本视觉系统采用的输入数据格式是ccir601格式,扫描模式为由上到下和左到右的扫描模式。 在ccir601格式下,图像传感器输出的像素时钟pclk通过cpld二分频作为液晶的工作时钟,图像传感器输出的行同步信号href经过cp