嵌入式机器视觉系统中ARM与DSP的数据通信方法
扫描二维码
随时随地手机看文章
DSP对数字信号和数值算法具有强大的运算处理能力,因而在信号采集与处理中被广泛应用,但其在任务管理、实时控制、人机交互等方面不占优势。而ARM微控制器则控制功能强大,可以加载嵌入式操作系统,且能够提供良好的人机交互、任务管理、网络通信等方面功能。因此,发挥DSP和ARM处理器各自的优势,采用ARM+DSP结构的设计方案已成为嵌入式系统的研究热点,倍受关注。通过嵌入式机器视觉系统的设计实例,阐述ARM与DSP有机结合的设计思想,重点研究ARM与DSP之间的数据通信。
1 嵌入式机器视觉系统总体方案
采用ARM+DSP结构的机器视觉系统总体结构如图l所示。以三星公司高性能ARM处理器S3C2440作为主控制器,配置并移植Linux操作系统,同时以TI公司的DSP芯片TMS320C5402为图像处理的协处理器,通过对DSP芯片自带的HPI接口的硬件连接方案和驱动程序设计,将二者有机地结合起来,各自发挥其独特优势,协调配合,完成目标采集、处理与视觉跟踪。
首先由智能摄像机采集现场运动目标的图像,由ARM控制将数据存放在ARM与DSP的公共存储区域中,并通知信号处理模块DSP调用各种算法(帧间差分、图像分割、特征提取、形心计算等)对视频图像进行处理,完成目标的识别与定位,并将结果信息传给ARM处理器,由ARM控制步进电机,调整PTZ摄像机位姿(水平转动P-Pan、垂直转动T-Tilt、景深伸缩Z-Zoom),使其对准运动目标,实现实时跟踪。此外,ARM处理器还负责多任务管理、人机交互及中断报警等。
作为双核系统,双核各自拥有很好的性能,于是主机ARM与协处理器DSP之间能否进行快速可靠的数据交换,直接决定机器视觉系统的运行效率。在硬件设计方面,采用主机并行接口HPI实现主机ARM与协处理器DSP之间的硬件直连,设计简单方便,时钟频率可达到DSP时钟频率的1/5,能够支持DSP与主机之间的高速数据传输。在软件设计方面,则移植嵌入式Linux操作系统,将HPI看作字符设备完成了驱动程序的设计。
2 双机通信硬件设计
2.1 HPI接口简介
主机接口(HPI)是TI公司C54x系列定点信号处理器(DSP)内部自带的接口部件,通过它可以方便地实现DSP与其他主机连接。C54x中的主机接口主要有3种类型:标准8位主机接口HPI-8,增强8位主机接口HPI-8,增强16位主机接口HPI-16。增强型的HPI可以允许主机访问DSP所有的片上RAM单元,而标准主机接口只允许访问固定的2 K片上RAM。本文中用到的TMS320C5402拥有增强HPI-16主机接口。它由以下5部分组成:
1)HPI存储器(DARAM) 传送主机与DSP之间的数据,在一个机器周期内能被访问2次,可以用作通用的双导址数据RAM或者程序RAM。
2)HPI地址寄存器(HPIA) 只有主机能对其进行直接访问。该寄存器中存放着当前寻址的HPI存储单元的地址。
3)HPI控制寄存器(HPIC) 地址002CH,主机和DSP都能对他直接访问,用来保存HPI操作的控制和状态位。
4)HPI数据锁存器(HPID) 只有主机能对它进行直接访问。如果当前进行的是读操作,则HPID中存放的是要从HPI存储器中读出的数据;如果当前进行写操作,则HPID中存放的是将要写到HPI存储器的数据。
5)HPI控制逻辑 处理HPI与主机之间的接口信号。
接口电路中使用的引脚及其作用是:HD[15:O]:并行、双向、三态的数据总线,不传递数据时为高阻态;HHWIL:半字定义选择引脚,用来表示第一或者第二半字。当低电平时表示第一半字;当高电平时表示第二半字。:读/写输入信号。高电平表示主机要读HPI,低电平表示写HPI。若主机没有读/写选通,则可以用一根地址线代替。HCNTL0和HCNTLl控制引脚表示访问那个内部HPI寄存器和访问寄存器的类型。表l是具体功能说明。:输入主要作为HPI的使能信号,而信号控制HPI数据传递;它们三者生成内部选通信号。就绪信号引脚,高电平表示HPI已经准备好执行1次数据传送;低电平表示HPI正忙。HINT:主机外部中断信号,用于HPI向主机发出中断。地址选通信号,仅用于复用方式。对于地址/数据总线分开的主机,必须把信号连接到高电平。
2.2 接口电路及其工作原理
S3C2440与TMS320C5402通过HPI连接的接口电路如图2所示,二者连接简洁方便,不必使用任何的附加电路。工作时,ARM首先初始化控制寄存器HPIC和地址寄存器HPIA,然后对HPID进行读写。初始化HPIC、HPIA时,通过A2、A3、A4、A5对应的地址进行操作,设置寄存器访问控制HCNTL0、HCNTL1、读写控制和半字访问HHWIL,配置好HPIC,并在HPIA中写入HPI存储器的起始地址。因为ARM主机具有独立的地址总线和数据总线,采用非复用方式,所以将HAS信号接高电平(VCC)。S3C2440的nWAIT信号与HPI的信号逻辑上反向,之间用反相器连接。 S3C2440通过片选信号nGCS2、读使能信号nOE、写使能信号nWE三者生成内部选通信号,控制对HPI的读写。
[!--empirenews.page--]
3 软件设计
3.1 Linux驱动程序
Linux操作系统引入设备文件的概念,即把每一个设备都看作一个文件,像对待文件一样对设备进行操作。在Linux操作系统下,设备文件主要有3种类型:字符设备、块设备、网络设备,各自对应一种类型的设备驱动程序。本文设计的HPI接口的驱动程序属于字符设备驱动程序。
Linux下的驱动程序是为相应的设备编写多个基本函数,填充file_operations结构体。其中定义了实现各种操作函数。如下所示:
其中,open和release完成设备的打开和关闭。mmap为内存地址映射操作。驱动程序的设计是通过实现个中操作函数的基本功能,为相应的设备在应用层提供统一的接口。
下面是本文中的HPI接口的驱动程序的设备入口hpi_open函数,它负责打开、准备设备。
任何时候对字符设备(HPI)接口进行打开操作,都会调用设备的open入口点(hpi_open)。所以open函数(hpi_open)必须对将要进行的I/O操作(对DSP读写数据)做好必要的准备工作,例如设备是独占的,则open函数(hpi_open)必须将设备标记成忙状态,如上面例程中的①处两行所示。
3.2 驱动程序中映射的实现
由于在Linux系统中,用户应用程序不能直接对驱动程序的内存空间进行操作,因此必须用到内存映射机制。内存映射是指把内核中的特定的内存空间映射到用户空间的内存中去。对驱动程序来说,内存映射可以提供给用户程序直接访问设备内存的能力。
mmap系统调用映射一个设备,意味着使用户空间的一段地址关联到设备内存上,这使得只要程序在分配的地址范围内进行读取或者写入,实际上就是对设备的访问。
mmap方法是file_operations结构的一部分,要实现映射必须分两步:
1)调用内核中的remap_page_range函数,它的功能是:构造用于映射一段物理地址的新页表,实现了内核空间与用户空间的映射,其原型如下:
函数参数的确切含义如下:unsigned long virt_add为重映射开始处的虚拟地址。这个函数为虚地址空间virt_add和virt_add+size之间的范围构造页表。unsigned long phys_add为虚拟地址应该映射到的物理地址。unsigned long size为被重映射的区域的大小,以字节为单位。pgprot_t prot为新VMA所请求的“保护”属性。驱动程序不必修改保护,在vma->vma_page_prot中找到的参数可以不加改变地使用。
本课题中使用mmap调用的代码如下:
这样就为DSP的HPI接口所对应的总线物理地址:0x10000000(对应nGCS2)在vma->vm_start和vma->vm_end之间构造了新的页表。
2)在构造好新页表之后,可以调用mmap函数完成映射,从图2可以看到硬件连接图中的连接DSP片选信号的是引脚nGCS2,从图3中查出它在内存空间对应的位置是0x10000000。mmap函数的原型是:mmap(void*start,sizelength,int prot,int flags,int fd,off_toff-set)。用以下语句获得映射后的地址:
hpi_mmap_add=mmap(NULL,length,PROT_READ|PROT_WRITE,MAP_SHARED,hpi_fd,0)其中参数start指明描述字fd对应的“文件”(也就是/dev/hpi设备)在进程地址空间内的映射区的开始地址,必须是页面对齐的地址,通常设为NULL,让内核去自动选择开始地址。任何情况下,mmap的返回值为内存映射区的开始地址。这样通过对hpi_mmap_add操作,实现对起始地址为0x10000000的内存段操作。[!--empirenews.page--]
3.3 驱动程序的内核加载方式
在完成了嵌入式Linux驱动程序的编写测试工作后,下一步就是将编写好的驱动程序加载到系统内核,完成驱动硬件的工作。通常有以下两种做法:
1)驱动程序直接编译入内核 采用这种方式编译的驱动程序在内核启动时就已经在内存中,运行时不需要再自行加载驱动,可以保留专用的存储器空间。
2)驱动程序的模块加载 采用模块加载方式的驱动程序将会以模块形式存储在文件系统里,需要时动态载入内核即可,使得驱动程序按需加载,不用时节省内存,并且驱动程序相对独立于内核,升级灵活,授权方式灵活。本文就采用此种方式。
因为采用的是模块加载方式,所以还需要借助两个重要的函数init_module()和cleanup_module(),完成模块的注册和卸载。具体源码可以参见/usr/src/linux/kemel/module.c。在2.3版本以后采用了新的方法命名这两个函数,定义exampie_init()代替init_module()函数,example_cleanup()代替cleanup_module()函数。在程序的最后用下面两行代码进行声明:
module_init(S3C2440_HPI_init);
module_exit(S3C2440_HPI_exit);
3.4 接口具体应用的设计方法
利用编写好的驱动程序,用户可以编写出不同的应用接口程序。下面给出自增写的方法:
根据图2的接口电路,A2,A3,A4,A5对应的接口分别是HCNTI0,HCNTL1,,HHWIL,当自增模式写低半字时,它们的值应该分别是:HCNTL0=0,HCNTL1=1,,HHWIL=O,即A[5:2]=0010,在HPI_VA_BASE上增加偏移就可以对控制口线控制。所以自增写第一半字时,加00000100即:0x04,当自增模式写高字节时,它们的值应该是HCNTL0=0,HCNTL1=1,,HHWIL=1,即A[5:2]=1010。所以自增写第二半字时,加00101000即:0x28。对HPI控制寄存器写地址用如下宏定义:
另外,在自增写过程中,对于作为接收端的DSP处理器,需要明确:1)是否准备就绪,可以进行写入数据,HPI-16中可以通过HPIC寄存器查询HRDY的状态,当HRDY为1时,即表明HPI已经准备就绪;2)指明要写数据的区域址,即dsp_add_w=(hpi.hpi_dsp_add),这是从应用程序传过来的参数,以确定写数据区域的起始地址。自增写的代码和注释如下:
4 结束语
通过一个嵌入式机器视觉系统工程实例,阐述了嵌入式系统中,用ARM+DSP的双核结构加载Linux操作系统,通过HPI接口进行通信和交换数据的设计方法,设计了HPI接口连接的硬件电路和Linux环境下的驱动程序,描述了该接口的具体应用设计方法。
ARM+DSP的双核系统是新型的嵌入式机器视觉系统构建方法,而这里设计的通过HPI接口交换数据的双机通信方法,在机器视觉系统项目中被成功地应用证明,传输数据速度达到10 Mb/s,能够满足嵌入式系统对实时性的要求,具有广阔的应用前景。但在应用中需要注意的是:HPI接口的读写过程都涉及到公共的寄存器(HPI的控制寄存器、地址寄存器和数据寄存器)及HPI接口提供给主机(host)端读写的内存的相关操作,所以在特定的应用程序、驱动程序的设计中,一定要用信号量等互斥机制加以保护,否则,会出现读写错乱的现象。