有害动物智能声防系统中音频控制子系统的研制
扫描二维码
随时随地手机看文章
1 智能声防系统原理
如图1所示,智能声防系统的结构分为3层,底层是带有热释电传感器的探测节点,负责探测有害动物在农田中出没的位置;中间层为执行器节点,负责存储、播放声防音频文件;上层是总控制器,负责监控整个系统的运行。系统的各层之间以无线方式进行通信。总控制器定时采集环境信息(如温度、光照),结合农田地理位置、作物种类等信息,并通过查询内部数据库,以当时最有可能出没的2种有害动物作为声防目标,然后定时发送给执行器节点。执行器节点有触发、随机2种工作模式。触发模式下,探测节点探测到有害动物后,向相距最近的执行器节点发出命令。执行器节点根据最近更新的声防目标播放对应的音频文件。随机模式下,执行器节点根据定时更新的声防目标自动播放声防音频文件。每次播放前,都会在工作参数确定的时间范围内随机产生一个间隔时间,并按其进行延时,以使声防系统中不同执行器节点在执行声防时具有随机性,从而降低有害动物对声防系统的适应性。
执行器节点由无线通信模块、音频控制子系统、扬声器以及供电模块等组成。除音频控制子系统外,其他功能模块均采用成熟产品。
执行器节点的主要功能由音频控制子系统完成,按实现功能考虑,其应包括大容量高保真数字音频信号存储、解码输出及多种播放模式选控等。为达到高保真的音质要求,声防音频信号的采样率选为44 kHz,采样位数确定为16 bit,其存储格式采用能较好兼顾压缩比和音质的MP3格式;为方便声防音频文件的升级,存储器选用了方便热插拔的SD卡或U盘。
现有的音频解码方案有硬件解码和软件解码2类。常用的硬件解码芯片有ST公司的ST016、SANYO公司的LC82310G等,使用时常配以单片机实现控制功能。为方便开发,已有厂商研制出将硬件解码器和单片机以及其他外围器件集成在一起的SoC芯片,如ATMEL公司的AT89C51SND1。
软件解码方案主要基于DSP平台和ARM平台构建,其中ARM平台可搭配嵌入式操作系统,能较好地管理和支持底层硬件设备,且有大量开源解码软件可供选择,软件移植比DSP平台相对容易。
2 方案1的构建及实现
2.1 方案1的硬件构成及实现
音频控制子系统的“单片机+硬件解码”构建与使用单独的硬件解码芯片配合其他控制芯片相比,SoC芯片在电路结构和开发成本上均有较大优势。AT89C51SND1是MP3解码应用中使用最多的SoC芯片之一。它实质上是一款集成了DSP硬件解码器的C51单片机,提供有USB DEVICE、SPI等设备接口,且有54个I/O口供用户使用。基于AT89C51SND1构成音频控制子系统的硬件结构见图2。
[!--empirenews.page--] 由图2可见,AT89C51SND1通过RS-232串口与无线通信模块相连,采用自定义协议与其进行通信,以实现执行器节点与探测节点、总控制器之间的无线通信。因AT89C51SND1没有集成USB HOST接口,故选择USB接口芯片CH375读写U盘。而实际测试中发现,CH375不能识别有些厂家生产的U盘。故为确保存储的可靠性,选用SD卡作存储介质。SD卡的读写分为SD和SPI方式,而AT89C51SND1只提供MMC接口,无法兼容SD方式,故采用SPI方式读写SD卡。AT89C51SND1上集成了音频输出接口,可将解码后的音频数据以PCM格式或I2S格式输出到后级的低功耗音频数模转换芯片PCM1770。AT89C51SND1通过USB DEVICE接口作为USB从设备与计算机相连,用于烧写应用程序。AT89C51SND1还可通过I/O口与点阵式LCD相连,以输出相关信息。
2.2 方案1的软件设计
图3是音频控制子系统构建方案1的软件流程。上电后,音频控制子系统先完成各种外围设备(包括SD卡、DAC芯片以及LCD等)的检测和初始化,随后进入工作循环。首先对工作模式变量进行判断,若是触发模式,则返回重做判断;若为随机模式,则调用随机数生成子程序,随机生成一个等待时间并延时等待,然后从存储器中读取声防目标变量指定的音频文件并解码播放。在整个工作循环过程中,音频控制子系统开放串口中断。当串口接收到来自无线通信模块的信息时,即产生串口中断。中断处理程序对接收到的信息进行判断,若是来自探测节点的声防命令,且当前处于触发工作模式,则根据最近更新的声防目标播放对应的音频文件,然后通过无线通信模块向总控制器返回一个执行记录,用于统计该地区有害动物的出没规律;如果不是声防命令,而是来自总控制器的信息,则更新对应的控制变量,例如工作模式、间隔时间范围、声防目标文件、音量大小等。
音频控制子系统构建方案1的软件,从功能上主要分为随机数生成、SD卡驱动、FAT文件管理、串口通信以及解码控制等5部分。
随机数生成子程序通过调用库函数rand(),在间隔时间变量确定的范围内生成一个随机数并执行延时。
SD卡驱动实现在SPI方式下以扇区(512 B)为单位对SD卡上数据的读写。
由于存储器上一般使用FAT文件格式存放和管理文件,FAT文件管理子程序可实现对存储器上文件目录、数据存放位置的管理,以及在SD卡驱动下读取指定文件的数据。
串口通信子程序实现串口初始化和以字节为单位的数据收发,并在此基础上实现以帧为单位且带有数据校验的串口通信。在本方案的串口协议中,1帧数据包括8个字节。其中,第1字节是约定起始标志;第2字节为发送者地址;第3字节是消息种类(如“更新声防目标”、“改变音量大小”等);第4~7字节是消息参数;第8字节为前7个字节的和,用于校验数据传输的正确性,以保证通信的可靠性。
解码控制子程序是音频控制子系统软件的重要部分,由于单片机上集成了MP3硬件解码器,用户无需关心解码的具体过程,只要设置好解码器参数并及时将数据送入解码缓冲区即可。MP3音频文件内容分3部分,首、尾2部分用于记录音频文件名称、制作者等信息;中间部分以帧为单位存放压缩音频数据,帧头中包含有音频文件的文件类型、采样率、比特率、声道数等信息。在播放指定的MP3音频文件时,单片机先通过FAT文件管理子程序读取指定文件一个扇区的数据,并以此设置好硬件解码器相关参数;然后,将音频数据依次写入解码器缓冲区,解码器自动对MP3数据解码,并将解码后的数据送入DAC。为实现连续播放,解码控制子程序需要保证在解码数据缓冲区空闲时及时写入待解码的数据。
3 方案2的构建及实现
3.1 方案二的硬件结构及实现
方案2为音频控制子系统的“ARM微处理器+软件解码”构建,该方案的硬件结构如图4所示。ARM微处理器选用了三星公司生产的S3C2440芯片,并扩展了64 MB FLASH,用于存储引导程序和操作系统内核等,同时,还扩展了64 MB SDRAM作为程序的运行空间。S3C2440基于ARM920T内核,工作频率达400 MHz,集成有SD、USB Host、LCD、音频、视频等丰富的外设接口,并提供有130个I/O口,是一款高性能、低功耗微处理器芯片[3]。无线通信模块通过RS-232串口与微处理器相连。由于S3C2440上的USB HOST接口只支持USB1.1协议,考虑到兼容性,该方案中仍选择SD卡作为存储器,并以SD方式对其进行读写。S3C2440集成有LCD和触摸屏控制器,可根据需要选择相应的人机交互设备,例如点阵式LCD。S3C2440通过I2S音频接口与具有A/D和D/A功能的低功耗音频处理芯片UDA1341相连,实现音频信号的采集和输出。该系统经以太网控制芯片DM9000A接入以太网,用于与微机相连进行开发调试。为提高系统硬件的电磁兼容性能及可扩展性,硬件设计上采用了核心板+扩展板的模块化结构。核心板上包括S3C2440、FLASH和SDRAM芯片,其借助插针与扩展板相连。扩展板集成了各种外围芯片和接口,可据实际需求更改设计方案,方便系统硬件的扩展升级。
3.2 方案2的软件设计
方案2的软件结构分为3层,见图5。软件开发平台采用了嵌入式Linux操作系统。Linux是一种稳定、高效、免费的开源操作系统,不仅支持多种体系结构和大量硬件设备,而且其内核可据实际需求裁剪。
[!--empirenews.page--] Linux环境下,应用程序对硬件设备的访问,需依靠运行在内核中的驱动程序作桥梁——软件底层的驱动层提供了系统中所有硬件设备的操作接口,包括RS-232串口驱动、SD方式的SD卡驱动、兼容UDA1341音频芯片的OSS(Open Sound System)音频驱动及LCD驱动等;且几乎所有驱动程序均由Linux直接提供,无需研发者自己编写。
软件的中间层是应用程序层,包括音频解码子程序、串口通信子程序、随机数生成子程序等。在嵌入式Linux环境下,有更丰富的系统函数和开源软件作支持,使应用程序的实现更容易。例如,其中的MP3解码子程序采用音频解码库libmad提供的高级API编写。libmad是一个开源的高精度MPEG音频解码库,它支持MPEG-1标准中Layer I、Layer II和LayerIII(即MP3)格式的音频解码,且解码过程使用定点计算,非常适合没有浮点运算支持的平台(如ARM平台)。使用libmad提供的高级API,很容易实现MP3数据的解码,其过程只需打开对应的音频设备文件,并将SD卡上待解码的音频文件映射到内存中,然后调用libmad的解码函数即可。在方案1的实现上,研发者需自己编程实现的FAT文件格式处理、音频参数提取和设置、解码数据读写控制等功能,在本方案中均是由操作系统驱动程序以及libmad解码库中的库函数自动完成的。另外,在OSS音频驱动和SD卡驱动的支持下,可方便地实现对WAV音频文件播放子程序的编制。WAV音频文件由于直接存储了PCM编码的音频数据,虽文件较大,但没有压缩失真,其音质也优于MP3。
软件的上层是流程控制层。由于方案2与方案1所实现的功能基本相同,故其软件的流程并无本质差异,具体功能仍可参见图3。嵌入式Linux具备多任务管理功能,即能以分时复用方式“同时”处理多个进程,并提供有多种进程间的通信协调机制,例如信号机制等。信号机制用于多任务间的通信,其实质是在软件层次上对中断机制的一种模拟。与方案1不同的是,在嵌入式Linux环境中,使用信号机制能方便地实现中断控制。在程序中设置为当串口收到数据时,向系统进程发出信号,系统进程收到信号后转向执行事先指定的处理程序,从而实现中断控制。
4 两种实现方案的实验测试和对比
按上述两方案构建了实现农作物有害动物智能化声防系统用的音频控制子系统。实验测试结果表明,以两种方案研发的音频控制子系统均达到了预期目标,能准确、可靠地与无线通信模块通信,在总控制器控制下实时调整各种工作参数。音频控制子系统在触发、随机2种工作模式下,均能准确、清晰地播放当前声防目标对应的音频文件。采用可热插拔的SD卡确保了声防音频文件更新方便。而且基于所采用的FAT16文件格式,该子系统能支持最高容量为2 GB的SD卡,实现了大容量音频文件的可靠存储。
由于采用不同的硬件平台而构建,2种音频控制子系统实现方案在功能、开发难度以及构建成本等方面有所不同。
在功能方面,方案1能对比特率在192 kb/s及以下的MP3文件做流畅的解码播放,但播放更高比特率的文件时,受AT89C51SND1处理速度以及现有程序的数据读写效率限制,不能保证写入解码缓冲区数据的连续性,从而导致输出声音有间断。而且由于硬件解码的限制,不能对其他格式的音频文件进行解码播放。方案2由于采用软件解码,且所选用微处理器S3C2440的主频达400 MHz,理论上只要移植对应的解码子程序,便可对任何格式的音频文件进行解码播放。对方案2的测试发现,其确实能对任意比特率的MP3、WAV格式的音频文件进行解码播放。而且方案2中,系统完全有能力在完成音频解码任务之同时,还处理更多复杂的任务(MP3解码程序只占用了S3C2440处理能力的7%左右),具有很强的扩展性。例如,音频控制子系统可在探测器节点发现有害动物后进行声音采集或视频采集,并运行语音识别子程序或经视觉检测对探测到的有害动物种类进行判断,从而使整个声防系统的声防目标更准确,达到更好的声防效果。另外,由于嵌入式操作系统对硬件的屏蔽性,实现方案2的软件很容易在其他硬件平台上移植。
在软件开发过程中,方案1需要关注每个硬件设备的操作细节,其软件的编程量较大。而方案2由于所选用的Linux操作系统直接提供硬件驱动程序,且也有大量开源软件资源可供应用程序编程所利用,故其软件的开发相对容易。但方案2需移植嵌入式操作系统作为软件开发平台,包括建立BootLoader引导程序,配置、编译并移植操作系统内核和文件系统等,这与采用向单片机直接烧写程序的方案1相比,开发难度稍大。在软件调试方面,方案1中单片机程序的每次变更都需重新写入ROM。而方案2可利用Linux的网络功能,将微机上的编程目录以NFS方式挂载在嵌入式Linux文件系统中,从而实现在微机端编写、修改程序,在嵌入式Linux系统上直接“远程”运行修改后的程序,调试较为方便。
从构建成本上比较,方案1的硬件成本更低一些。但随着制造工艺的不断进步,32 bit微处理器的成本会进一步降低,再考虑外围器件的成本,以方案2构建音频控制子系统的性价比,与基于方案1构建的相比已有优势。
数字化、智能化是农业现代化发展的必然趋势。为确保可靠性和性能最优,本文利用嵌入式技术、采用两种技术方案研发实现了农作物有害动物智能化声防系统中起重要作用的音频控制子系统。实验测试发现,“单片机+硬件解码”构建方案能基本满足功能需求,但其系统性能和升级扩展能力受到硬件限制;而“ARM微处理器+软件解码”构建方案能完全满足功能需求,而且具有很强的扩展性和可移植性。