基于TMS320C6713的语音识别系统设计
扫描二维码
随时随地手机看文章
摘要:通过选用德州仪器公司带浮点功能的TMS320C6713DSP芯片作为系统核心处理器,结合MSP430单片机作为外围控制器,给出了一种实时语音识别系统的设计方法。该系统核心算法采用美尔频率倒谱系数作为特征参数进行特征提取和动态时间规整(DTW)算法进行模式匹配。通过编程调试,该系统具有良好的灵活性和实时性,在抗噪声、鲁棒性和识别率等方面有明显的提高。该系统在许多领域可作为实用化的一种参考。
关键词:语音识别;数字信号处理器;美尔频率倒谱系数;动态时间规整
0 引言
语音识别是一种最为理想的人机通信方式。随着计算机技术的进步,语音识别技术已经逐渐应用于控制、通信、消费等行业。但是,语音识别系统在商品化的进程中还存在着诸如识别速度、系统鲁棒性以及更高的识别率等具体问题。如何提高语音识别系统的这些性能,使系统更快、更稳定地工作是目前研究的重点。本文正是基于这种思想,通过选用德州仪器公司带浮点功能的DSP芯片TMS320C6713(主频为200 MHz)作为语音信号处理的核心处理器,同时结合MSP430单片机作为外围控制器共同构建硬件系统,以美尔频率倒谱系数作为语音信号特征参数,结合动态时间规整孤立词识别算法进行模式匹配,设计了一种具有良好实时性和高识别率及鲁棒性的语音识别系统。
1 系统硬件设计
本设计的整个硬件系统是以DSP为核心电路对语音信号进行采集和处理,再经过A/D转换电路把模拟语音信号转换成数字语音信号,然后送入DSP芯片进行匹配识别,最后将识别后的结果通过单片机控制模块外接的两个红绿颜色的二极管进行处理表示,其中红色表示拒绝命令,绿色表示接受命令。系统的硬件平台主要由DSP系统核心处理模块、语音信号采集模块、单片机控制模块、外扩存储器模块和外围电路等几个模块构成。系统的硬件设计总体方案框图如图1所示。
1.1 DSP系统核心处理模块
作为系统的核心模块DSP芯片采用TMS320C6713,该芯片的主频可达200 MHz。这是TI公司推出的一种新型的浮点DSP芯片,是继定点DSP芯片TMS320C62X系列后开发的。该芯片的内部结构在TMS320C62X的基础上进行了改进,内部同样集成了多个功能单元,可同时执行8条指令,其运算能力可达1G FLOPS。片内具有丰富的外设,如EDMA、EMIF、McBSP、HPI、GPIO等。
TMS320C6713以其出色的运算能力、高效的指令集、智能外设、大容量的片内存储器和大范围的寻址能力,十分适合对运算能力和存储量有高要求的应用场合。
1.2 语音信号采集模块
本设计中,语音的采集处理选用TI公司生产的一种高性能立体声音频编解码器TLV320AIC23。该芯片能够与C6713的MCBSP接口实现无缝连接,接口设计简单而且功耗低,因此可大大简化系统设计。TLV320AIC23芯片与数字系统的接口有右判断模式、左判断模式、I2S模式和DSP模式四种。本系统中采用DSP模式,与C6713的McBSP0、McBSP1连接,其中McBSP0负责收发数据,MCBSP1负责对AIC23芯片进行控制。
1.3 外扩存储器模块
一般的DSP芯片内部都有内置的存储器RAM和ROM,但对许多DSP应用来说,这些存储空间是远远不够的。掉电后程序和数据无法保存,而需要从外部加载程序。所以,一般都要在片外进行存储器扩展。TMS320C6713的EMIF具有很强的接口能力,几乎对所有的存储器都能够实现无缝连接。EMIF的外部空间容量为64 MB,分为4个空间CE0~CE3,每个CE空间彼此独立,可以进行不同的访问控制。本系统通过EMIF扩展了两个存储空间:其中数据存储空间(SDRAM)分配在CE0;程序存储空间(FLASHROM)分配在CE1。而语库存储空间SD卡则是通过MCBSPI的SPI总线扩展的。
1.4 单片机控制模块
系统设计中选用TI的MSP430F149低功耗单片机作为另一个主控处理器,用它来控制LCD显示、键盘(模式控制)和两路LED(显示识别结果)。由于像液晶和键盘这样的慢速外设很难和高速的DSP协调工作,因而设计中选用单片机来控制它们,这样可以把DSP解放出来去集中完成语音数据处理工作,以节约大量时间,提高系统的实时性。
1.5 外围模块
此外,本系统的外围模块还包括电源供电模块、时钟电路及复位电路等。
2 系统软件设计
本系统的软件开发环境是TI公司提供的集成开发环境CCS3.1(code composer studio)。CCS具有环境配置、源文件编译、程序调试、分析和跟踪等工具。用户可以在一个软件环境下完成编译、连接和调试等工作。图2所示是本系统的软件流程图。
本系统的软件设计过程中,采用的是模块化的程序设计方法,以便于程序的设计和调用。也就是以语音识别的基本过程为依据进行模块划分,每个模块又分为几个子模块,再以模块为单元进行编程和调试。软件设计主要包括的程序有:语音识别预处理子程序、端点检测子程序、参数提取子程序、语音训练(生成参考模块)子程序、判决子程序以及应用于DSP的自举程序。
程序设计以C语言为主体,在进行数据计算时,结合使用汇编语言来实现,这样既能较好地兼顾程序的可读性,又可以提高系统的运算效率。
3 结论
本文选用TI公司的32位浮点信号处理芯片TMS320C6713和TI的低功耗单片机MSP430F149来共同搭建语音识别硬件系统平台,从而设计了一种实时语音信号识别系统。通过软件编程和调试,本系统可实现对非特定人、孤立词的识别,并可以达到预期的效果,而且在实时性、抗噪声、鲁棒性和识别率等方面都具有较明显的提高。
本文的创新点是:采用单片机和DSP处理器协调工作,用单片机去控制键盘、液晶显示这样的慢速外设,从而把高速DSP和慢速外设分开,以大大提高DSP的数据处理效率,进而提高了系统的实时性。