基于TM1300的可视电话终端研究
扫描二维码
随时随地手机看文章
摘要:简要介绍Philips公司的多媒体数字信号处理器TM1300,重点阐述以TM1300为核心实现可视电话终端的一种方案。本方案按照ITU-T制订的H.324系列标准建议,对输入音频和视频信息分别进行了基于G.723.1协议和H.263标准的信源编码,然后,根据信息分组复用H.223标准和通信控制规程H.245标准在PSTN上进行传输。
关键词:TM1300 H.324 G.723.1 H.263
引言
1996年ITU-T制订了在PSTN上传输多媒体信息的H.324系列标准建议,主要包括视频编解码(Video Codec)H.263标准、信息流分组复用(Multiplex)H.223标准、通信控制规程(Control)H.245标准、低码率语音编码(Speech Codec)G.723.1标准以及调制解调器(Modem) V.34bis标准等。其中G.723.1协议可将64Kb/s的PCM语音信号压缩至6.3Kb/s甚至5.3Kb/s,H.263协议可将视频信息压缩到20Kb/s左右;因此,压缩后的语音和图像信号的码速率低于28.8Kb/s,而V34调制解调器已实现了PSTN上的33.6Kb/s码速率的传输。这样,就可以在普通模拟电话网络(PSTN)上利用V.34调制解调器实现实时传输多媒体信息。
H.324终端可以有两种实现形式:基于PC机支持的可视电话终端和无需PC机支持的“独立式”可视电话终端。前者需要PC机、摄像头、视频捕获卡、内置或外置Modem;后者需要将显示器、摄像头、普通电话集成一体,形成一独立的小型可视电话终端。本文介绍的可视电话终端属于后者。它是以Philips公司的TM1300多媒体DSP为核心来实现的,主要包括话音和图像的采集、编解码、显示、回放,码流复用及通信控制等功能模块。
1 TM1300处理器简介
TM1300是Philips公司于1997年以来推出的系列多媒体DSP Trimedia的最新一款性能优良的多媒体处理芯片。它以多媒体处理和通信功能为主,融合了CPU芯片原有的计算功能,已广泛应用于多媒体专用设备、家电及宽带通信设备。TM1300结构框图如图1所示。
TM1300特别针对数字视频和音频应用进行了结构优化,集成视频输入、输出接口,音频输入、输出接口以及通信线路接口等围设备。其核心32位的处理器,能够进行32位的线性寻址,寻址能力可达到4GB;同时,它含有128个通用寄存器,这些寄存器不像其它DSP的寄存器那样分段,所有的操作都可以使用这些寄存器,其核心处理器采用的是VLIW(Very Long Instruction Word)超长指令字结构,可以在每一个时钟周期内同时进行5个操作。VLIW结构还可以减少处理器的工作量,核心CPU的运行由实时操作系统内核进行控制。相互独立的多媒体输入、输出单元可以接收和输出格式化数据。TM1300提供4个通用的定时器,其中三个可被编程用来产生CPU时钟周期、数据/指令断点、Cache跟踪、音频/视频时钟等等。其SPDIF输出单元可输出高速的串行数据流,主要应用于向外部音频设备输出SPDIF格式的数字音频数据。由于数据流内容完全由软件控制,因此,SPDIF输出单元也可用作通用的高速输出设备,如UART。TM1300内部有专用的16KB的数据高速缓存和32KB的指令高速缓存,并且数据高速缓存是双端口的,允许同时进行双向访问。此外,TM1300还带有一些专用的协处理器和专用的多媒体指令,其内部和功能单元之间通过一个高性能的总线和存储系统进行通信,开发者可以充分利用TM1300硬件体系结构的特性,提高视频、音频编解码算法的运算速度。变长解码协处理器(VLD COPROCESSOR)可以完成H.261、H.263、MPEG-1、MPEG-2和MPEG-4码流的哈夫曼解码;图像协处理器ICP(Image Coprocessor)可以在不需CPU参与的情况下对图像进行缩放和滤波处理。
多媒体应用要求系统资源和活动得到高效的管理,TM1300处理器支持pSOC实时多任务操作系统内核,pSOS操作系统由美国ISI(Integrated System Inc)公司开发。它基于开放式操作系统标准,并且针对多媒体应用作了专门的优化。pSOS真正实现了抢先式、基于优先级的任务调度及合理的中断处理。内核保证在任务时刻,正在运行的任务在所有准备好的任务中具有最高的优先级,更高优先级的外部事件可以抢先改变调度的行为,通过改变抢先特性,或调度任务时间片,用户可以改变调度的行为。PSOS还具有以下特点:动态的、基于对象的多任务及动态的存储分析;灵活的计时管理和时钟服务;先进的错误处理和故障恢复等。pSOS操作系统在内核层将与硬件有关的操作放在一个模块中,对系统服务层以上则屏蔽了具体的硬件特性。
2 可视电话终端构成与工作原理
2.1 系统框图和工作原理
图2是基于TM1300的“独立式”可视电话终端的基本框图。图2右边的的EEPROM、Flash存储器和SDRAM可分别看作PC中的BIOS、HARDDISK(硬盘)和RAM(内存),V.34/ISDN为通信端口。在给终端加电后,TM1300首先从EEPROM中读取系统启动的一些重要信息,例如CPU工作的时钟频率,外围SDRAM的大小等信息。然后CPU从EEPROM中把启动程序读入SDRAM,再由启动程序把FLASH MEMORY中的主程序读入SDRAM并开始执行。图2左边的视频输入/输出(VI/VO)单元和音频输入/输出(AI/AO)单元功能描述如下:
(1)视频输入/输出单元(Video in/Video out)
视频输入单元接收符合CCIR601/CCIR656标准的YUV 4:2:2格式的数据。数据在输入后先被拆分成独立的Y、U、V数据,然后送入SDRAM中。另外,可根据需要对输入的视频数据进行水平方向的亚采样。视频输出单元输出符合CCIR601/CCIR656格式的视频数据,它还可对输出的数据进行内插,以使亚采样后的数据恢复为640点/行或720点/行。
(2)音频输入/输出单元(Audio in/Audio out)
音频输入/输出单元分别与串行的ADC(模数转换)、DAC(数模转换)芯片相连,采样时钟受TM1300控制,采样频率可从直流到100kHz。输入输出的数据可是8位或16位的串行单声道立体声数据。
本终端工作过程简述如下:首先,本地A机摄像头输入数据,经视频解码器解码转换为符号CCIR601/CCIR656标准的YUV4:2:2格式的数据,同时麦克风输入的数据经音频编解码器解码完成A/D转换。解码后的音频、视频数据随即传送给TM1300的音频、视频输入端品,TM1300将输入的数据分别按G.723.1和H.263协议编码,然后以H.223标准实现对音频、视频数据流复用,再按H.245规程将复用后的数据流经V.34或ISDN通信端口发送至传输网,传送到远端B机。B机收到A机传送过来的数据后,先以H.223标准对音频、视频数据流解复用,然后分别完成基于G.723.1和H.263协议的音频、视频解码,再由音频、视频输出端口发送给音频、视频编码器,经编码转换后由喇叭、电视机输出。B机传送给A机的数据处理过程如此相同,这样通信的双方就实现了可视电话通信。
2.2 外围芯片的选择
在本终端中,TM1300的主要外围芯片的选取情况如下:
①视频解码器。本方案选用了Philips公司的SAA7113,实现视频A/D变换,反混迭滤波,线性相位锁定,行、场同步信号检测,数字亮度分离等功能;能够将NTSC、PAL或CVBS等模拟视频信号解码为符合CCIR601/CCIR656标准的YUV4:2:2格式的数字视频信号。
②视频编码器。选用Philips公司的SAA7121,将输入的数字YUV视频数据编码为NTSC、PAL或CVBS等模拟视频信号输出。
③音频编解码器。选用Philips公司的UDA1344,该芯片将A/D和D/A转换功能集于一身,可以对麦克风输入的模拟声音信号进行A/D转换成为数字信号,形成串行数字音频流送到TM1300的音频输入口。同时,它也可将从VO输入的数字信号进行D/A转换成模拟立体声信号,然后输出至喇叭;
④SDRAM。选用三星公司的K4S641632E_TI/P75,其存储结构为1M×16Bit×4Banks,工作速度可达到133MHZ,选用高速、大容量的SDRAM可为今后的系统升级提供方便;
⑤Flash。用于存储主程度,它是一种高密度、高稳定性、低成本、可快速擦写的非易失性存储器。它与ROM、EPROM相比,提供了更高的性能,更大的灵活性;与SRAM、EEPROM相比,它有更高的密度和更合理的价格。这里选择是AMD公司的AM29LV400BT芯片,它内部有32个128位可擦除块,存储容量为32M位,数据线可选择为8位或16位。
结语
由于实时多媒体数据处理算法比较复杂,运算量大,因此它对DSP的处理能力有很高的要求。TM1300运算能力可达6.5BOPS(每秒十亿次操作),具有良好的内部接口,灵活的外部接口和强大的多媒体处理能力,因而它完全可以满足多媒体数据处理实时性的要求。在选定了DSP之后,我们选择了它的外围芯片并进行了电路设计。但是由于实时多媒体数据处理算法比较复杂,运算量大,因此为获得更好的图像和语音质量,仅仅依赖硬件的高效是不够的,还需不断改进视频、音频数据处理的算法,同时对TM1300的程序代码进行优化。