设计并实现了一种基于定点数字信号处理器(DSP)的语音识别与控制系统。由音频编解码芯片(TLV320AIC23)负责采集语音信号;以定点DSP(TMS320VC5509A)作为运算处理单元;通过定点运算与浮点运算的有机结合,解决了处理速度与处理精度之间的矛盾;在保证处理速度的前提下,提高了运算精度和识别率。
随着DSP技术的进步,计算能力更强、功耗更低和体积更小的DSP已经出现,使3G手机上植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前,基本ASR应用可以分成三大类:1. 语音-文本转换(语音输入);2. 讲者识别;3. 语音命令控制(语音控制)。 这三类功能包含了3G所需的众多ASR性能。语音-文本转换的典型实例是语音拨号和电子邮件听写。讲者识别功能可以通过语音识别安全地读出存储器中的个人数据,从而满足信用卡定购和银行服务等保密性高的应用需要。语音命令控制功能包括连接语音扩展标记语言(VXML)网站内容的语音接口,它支持财经服务与目录助理等业务。目前VXML被用于规范网站内容的语音标签。
随着DSP技术的进步,计算能力更强、功耗更低和体积更小的DSP已经出现,使3G手机上植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前,基本ASR应用可以分成三大类:1. 语音-文本转换(语音输入);2. 讲者识别;3. 语音命令控制(语音控制)。 这三类功能包含了3G所需的众多ASR性能。语音-文本转换的典型实例是语音拨号和电子邮件听写。讲者识别功能可以通过语音识别安全地读出存储器中的个人数据,从而满足信用卡定购和银行服务等保密性高的应用需要。语音命令控制功能包括连接语音扩展标记语言
现在的语音识别处理器集成了更多功能,它们的精确度也更高,并有更好的开发工具支持,这使得在消费电子产品中添加语音I/O变得相对容易。
本文从可复用和优化芯片空间的角度出发介绍语音识别芯片结构设计的种种考虑,其思路有利于开发一系列其它语音识别芯片。
本文从可复用和优化芯片空间的角度出发介绍语音识别芯片结构设计的种种考虑,其思路有利于开发一系列其它语音识别芯片。
本文给出了在运用RSC-3x设计高性能的语音识别产品时应考虑的与硬件有关的若干问题:噪音降除、电路设计、PCB设计、麦克风的选择、麦克风的安放、电源设计。
本方案主要由电话机芯片CD802加语音识别录放模块JT802构成
凌阳科技公司的最新产品SPCE061A.
凌阳科技公司的最新产品SPCE061A.
国际互联网联盟(W3C)日前宣布,两种计算机语音互动规范将被列为国际标准开始实施。一直 以来,W3C都在通过多家技术企业进行评估的基础上制定自己的标准。 VoiceXML 2.0是上述标准之一,目的是要提高网络内容
香港及新加坡,2002年4月24日──在多语种交谈式语音理 解技术领域内首屈一指的言丰科技今日宣布,其核心语音识别引擎——「言丰-语音识别引擎」荣 膺“新加坡全国资讯通信奖之最创新资讯通信产品/服务大奖”。