当前位置:首页 > 智能硬件 > 人工智能AI
[导读]      自20世纪80年代以来,语音识别技术的研究取得了许多突破性进展,特别是基于隐马尔可夫模型(HMM)的语音识别技术,目前已趋成熟,成为语音识别的主流。然而基本型的HMM模型也存在

  
   自20世纪80年代以来,语音识别技术的研究取得了许多突破性进展,特别是基于隐马尔可夫模型(HMM)的语音识别技术,目前已趋成熟,成为语音识别的主流。然而基本型的HMM模型也存在一些固有缺陷,这些缺陷除体现在状态的持续时间没有直接在模型参数中反映出来外,还表现在:

  (1)采用状态输出独立假设,每个时刻的输出仅与所处的状态有关,而与以前的输出没有关系,然而实际语音信号却有很强的时间相关性,这就影响了HMM模型描述语音信号帧间相关性的能力。

  (2)连续HMM模型假定状态输出概率密度函数为混合高斯分布函数,而实际的语音信号分布是非常复杂的,很难用简单的高斯分布的组合形式来表征。为了弥补这些缺陷,许多改进的方法被提出来。

  语音识别技术是近年来高速发展的一项技术,由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。语音是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性越来越凸显。近年来,随着人工神经网络、模糊逻辑、粒子群优化算法等非线性理论研究和应用的逐渐深入,这些理论已经开始独立或者相互交叉应用到语音识别领域中。

  语言是人类获取信息的主要来源之一,不仅是人类与外界交流信息最方便、最有效、最自然的手段,而且也是人与机器之间进行通信的重要工具。无论是人与人之间还是人与之间的语言通信,语音信号处理,特别是语音信号数字处理,都具有特别重要的作用。

  随着计算机技术的快速发展,用现代手段研究语音信号处理技术,使得人们能更加有效的产生、传输、存储和获得语音信息,这对于促进社会的发展具有十分重要的意义

  数字语音信号处理,包括三方面内容,即语音信号的数字表示法,语音信号数字处理理论的各种方法和技术及数字语音处理理论和技术在各领域中的实际应用。

  模糊神经网络在语音识别中的应用

  神经网络是在现代科学研究成果的基础上提出来模拟人脑结构机制的一门新兴科学,它不是人脑真实的全面描述,而是这类生物神经网络的抽象、模拟和简化,其目的在于探索人脑的信息加工、存储和搜索机制,从而为人工智能和信息处理等学科的研究开辟新途径。人工神经网络就是采用物理可实现的系统来模拟人脑神经细胞的结构和功能的系统。它是由很多处理单元有机地连接起来进行并行的工作,它的处理单元虽十分简单,但其工作却是“集体”进行的,它的信息传播、存储方式与神经网络相似,它没有运算器、存储器、控制器等这些现代计算机的基本单元,而是相同的简单处理器的组合,其信息处理是存储在处理单元的连接上

  模糊逻辑是模仿人脑的不确定性概念判断、推理思维方式,对于模型未知或不能确定的描述系统,以及非线性、大滞后的控制对象,应用模糊集合和模糊规则进行推理,表达过渡性界限或定性知识经验,模拟人脑方式,实行模糊综合判断,推理解决常规方法难于对付的规则型模糊信息问题。模糊逻辑善于表达界限不清晰的定性知识与经验,它借助于隶属度函数概念,区分模糊集合,处理模糊关系,模拟人脑实施规则型推理,解决因“排中律”的逻辑破缺产生的种种不确定问题。

  随着模糊信息处理技术和神经网络技术研究的不断深入,将模糊技术与神经网络技术进行有机结合,从而构造出一种可“自动”处理模糊信息的神经网络或自适应模糊系统,以成为模糊技术与神经网络技术深入研究和发展的一种必然趋势。神经网络技术和模糊技术各自有自己的优点,前者以生物神经网络为模拟基础,试图在模拟推理及自动学习方面向前发展一步,使人工智能更接近人脑的自组织和并行处理功能,它在模式识别、聚类分析和专家等多方面己显示了新的前景和新的思路。后者以模糊逻辑为基础,抓住了人类思维的模糊性特点,以模仿人的模糊综合判断推理来处理常规的方法难以解决的模糊信息处理的难题。而将模糊技术和神经网络技术相结合,可以有效的发挥各自的优势并弥补不足。模糊技术的特长在于拓展神经网络处理信息的范围和能力,使其不仅能处理精确的信息也能处理模糊信息和其他不精确的信息,不仅能够实现精确的联想及映射,还可以实现不精确的联想和映射,特别是模糊联想和模糊映射仁。

  语音识别在实现过程中通常涉及多种因素,需要同时考虑。由于计算量很大,再加上语音信号的随机性,以及我们对人类听觉机理了解甚浅,因此,目前机器自动识别语音的能力要比人类差得多,尤其是对非特定人的连续语音识别更是如此。用模糊神经网络模型作为分类器或聚类器,发展出一些新的语音识别方法。

  由于模糊神经网络不仅具有模糊系统中的知识抽取和表达能力,适合于表达模糊或定性的知识,能够运用类似人的思维模式来进行推理,也拥有神经网络有并行计算、分布式信息存储、容错能力强以及具备自适应学习功能的一系列能力。将模糊神经网络模型用于语音识别系统,该系统具有以下特点:。

  1、能够尽量多的利用了样本集中的有用信息以实现多因素综合评定,发挥神经网络的优势。

  2、能够很好的引入领域专家的经验知识,利用模糊规则来指导网络的训练,使网络的训练能够更符合人的推理习惯。

  3、对输入、输出形式进行特殊的模糊化处理后,可以用有限样本集含有的信息比较好的、近似真实分布的反映原有知识

  传统的语音识别和采用模糊神经网络的语音识别是有区别的。在传统的语音识别方法中,模式匹配法是在对语音做过预处理之后,通过特征参数的提取及模式匹配完成识别。由于语音信号的高度多变性,输入模式要与标准模式完全匹配是几乎不可能的。因此,识别时要预先制定好计算输入的语音特征模式与各特征模式的类似或距离的规则,距离最小者就是最类似的模式。而句法模式识别法当认为输入的位置模式属于某个对象时,就要检查一下输入模式与识别对象的结构,当与对象模式结构相同或在某范围内结构一致时,则判定该未知模式就是识别对象的语音。模糊神经网络的语音识别方法与传统方法的差异在于提取了语音的特征参数后,不像传统方法那样有输入模式与标准模式的比较匹配,而是靠模糊神经网络根据专家知识或者先验知识,先对输入特征数据进行模糊化产生对不同规则的隶属度,然后根据标准来调节网络中大量的连接权对输入模式进行非线性运算,产生最大兴奋的输入点就代表了输入模式对应的分类。

  模糊控制于20世纪六十年代萌芽于美国,七十年代诞生于欧洲,八十年代当西方人不太喜欢“模糊理论”时,它却在日本发展并广泛用于家电的自动控制,九十年代与神经网络以来,才得到全球的广泛认可并成为智能系统的一个重要分支。虽然模糊神经网络的研究没有神经网络长,但由于它结合了模糊控制和神经网络的优点,现在以广泛的用于各个领域。目前模糊神经网络在语音信号处理中的应用研究十分活跃,其中以在语音识别方面的应用已经取得较大的进步。同神经网络相似,模糊神经也主要是从听觉神经模型中得到启发,以便构成一些具有类似能力的人工系统,使它们在解决语音信号处理(特别是识别)问题时能得到较好的性能。研究模糊神经网络以探索人的听觉神经机理,改进现有语音语音识别系统的性能,是当前语音识别研究的一个重要方向。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭