当前位置:首页 > 物联网 > 智能应用
[导读]本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

一、语音识别技术的发展

(一)国外研究

从开始研究语音识别技术至今,语音识别技术的发展已经有半个多世纪的历史。语音识别技术研究的开端,是Davis等人研究的Audry系统,它是当时第一个可以获取几个英文字母的系统。到了20世纪60年代,伴随计算机技术的发展,语音识别技术也得以进步,动态规划和线性预测分析技术解决了语音识别中最为重要的问题——语音信号产生的模型问题;70年代,语音识别技术有了重大突破,动态时间规整技术(DTW)基本成熟,使语音变得可以等长,另外,矢量量化(VQ)和隐马尔科夫模型理论(HMM)也不断完善,为之后语音识别的发展做了铺垫;80年代对语音识别的研究更为彻底,各种语音识别算法被提出,其中的突出成就包括HMM模型人工神经网络(ANN);进入90年代后,语音识别技术开始应用于全球市场,许多著名科技互联网公司, 如IBM,Apple等,都为语音识别技术的开发和研究投入巨资;到了 21 世纪,语音识别技术研究重点转变为即兴口语和自然对话以及多种语种的同声翻译。

(二)国内研究

国内关于语音识别技术的研究与探索从20 世纪80 年代开始,取得了许多成果并且发展飞速。例如:清华大学研发的语音识别技术以1183 个单音节作为识别基元,并对其音节进行分解,最后进行识别,使三字词和四字词的准确率高达98%;中科院采用连续密度的HMM,整个系统的识别率达到89.5%,声调和词语的识别率分别是 99.5%和95%。目 前,我国的语音识别技术已经和国际上的超级大国实力相当, 其综合错误率可控制在10%以内。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

2018年,科大讯飞提出深度全序列卷积神经网络(DFCNN),使用大量的卷积直接对整句语音信号进行建模。同年,阿里提出LFR-DFSMN模型,将低帧率算法和DFSMN算法进行融合,语音识别错误率相比上一代技术降低20%,解码速度提升3倍。2019年,百度提出了流式多级的截断注意力模型SMLTA,该模型在LSTM和CTC的基础上引入了注意力机制来获取更大范围和更有层次的上下文信息。在线语音识别率上,该模型比百度上一代DeepPeak2模型提升相对15%的性能。 2021年,科大讯飞提出“语音识别方法及系统”专利,通过“静态+动态”网络空间实时融合路径解码寻优算法解决了面向多领域、多用户、多场景下识别效果差、反应速度慢、系统构建时间长等技术问题,显著地提升了语音识别效果。

二、语音识别技术的挑战

1.噪音干扰:现实环境中的噪音是影响语音识别准确性的重要因素。许多语音识别系统在安静的环境下表现良好,但在嘈杂环境中性能下降严重。为解决这个问题,研究人员正尝试开发出更具鲁棒性的语音识别算法,以提高在嘈杂环境中的性能。

2.口音和语速差异:不同地区的人有不同的口音和语速,这增加了语音识别的难度。系统需要对各种口音和语速进行训练,以保证对不同用户的语音都能进行准确识别。此外,一些研究人员正尝试利用无监督学习技术来提高语音识别系统的性能。

3.隐私和安全:随着语音识别技术的广泛应用,隐私保护问题变得越来越重要。用户担心他们的语音数据会被滥用或泄露,因此需要有效的隐私保护策略来消除用户的顾虑。

三、语音识别技术的机遇

1.智能助手:语音识别技术是智能助手的的关键技术之一。智能助手能够理解用户的声音指令,并执行相应的操作,如播放音乐、发送信息、查询天气等。随着人工智能技术的不断发展,智能助手的应用场景也将越来越广泛。

2.智能家居:语音识别技术还可以应用于智能家居领域,例如智能音响、智能电视等。用户可以通过语音指令控制家电的开关、调节音量等。这种技术为用户提供了更加便利的生活方式,同时也为智能家居产业带来了新的发展机遇。

3.医疗领域:在医疗领域,语音识别技术被广泛应用于疾病诊断、药物推荐等。医生可以通过语音输入患者的症状和病史,从而更准确地诊断病情并开具处方。此外,语音识别技术还可以用于远程医疗和健康监测等方面,为医疗行业带来了新的发展机遇。

经由小编的介绍,不知道你对语音识别技术是否充满了兴趣?如果你想对它有更多的了解,不妨尝试度娘更多信息或者在我们的网站里进行搜索哦。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭