当前位置:首页 > 智能硬件 > 人工智能AI
[导读]    语音助手能和人类进行深度交谈的背后,离不开自然语言处理(NLP)和自然语言生成(NLG)这两种基础技术。机器学习的这两个分支使得语音助手能够将人类语言转换为计算机命令,反之亦然。

   语音助手能和人类进行深度交谈的背后,离不开自然语言处理(NLP)和自然语言生成(NLG)这两种基础技术。机器学习的这两个分支使得语音助手能够将人类语言转换为计算机命令,反之亦然。

  什么是NLP?

  NLP指在计算机读取语言时将文本转换为结构化数据的过程。简而言之,NLP是计算机的阅读语言。可以粗略地说,在NLP中,系统摄取人语,将其分解,分析,确定适当的操作,并以人类理解的语言进行响应。NLP结合了计算机科学、人工智能和计算语言学,涵盖了以人类理解的方式解释和生成人类语言的所有机制:语言过滤、情感分析、主题分类、位置检测等。

  

  什么是NLG?

  自然语言处理由自然语言理解(NLU)和自然语言生成(NLG)构成。NLG是计算机的“编写语言”,它将结构化数据转换为文本,以人类语言表达。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。

 

  对于“AI语音识别”,每一个“语音识别”都是APP,这个APP里面内置着我们常用字的“标准发音字库“,同时,为了让软件能否识别我们“不标准的发音”,软件还需要AI编程语言对我们不标准的发音做评分,然后做比对,最后选择评分最高的那一个“标准发音”作为我们“不标准发音”的字库!

  1.语音识别的基本原理

  语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示:

  

  语音识别系统构建过程整体上包括两大部分:训练和识别。训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”;而识别过程通常是在线完成的,对用户实时的语音进行自动识别。自动语音识别技术有三个基本原理:首先语音信号中的语言信息是按照短时幅度谱的时间变化模式来编码;其次语音是可以阅读的,即它的声学信号可以在不考虑说话人试图传达的信息内容的情况下用数十个具有区别性的、离散的符号来表示;第三语音交互是一个认知过程,因而不能与语言的语法、语义和语用结构割裂开来。

  2.工作原理

  第一步,把帧识别成状态(难点)。

  第二步,把状态组合成音素。

  第三步,把音素组合成单词。

  

  3.工作流程

  一般来说,一套完整的语音识别系统其工作过程分为7步:

  ①对语音信号进行分析和处理,除去冗余信息。

  ②提取影响语音识别的关键信息和表达语言含义的特征信息。

  ③紧扣特征信息,用最小单元识别字词。

  ④按照不同语言的各自语法,依照先后次序识别字词。

  ⑤把前后意思当作辅助识别条件,有利于分析和识别。

  ⑥按照语义分析,给关键信息划分段落,取出所识别出的字词并连接起来,同时根据语句意思调整句子构成。

  ⑦结合语义,仔细分析上下文的相互联系,对当前正在处理的语句进行适当修正。

  预测智能语音助手的未来

  1.语境理解提供个性化回应:目前而言,市场上的智能助理大多缺乏语境理解。

  2.语音区分:语音助理或将通过区分语音,提供更多个性化体验。

  3.不仅是手机:Amazon Alexa副总裁Steve Rabuchin表示:“我们希望客户可以随时随地访问Alexa,这意味着客户可以通过语音遥控他们的汽车、冰箱、恒温器、灯具以及家中内外的各种设备。“

  4.搜索行为的变化:语音搜索一直是热门话题。但语音的可见性将是巨大的挑战。

  5.语音通知:在移动应用营销方面,语音智能也提出了新的挑战-用户参与度和维护度。

  6.信息安全问题:随着语音支付越来越方便,更多用户选择语音支付。支持智能语音的智能家居设备等也涉及大量用户隐私和用户习惯,其安全性也成为用户关注的焦点。

  语音助手

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭