当前位置:首页 > 消费电子 > 音频技术
[导读]   或者我们可以把第一次工业革命看作是人类开始系统的思考人类与机器的交互,那或是人机交互的开端,这也许是从人类不自觉情况下开始的,但是从此之后人机交互的进展就再也没有停止过。   我们发

  或者我们可以把第一次工业革命看作是人类开始系统的思考人类与机器的交互,那或是人机交互的开端,这也许是从人类不自觉情况下开始的,但是从此之后人机交互的进展就再也没有停止过。

  我们发现,人类和机器的交流,最开始发生在工厂内。改善人机交互体验的动机是提升工作效率。发展到如今,人机交互的研究已经不单单是为了提升工作效率那么简单。进入21世纪之后,人机交互的思路发生了新的改变。随着技术的进步,各种感应器的出现,开始让让人机交互进入新的阶段。那就是机器可以主动“体会”用户的意图了。虽然目前这种体会还非常的简单,可能只是自动选择屏幕,或者自动调节亮度这样简单。但是这是人机交互的一个本质性的变化。人和机器的交互,不再是简单的“你说我听”。

  此外交互方式的变革也是值得我们注意的,当用户向手机或者计算机发问的时候,输入的方式也改变了。鼠标比键盘方便,触控比鼠标方便,语音输入可以说更加的省时省力。在这一背景下,2015年7月29日,国内顶尖智能语音技术公司——思必驰,在深圳举办【语声纪元】新技术发布会,各路智能硬件大咖齐聚深圳,共迎智能语音交互技术领域的革新一刻,从智能语音技术的角度共同讨论人工智能的发展与未来。

 

  据思必驰CEO高始兴透露,思必驰作为一家领先业界的智能语音技术公司,是国际上最早提出”交互人工智能“并开始研发的技术公司。 现在,随着智能硬件时代的全面到来, “人机交互”的概念也被炒得火热。在移动互联时代,由于交互模态和交互目标的丰富,用户对人机交互的自由度和丰富性的需求日益提升,已经不满足于简单的搜索功能,而是正在逐渐向“任务处理”变迁,思必驰顺应趋势积极开发优势技术。

  现在,移动互联网大潮来了,思必驰觉得是个机会,把思必驰几乎所有的人力、精力和财力向移动互联、智能硬件去专注,去投,专注在扎实的语音技术上,希望服务于广大的移动互联和智能硬件的开发者,做最极致的体验。而智能家居、可穿戴、车载则是目前思必驰最为关注的三大领域。

  

  思必驰CEO高始兴

  2015年,物联网和智能硬件的大风来了,但是思必驰看到市面上诸多的智能硬件在人机交互方面做得还不够好,没达到完美,甚至可以说距离良好的用户体验差距还非常大,甚至可以说,我们现在看到市面上的人机语音交互,还非常的基础。

  思必驰联合创始人、首席科学家俞凯教授则认为,在智能硬件整个生态圈里面,交互是重要的一环,而且,我们认为智能硬件需要一颗心,不仅仅是让每款产品有一个耳朵、嘴巴,还要有大脑,会思考。思必驰当初创业的梦想就是让每个设备能有智能语音,自然与人对话起来。让智能设备有嘴巴、有耳朵、有大脑,这是我们一直以来的梦想和使命。

  俞凯教授强调, “所以我希望思必驰能够一直努力,做好我们的技术,做好我们的方案,做好我们的服务,我们自己跟合作伙伴能够紧密联系起来,一起让每个智能硬件有极致的交互体验。”

  但是目前语音技术面临着巨大的挑战。真正的自由和稳定的人机交互系统不仅需要解决语音的“感知/表达”,即传统的语音识别和合成,更需要解决认知理解和抽象思维的智能。这需要经历两个阶段,一个是传统语音技术的优化,使其更加人性化;二是对话技术的使用,采用认知交互智能提升任务完成的水平和用户体验。

  

  思必驰联合创始人、首席科学家俞凯教授

  此次新技术发布俞凯教授分享了思必驰最新技术突破,包括远场及抗噪技术突破、更先进的回声消除和麦克风阵列算法组合、基于统计的参数化语音合成方法、多轮交互和根据上下文的语义解析。并现场演示了“语音输入板”,赢得满堂喝彩。

 

  俞凯教授现场演示“语音输入板”赢得满堂喝彩

  远场及抗噪技术突破:在国际通用的噪声标准测试库上,思必驰的最新结构化抗噪语音识别技术刷新了国际记录,取得目前世界单系统最好成绩。模型算法的优化突破,使得思必驰仅用软件解决方案就可以达到以往采用语音降噪芯片才能达到的效果,大幅提升了识别率,降低了成本。

  更先进的回声消除和麦克风阵列算法组合:先进的回声消除算法和麦克风阵列算法结合,可以有效的跟踪用户位置,增强语音信号质量,实现高性能的通用语音识别。软硬件结合的多种解决方案,更给出了更多的选择和可能性。仅靠软件且单麦克风条件下,通过大数据整合以及智能算法,思必驰仍然可以达到极为优秀的使用体验,识别速度与准确率均处在世界领先水平。

  基于统计的参数化语音合成方法:传统语音合成是采用拼接技术,录制大规模的语音库,切片后在合成的时候把片段拼起来,这就往往需要大量的标准语音。思必驰采用最新的基于统计的参数化语音合成方法,可以实现模型规模的大幅压缩,语音连贯性的大幅提升,能够自由训练个性化的语音。

  多轮交互和根据上下文的语义解析:在真实场景下,传统语音识别加自然语言处理的方案并不能很好地实现自由的“人机交互”。思必驰在领先的传统语音识别合成技术的基础上,引入交互认知智能,通过情境理解和多轮交互,面向最终任务完成度和用户体验进行系统设计和优化。

  

  会场展示的智能产品吸引了众多眼球

  此外,易观智库的高级分析师封莉、欧瑞博CEO王雄辉、映趣科技CEO王小彬、威仕特CEO闻政亲临现场助阵,分享他们的产品经验极对语音技术的看法。如今的智能硬件市场已从最初的产业蓝海逐渐转变为下一个产业风口,产业生态系统尚未完善,需要多方合力,思必驰正积极联合各方合力,力争推动智能硬件的快速发展。思必驰、FACE++、微动、ablecloud、72变、中发时代联合主办即将于8月中下旬正式启动上线的一档大型活动——“创星计划”,旨在培育中小型开发者成长,推促进智能硬件领域蓬勃发展的创业孵化器计划。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭