语音识别研究的根本目的是研究出一种具有听觉功能的机器,能直接接受人的口呼命令,理解人的意图并做出相应的反映。语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域。近年来,高性能数字信号处理芯片DSP(Digital Signal Process)技术的迅速发展,为语音识别的实时实现提供了可能,其中,AD公司的数字信号处理芯片以其良好的性价比和代码的可移植性被广泛地应用于各个领域。因此,我们采用AD公司的定点DSP处理芯片ADSP
“未来人工智能的研究领域会体现在两个方向,这两个方向与人类大脑相吻合。”在2018世界人工智能大会“AI前沿与行业赋能主题论坛”上,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋表示,其中一个是探索人脑机制对AI技术的改善,另一个则是AI应用于人脑研究中,“在这些方向背后,需要进行大量的基础研究。”
戈麦斯说:“语音识别和对语言的理解是未来搜索和信息的核心。但是有很多难题,比如理解引用语是如何起作用的,理解‘他’、‘她’或‘它’在句子中指的是什么。在语音服务角度,这只是其面临的数以百万计的问题之一。
9月25日消息,谷歌搜索业务负责人本·戈麦斯(Ben Gomes)在接受记者采访时做出了一次惊人的预言,他表示科技的下一个转折点将是语音识别技术。戈麦斯认为如何让机器更好的对普通语言进行认知将决定着互联网时代未来的发展。
近年来机器翻译发展越来越成熟,机器翻译和语音助手结合是不是能成为超级令人敬佩的同传了呢,显然没有那么简单。科大讯飞为了凸显自家的AI同传多厉害,竟然把人类翻译的内容当作AI的劳动成果。
随着DSP技术的进步,计算能力更强、功耗更低和体积更小的DSP已经出现,使3G手机上植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前,基本ASR应用可以分成三大类:1. 语音-文本转换(语音输入);2. 讲者识别;3. 语音命令控制(语音控制)。
罗文指出,要从四个方面推动深圳市人工智能芯片产业加快发展,一是对接国家战略。国家已经在人工智能领域发布了系列规划,企业应按照国家的规划部署要求,积极将产品规划和国家战略相结合。
本文介绍了一种采用ARM处理器作为控制核心的非特定人语音识别系统的设计方案。方案中的系统利用IC Route公司的非特定语音识别芯片LD3320与ARM Cortex M3内核ST公司的32位高性能单片机STM32F103C8T6组成功能主体,在系统中实现SD卡文件系统。
一种基于DSP芯片的语音识别和数字录音系统。在该系统中,DSP(单片ADSP2185)完成语音识别和数字录音功能,MCU完成用户界面处理。该系统可以实现语音名片(电路号码、工作单位、地址等)存储及声控查询、记事录音及声控回放、日历、简单计算器等功能。
自从IBM的Shoebox和Worlds of Wonder的玩具娃娃Julie doll发布以来,语音识别技术一直在不断地发展。到2018年底,Google Assistant支持超过30种不同的语言。
服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模
尽管困难重重,但这并不会阻止技术的发展,时代巨轮的前进。比如在语音识别率方面,目前一些主流平台的识别率可以达到95%以上,这无疑为语音技术落地提供了大大的技术支持。
文中阐述的是家庭监护机器人项目中语音识别系统设计的部分,通过DSP、DMA和ARM Cortex-A8的并行处理,利用双缓冲的方法,在嵌入式Linux上实现了基于ATK的实时语音识别系统。文中对该系统的软硬件进行了设计。在硬件方面,给出语音识别系统的硬件组成原理,并提供了关键部分原理图;在软件方面,提出实时语音识别的方法,给出应用程序实现
摘要:采用VC++和Matlab混合编程搭建了一个高效的基于HMM的语音识别实验验证平台。结合FPGA的特点,直接使用加法器、乘法器、比较器等建立一个Viterbi算法结构,采用改进方法计算Viterbi得分,实现一种简单的基于HMM的语
物联网 (IoT) 改变生活的每一个角落,特别是在家庭中——家电物联网装置让我们更智能地控制门锁、灯光和电器,串连个人生活与外在系统和环境。而当进一步加入目前最热门的语音助理功能后,智能家居在 2018 年的发展可望更上一层楼。
法国国家科学研究院/泰雷兹集团联合物理研究组及纳米科学与纳米技术中心(法国国家科学研究院/巴黎第十一大学)的研究人员与美日研究人员合作,开发出世界上第一个能够识别出不同人说出的数字的人造纳米神经元。这与《自然》杂志中的一篇文章描述的电子突触的最新发展一样,该电子纳米神经元是人工智能及其潜在应用的一个突破。
该设计运用三星公司的S3C2440,结合ICRoute公司的高性能语音识别芯片LD3320,进行了语音识别系统的硬件和软件设计。在嵌入式Linux操作系统下,运用多进程机制完成了对语音识
Bixby 2.0 将支持智能手机、电视、冰箱、家庭扬声器已经其他互联网设备。Bixby 2.0 将采用开放设计,开发者可以选择如何与用户在服务中互动。同时,Bixby 2.0 还支持自然语言处理功能,支持更多的自然语言命令和复杂语音处理,可以真正的了解用户和家庭成员。
如果分数足够高,Siri 就被激活,并开始处理用户的命令或查询。如果分数超过了最低阀值,但没有达到激活的阀值。设备会在几秒钟进入“敏感模式”,这样当用户再次重复“嘿 Siri”时,可以更好的激活。敏感模式的加入大大改善了系统的可用性,同时还能避免陌生人误开“嘿 Siri”。
Google 工程师 Pete Warden 在英国 ARM 研究高峰论坛表示,他希望打造超便宜的语音识别产品,搭载只要 50 美分的超低价芯片,一个硬币大小的电池,足以维持一年的电力,再搭配简单的人工智能算法, 就可以让语音识别产品快速普及。