智能语音产业需要什么技术的推动
扫描二维码
随时随地手机看文章
AIoT是指人工智能技术(AI)与物联网(IoT)在实际应用中的落地融合,AIoT 既是技术应用,又是产业布局,AIoT是必然的发展趋势。AIoT技术建构一种更高级形式的智能化生态体系,即通过人工智能的方式实现万物互融。
目前中国AIoT行业研究与运用正处于高速进步期,国务院印发的《新一代人工智能发展规划》提出,到2020年人工智能总体技术和应用与世界先进水平同步,核心产业规模超过1500亿元,到2025年人工智能核心产业规模超过4000亿元,到2030年人工智能核心产业规模超过1万亿元。随着科技、制造等业界巨头公司布局深入,以及众多垂直领域的创业公司不断诞生和成长,人工智能产业级和消费级应用精品将相继诞生,满足市场的需求。百度、腾讯、亚马逊、阿里、喜马拉雅、小米、美的、海尔等众多行业巨头都开始布局相关应用。
在AIoT领域,一项重要的核心技术就是智能语音,对IoT设备影响最大的产品是智能语音,智能语音助手将对IoT设备带来巨大的技术革命。实际上,智能语音,早已不是什么新鲜的事情,国外有如:苹果Siri,微软小娜,Google Assistant,亚马逊的Alexa这样的智能语音大咖。国内有灵犀助手(科大讯飞),小度(百度),小爱同学(小米)这样的后来跟进者。智能语音的一项关键就是语音交互,而要做到语音交互,声音的前后端处理缺一不可。
说到声音处理技术,首先就会想到珠海炬芯科技,炬芯科技深耕声音领域二十余年,被称为国内声音前处理专家,在声音前处理技术方面有着非常独家的优势,在低功耗和声音前处理技术上深有造诣。在拾音技术上已经采用双麦克风整列,在离线和在线语音的处理方面也非常领先,同时也依赖于炬芯科技在行业二十余年的经验和技术的积累。
炬芯科技在过去三十多年,一直在进行声音的处理工作,例如 MP3 (声音的后处理技术)、录音笔等声音的保留、存储(声音的前处理),声音的麦克风识别,声音的回声消除及降噪(声音的前处理)、后期的音效增强(声音的后处理技术)等等。
根据炬芯技术市场专家陶永耀先生的解释,声音的前处理技术,是声音没有进入传输、没有存储之前的处理。声音前处理目的,就是让声音的存储、传输效率更高,识别率更好。(例如回声消除、降噪、声音活动检测等等。)声音前处理技术其实是解决机器“听到”和“听清”两件事,从而达到“听懂”的目的。声音的“听到”主要依托的是麦克风。主要形式为单个麦克风或麦克风阵列(多个麦克风按照一定规则排列,在特定空间对声音进行获取和处理)。而基于麦克风的语音信号处理算法则是让声音“听懂”的关键。麦克风+算法,在不同的环境下排列组合,最终达到“听到”和“听懂”。
声音的后处理技术,是声音经过存储之后进行播放的同时处理。是对音源例如 MP3 等媒体解码播放的声音进音效增强处理(例如虚拟重低音、环绕立体声、高音增强、EQ 等等)。声音的前处理技术,是声音没有进入传输、没有存储之前的处理。声音前处理目的,就是让声音的存储、传输效率更高,识别率更好(例如回声消除、降噪、声音活动检测等等)。
在智能语音领域,炬芯已经掌握了声音前处理、声音后处理的关键技术,这些技术对于智能语音的发展无疑是非常重大的,而智能语音又是AIoT产业最关键的技术应用。炬芯的这些语音交互技术,可以推动智能语音的市场发展,从而让更多的AIoT设备落地。