声纹识别将成为生物识别技术的新风口
扫描二维码
随时随地手机看文章
当小编问起,生物识别最广泛的两大技术是什么?相信很多人的回答都是指纹识别和人脸识别技术。相比于指纹识别和人脸识别技术,声纹识别技术的关注度就没那么高了。
但是事实上,声纹识别技术早已有之,而近几年随着深度学习推动语音AI技术的爆发,语音识别技术在智能手机和智能音箱市场被广泛应用,也开始推动了声纹识别技术的应用。
在声扬科技首席科学家张伟彬博士看来,声纹识别技术的发展可以分为三个阶段:
第一阶段,基于模板匹配的方法,像人脸一样要先做注册,再做验证,注册时您说的内容要和验证时是一样的。注册时要说“中华人民共和国,验证时也要说中华人民共和国”。这就相当于验证时被限制了,只是比较这两个声音像不像。
第二阶段,开始于2000年基于概率模型的研究,我们知道声音有时间的长度,长度是可长可短,有的人说话快,有的人说话慢,首先我要把可变长度的向量变成物理程度,这是基于高斯模型概率统计的。识别率勉强达到95%的概率,95%在很多应用场景是达不到的,因为需要考虑噪声、干扰的影响。
第三阶段,则是2012年左右深度学习在很多方面带来爆发性的影响,其中在声纹领域,最近比较大的事件是2017年X-Vector系统的提出,对声纹识别带来很大的提升。
“特别是近两年,市场也对于声纹识别有了比较强烈的需求,这一方面得益于声纹识别技术的进一步成熟;另外一方面,在国家政策方面,去年10月左右央行发布了声纹识别技术在移动金融上的应用标准。这是在国家层面、政策层面承认声纹识别技术达到大规模商业应用的门槛,可以满足金融等场景对高安全语音技术需求的应用;第三个方面则是,近几年国内非接触式犯罪比较猖獗,而声纹识别技术可远程通过声音识别身份对此类犯罪案件的帮助极大。所以我们认为声纹识别将是一个新风的口。”张伟彬博士说到。
那么声扬科技的声纹识别技术又有着哪些优势呢?张伟彬博士表示,声纹跟文本内容、语言无关,所以技术上要做到跟语言、文本内容无关是非常大的挑战。就像人脸一样,有了认证就有攻击,声纹识别除了模仿外,还有比较简单的录音播放,如何防止被攻击也是非常大的挑战。另外,早期声纹识别注册时,用户需要说几分钟的语音,用户体验非常差。声纹识别的应用被严重限制了,而声扬科技的技术克服了了这几个技术难题,也在多个场景下实现了大型项目的落地。
“我们的优势在于,我们技术上不是只有声纹识别,我们还做语音信号处理,如语音降噪,使得输入声纹识别系统的声音更加干净。另外我们有自己的语音识别技术,通过多种技术的组合可以打造成完整的符合客户要求的解决方案。这是我们公司的竞争优势之一。”张伟彬博士总结到。