AI浪潮推动超千亿声纹市场落地:开启商用大潮 !
扫描二维码
随时随地手机看文章
2014年公安部便首次针对声纹识别的应用技术要求和安全等级制定标准,在2019年确定了关于声纹数据库建设、信息采集指引的细化内容。继指纹、面部、虹膜之后,声纹作为象征我们个人ID的一部分,也陆续开启了商用大潮。
声纹识别技术能够在金融场景落地,与行业的积极拥抱并出台相关标准有关——2018年中国人民银行发布声纹识别相关行业标准,2019年声纹识别系统成为唯一一个入选金融科技产品认证目录的生物识别技术。
近日,中国工商银行开始把声纹识别技术应用于信用卡反欺诈场景,在其位于北京、湖北、四川、山西的四家分行正式上线,在同业中率先开启了风险管控的新模式。
声纹识别从单纯技术本身来说,在20世纪便有了相关研究和落地的探索,近年来,部分比较成熟的方案开始被境内外一些银行系统采用,那是声纹识别技术应用落地的初级阶段。
真正走向成熟,核心还是依托于21世纪AI技术取得的突破。尤其是年初数月的疫情背景下,市场对这种非接触且高准确度的技术应用需求突然放大甚至与日俱增。
据前瞻产业研究院分析,当下全球生物识别产业规模庞大,仅语音生物识别(即声纹识别)这一细分方向的市场规模2020年有望超过1400亿元人民币(约200亿美元),占整个生物识别市场的22.4%。
声扬科技CTO陈东鹏向21世纪经济报道记者表示,未来随着5G、大数据、云计算等新技术发展愈发成熟、语音的入口更普及,可利用的语音数据会越来越多。声纹识别技术有望在金融、公安、智能硬件、IoT等领域中发挥越来越重要的作用。
逐层技术演进
提到声纹,很容易被理解为容易被模仿的声线,其实二者不能等同。
有行业人士向记者分析道,声纹很难被伪装,因为其识别的内容主要包括声带振动频率、声道等特征组成的语音模型,能被伪装的只在于口头禅等行为特征。
“每个人说话时的音调、音色等习惯几乎独一无二,这些信息通过电声学仪器测量并分析,就构成了不同的声波频谱,所以用声纹来认证身份具有唯一性和稳定性。”他续称。
清华大学人工智能研究院听觉智能研究中心发布的一份声纹识别技术白皮书显示,目前市场上主流的生物识别方案包括掌纹、虹膜、视网膜、人脸、声纹等。从易仿冒程度来看,虹膜和视网膜是极难的,声纹被评定为难,其余则均为一般。
基于这些背景,关于声纹的研究其实早已有之,只是随着底层技术的迭代,应用过程能够更加无感,同时达到较高准确度。
陈东鹏向21世纪经济报道记者分析道,早期的声纹识别技术,为了节省时间并提升用户体验,会要求用户念一段固定的文本,此后每次验证都是朗读同一段文本。
这被称为固定文本的认证方式。“但会造成两个问题,第一是用户体验不好,每次都被要求生硬地念一段文本,无法做到与用户在自然交流中无感地完成身份认证;第二是容易被录音攻击,因为每次朗读的都是同一段内容,犯罪分子有可能通过提前偷录他人的声音,然后通过录音回放攻击系统。”他进一步表示,这导致初期的技术落地会存在较大风险。
大约在2000年开始,声纹识别技术进入相对成熟期,在此期间诞生了一批老牌语音厂商,科大讯飞就在其中。
前述行业人士向记者指出,这一阶段的声纹识别技术要点在于,将录入的声音压缩成固定的矢量进行匹配,准确率已经能够达到约95%的水平,不足之处在于容易因外部干扰而影响结果,因此还没到适合商用的标准。
从2015年开始,随着AI技术的深化,不少以该项技术为背景的创业公司专门投身声纹识别领域,不仅如此,在这两年来,BAT等巨头也相继在这一领域入局。
“如今声纹识别技术的进步,得益于深度学习技术的成熟,以及传感器、麦克风、通信信道(如5G、4G VoLTE高清通话)等技术的进步。”陈东鹏介绍道,目前声扬科技的声纹识别技术可以保证在高噪声环境下声纹识别的鲁棒性、在很短时间内完成语音认证,也无需设置固定交流内容。
应用场景扩围
虽然当前已经可以在较好体验的情况下落地商用,但声纹识别技术还有更长远的路要走。
业内认为,当前阶段的声纹识别技术已经能够满足部分行业特定场景的应用需求,当然从商用门槛的成熟,到未来体验的成熟,依然有很大提升空间。对诸多生物识别技术来说都是如此。即便是目前已经十分普及到手机端的屏下指纹识别技术,历经多年商用迭代,也依然可以在识别时间、精准度、模组大小等方面继续优化。