智能语音技术可作为“人脸识别”的“好帮手”
扫描二维码
随时随地手机看文章
(文章来源:OFweek)
以人脸识别技术为核心的视频监控时安防行业的主要应用,这种我们无需多谈,但未来我们是否也能脑洞大开,用智能语音技术辅助人脸识别,使得视频监控更为智能化。市场都在谈语音识别技术,但很少有企业注意,声纹识别以及语音情感识别也归属于智能语音技术。
声纹识别也称说话人识别,通过将声信号转换成电信号,再用计算机进行识别。可具体分为说话人辨认和说话人确认。在不同场景,声纹识别技术的选择不同,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
语音情感识别是情感识别的方式之一,是指由计算机自动识别输入语音的情感状态。计算机通过传感器对不同声调表情的语言信号,在时间构造、振幅构造、基频构造和共振峰构造等特征方面的构造特点和分布规律进行测算和分析,从而识别出所有语言声调中所隐含的情感内容。
尽管当前人脸识别技术的识别率高达99%甚至是99.9%,但剩下的1%甚至0.1%却是当前科技无法攻克的难题。想象一下,如果在当前具备人脸识别的视频监控系统中加入声纹识别和语音情感识别技术,形成的声像融合技术(读唇),即使目标受众处于无声状态,也能对其思想及行为进行预测和识别,当前的视频监控系统是否也将提升到一个新的智能化高度,真正做到“防患于未然”。
不可否认,由人脸识别、声纹识别以及语言情感识别形成的多模态交互系统,应该能安防行业打开不少新应用大门,例如场景分析和事件检测。而在新一轮AI产业变革下,多模态技术也将成为决胜关键。