音视频新技术可以让声音返老还童
扫描二维码
随时随地手机看文章
声音也能返老还童?当垂垂老矣语音混沌时,借助受损语音修复技术就能让声音完美再现,重返青春。记者近日从天津大学获悉,该校自动化与信息工程学院张涛副教授带领团队,在音视频智能分析中实现重大突破,借助大数据和神经网络等人工智能技术首次实现了受损声音的修复和再现。
据介绍,老年人的喉粘膜萎缩以及声带老化、声带肌松弛等会导致出现发音无力、音质下降等问题,另外声带出现一些病变如萎缩或肥厚、声带长肉结或息肉等都可能导致声音改变、沙哑。对由于疾病或器官衰老而引起的语音受损研究,目前大多着眼于病理嗓音的检测和识别,对于受损语音带来的交流方面的问题研究则相对较少。
随着音频场景智能分析应用越来越广,科学家开始借助大数据和神经网络等人工智能技术模拟修复受损声音。张涛主持的天津大学-TI DSP联合实验室也主要聚焦于音频场景智能分析和受损语音信号修复两个方面。在对因衰老、病变等因素造成的声带受损语音进行修复过程。
张涛团队独辟蹊径,提出了一种新型截取信号的窗函数,可以对因病变、衰老造成的声带发声受损进行有效修复。这一修复研究主要借助嗓音的声学特征及其动力学非线性特征参数等,通过结合神经网络等技术建立激励和声道模型对修复的嗓音特征重新合成,从而大大提高了受损语音的可懂度。目前,该实验室研究已经申请国家专利并被采纳为国家技术标准。