德累斯顿工业大学在人类语音识别领域的创新
扫描二维码
随时随地手机看文章
(文章来源:生物帮)
在许多家庭中,没有语言助理的生活是不可想象的 - 他们可以打开或关闭设备,报道来自世界各地的新闻或知道明天的天气情况。这些系统的语音识别主要基于机器学习,这是人工智能的一个分支。机器从重复的数据模式中生成其知识。近年来,人工神经网络的使用大大改善了基于计算机的语音识别。
然而,来自德累斯顿工业大学的神经科学家Katharina von Kriegstein教授认为,人类大脑仍然是“最令人钦佩的语音处理机器”。von Kriegstein教授说:“它比基于计算机的语音处理效果要好得多,而且可能会在很长一段时间内继续这样做。”因为大脑中语音处理的确切过程仍然很大程度上未知。
在最近的一项研究中,来自德累斯顿的神经科学家和她的团队发现了人类语音处理之谜的另一个组成部分。在该研究中,使用功能磁共振成像(MRI)检查了33名测试人员。测试人员接收来自不同发言者的语音信号。他们被要求以随机顺序执行语音识别的语音任务或控制任务。科学家团队使用MRI记录了实验过程中测试人员的大脑活动。对记录的评估表明,左侧听觉通路中的结构 - 腹侧内侧膝状体(vMGB) - 当测试人员执行语音任务(与控制任务相反)和测试人员时具有特别高的活动性。承认言语特别擅长。
以前,假设所有听觉信息都是通过从耳朵到大脑皮层的听觉通路同等传播的。目前对vMGB活动增加的记录表明,听觉信息的处理在听觉通路到达大脑皮层之前开始。Katharina von Kriegstein解释了结果如下:“一段时间以来,我们首先有迹象表明听觉路径比以前假设的更专注于语音。这项研究表明情况确实如此:vMGB的一部分是当要识别语音时,将信息从耳朵传送到大脑皮层处理听觉信息的方式与识别通信信号的其他组成部分时的信息不同,例如说话者的声音。
听觉言语的识别对于人际交往至关重要。理解潜在的神经元过程不仅对于进一步开发基于计算机的语音识别很重要。
这些新结果也可能与发育性阅读障碍的某些症状有关。众所周知,左侧MGB在诵读困难者中的功能与其他人不同。左侧MGB在语音中的特化可以解释为什么阅读困难的人通常难以在嘈杂的环境(例如餐馆)中理解语音信号。Katharina von Kriegstein和她的团队现在将进行进一步研究,以便科学地证明这些适应症。