r深度学习算法分析数据轻易比较中西古典音乐差别

时间：2020-05-01 18:42:01

关键字： SE AN 向量音频信号

手机看文章

扫描二维码
随时随地手机看文章

[导读] 事实证明，深度学习技术对于分析各种数据（从图像到文本，在线帖子和录音）非常有用。这些技术旨在识别大型数据集中的模式，将不同类别的项目分开，并使预测比人类快得多。在最近的一项研

事实证明，深度学习技术对于分析各种数据（从图像到文本，在线帖子和录音）非常有用。这些技术旨在识别大型数据集中的模式，将不同类别的项目分开，并使预测比人类快得多。

在最近的一项研究中，西蒙弗雷泽大学，中央研究院和达特茅斯学院的研究人员已经应用深度学习技术来识别中西方古典音乐之间的异同。他们的论文预先发表在arXiv上，论文写到，他们使用声音事件检测（SED）和音景情感识别（SER）模型对音乐录音进行了比较分析。

进行这项研究的研究人员之一范建宇告诉记者：“我们听过中西古典音乐。” “我们认为有几个因素使中国音乐不同于西方音乐，包括其潜在的文化，哲学和思维方式。这就是为什么我们对比较中西方音乐的研究非常感兴趣。”

用于分析音乐记录的深度学习模型有时可能会表现不佳，因为它们难以学习高级信息中的模式，例如歌曲的旋律，和声等。为了克服先前研究中遇到的局限性，Fan和他的同事应用了音景模型用于分析中西方古典音乐，以评估它们在识别两个子流派之间的异同方面的有效性。

最初，研究人员编辑了两个带注释的数据集，分别包含WCMED和CCMED，其中包含中西音乐的录音。随后，他们分别在这些数据集上训练了预训练的SED和预训练的SER 模型，并将它们与支持向量回归（SVR）模型结合在一起。SED模型旨在检测音频信号中的声音事件，而SER模型则经过训练以识别声景录音所传达的情感。

范解释说：“虽然以前的音乐研究主要使用基于音乐的模型，但我们很好奇是否可以将经过通用音景训练的模型用于分析音乐，以及它们对于中西方古典音乐有何不同。” “因此，我们尝试使用基于一般声音的两个模型：声音事件检测模型和音景情感识别模型。”

研究人员使用转移学习技术来提取声音的高级表示。然后，他们使用这些表示来训练他们的音乐情感识别模型，以检测音乐录音传达的情感。由于对他们的模型进行了预训练以概括声音的特征，因此他们发现，与简单的模型结合使用时，这些表示效果更好，尤其是对于中国古典音乐的分析。研究人员还在他们创建的数据集上训练了深度学习分类器，并针对中西歌曲的特定特征进行了进一步的分析。

“我们的目标是使用预先训练的音景模型来分析和比较中西方古典音乐，因此我们并不希望该模型能够完美地适用于不同类型的音频和不同类型的任务，”范说。“但是，我们的结果表明，使用音景模型可以有效地预测中西方古典音乐的唤起。”

Fan和他的同事收集的发现表明，SED和SER模型是用于分析音乐录音的有前途的工具。有趣的是，使用这些技术对中西方古典音乐进行的比较分析得出的结果与中国音乐理论家提出的观点一致。

研究人员还观察到，他们的深度学习分类器将音景录音识别为中国古典音乐。这表明，音景录音通常与中国古典音乐比与西方古典音乐有更多相似之处。

范说：“我们的研究表明，中国古典音乐与音景唱片之间存在某些相似之处。” 这些结果与中国音乐学家和中国古典音乐哲学家的报道一致。”

将来，这组研究人员进行的研究可能会启发其他基于音景模型分析比较不同流派音乐的研究。同时，范和他的同事计划继续使用深度学习方法研究中西方音乐之间的异同，同时尝试建立可以自动组成新古典音乐的模型。