谷歌AI还原海底鲸之歌
扫描二维码
随时随地手机看文章
谷歌和一众海洋鲸类专家对多年的海底录音进行了人工智能研究,希望建立一个能够识别座头鲸叫声的机器学习模型。这是该公司新推出的“面向社会公益的人工智能”(AI for social good)计划的一部分,该计划显然旨在反驳人工智能主要用于面部识别和广告定位的说法。
鲸鱼旅行相当多,因为他们寻找更好的觅食场所,温暖的水域和社交聚会。但很自然地,这些运动是很难追踪的。幸运的是,鲸鱼互相呼叫,以各自可识别的方式唱歌,这些歌曲可以在水下长距离传播。
因此,在海底安装了一个全球范围内的监听设备网络,你就可以追踪鲸鱼的活动——如果你想要监听多年的背景噪音,并手动识别这些声音,那就是。这就是我们这么做了很长一段时间,虽然电脑帮助减轻了负担。谷歌的团队与美国国家海洋和大气管理局合作,认为这是一个很好的机器学习系统人才的匹配。
这些人工智能模型非常善于从大量的噪声数据中寻找特定的模式,这就是为什么它们被应用到像射电望远镜和闭路电视摄像机那样的海量数据中。
在这个案例中,数据是来自太平洋各地的十几个水听器多年的记录。这个数据集已经很大程度上被调查,但谷歌研究人员想知道人工智能代理能做的做第一遍的艰苦和耗时的工作,标志着一段有趣的声音与一个物种的名字。
有趣的是,但回顾起来并不奇怪,音频没有这样分析;相反的是,音频被转换成图像,它可以寻找模式。这些声谱图记录了声音在一定频率范围内随时间的强度,可以用于各种有趣的事情。碰巧的是,机器学习和计算机视觉研究人员也对它们进行了很好的研究,他们开发了各种有效分析它们的方法。
机器学习模型提供了座头鲸叫声的例子,并学会了如何在一组样本数据中合理准确地识别它们。进行了各种各样的实验,以确定哪些设置是最优的——例如,哪些剪辑长度易于处理且不会过长,或者哪些频率可以安全地忽略。最后的研究将多年的数据分为75秒的片段,模型能够以90%的准确率确定一个片段是否包含“座头鲸单元”,或者相关的鲸鱼声音。
第二项研究依赖于所谓的“无监督学习”(unsupervised learning),该系统在某种程度上对鲸的声音和非鲸的声音之间的相似性建立自己的规则,从而形成一个研究人员可以梳理和找到相关群体的情节。
它使可视化变得更加有趣,但却更难解释,而且无论如何,它似乎并没有带来一套更传统的分类方法那么有用。
就像机器学习在各种学术领域的类似应用一样,这不会取代仔细观察和文档,而会增加它们。把一些繁重的科学工作从科学中剥离出来,让研究人员专注于他们的专业,而不是陷入重复的统计数据和长达数小时的数据分析会议中。