全球科技巨头AI音乐大战一触即发,平安重拳出击填补AI变奏交响曲行业空白
扫描二维码
随时随地手机看文章
音乐这门生意越来越引起巨头的关注。以往,比较音乐平台靠的是曲目数量、艺人进驻数量,后来更看重版权的独家。现在,以深度神经网络为代表的AI技术逐渐逼近落地,放眼全球,音乐平台的AI大战一触即发。
2016年,谷歌大脑推出Magenta项目,从早期的NSynth神经网络音频合成算法到如今从残缺片段中恢复巴赫音乐的Coconet机器学习模型,更多以学术研究为导向。
世界三大音乐版权商之一的索尼,在音乐内容本身上占据了极大的优势局面。2016年,索尼计算机科学实验推出的大型歌曲和风格数据库Flow Machines,创作出了“披头士”风格的旋律。
谷歌与索尼旗下都拥有相应的流媒体产品,如YouTube音乐服务和索尼精选Hi-Res。二者相似的是,流媒体或将颠覆传统唱片公司和词曲版权代理的地位,它们势必要抢占一个新的产业协作模式“领头羊”。不同之处在于,索尼更需要寻找音乐版权业务收入放缓后的下一个增长点。
智能音箱的普及下,谷歌还能以自家的智能音箱Home为核心,借此拉动智能家居生态,但依靠低价补贴以吸引消费者的智能音箱走势如今并不理想,未来终究依赖智能交互和整个场景的覆盖。
面向中国市场的微软“小冰”,如今已成长到第七代,基于Avatar Framework人工智能框架,除了智能对话、语音交互外,还主打模拟人类真声、写词作曲。2018年,微软小冰也提出了Dual AI半开放生态的战略,并与多家国内公司达成平台化战略,但仍未勾勒出清晰的商业逻辑。
一心野望海外市场的字节跳动,在完成对初创公司Jukedeck的收购后,又拿到了印度两大唱片公司T-Series和Times Music的音乐版权,试图在旗下TikTok短视频产品中利用神经网络合成音乐。短视频承载了AI作曲实现大规模音乐的有效途径,或许能缓解其在音乐版权上的压力。
目前来看,谷歌、索尼、微软小冰、字节跳动正全面发力AI,但落到AI音乐这个层次上,却是参差不齐的。早期研究人员更多是让计算机模仿现有的音乐片段,通过分析其中的规律来制作音乐旋律;AI创作音乐的不同之处在于,能让计算机真正通过学习大量音乐片段,“自动”创作出相对复杂且富有故事性的乐曲。这个方向上,谷歌、索尼早早开始AI音乐创作性的探索;相比之下,被字节跳动收购的Jukedeck则更多停留在模仿阶段,只能作为音乐流水线上的批量生产工具。
一定意义上,技术的进步推动着音乐产业的每一次进步,从最早的CD唱片到如今的AI音乐,音乐的生产、分发和消费形式呈现明显的迭代升级。据国际唱片业协会(IFPI)报告数据,2018年全球音乐市场收入同比增长9.7%,达到191亿美元。这对于谋求业务深层次进化的科技巨头来讲,最终能否取胜将取决于对先机的把握。更重要的是,以AI驱动的音乐市场变革将会随着巨头们的频繁动作而掀起新一轮的竞争。
AI正影响全球企业的竞争格局,音乐产业也进入由AI激活多元化价值的关键时期。
如今,中国平安在AI音乐展现出的实力,已远超人们的想象。
10月11日,为新中国成立七十周年献礼,平安人工智能研究院打造的全球首部AI交响变奏曲《我和我的祖国》由深圳交响乐团进行全球首次公演。
AI交响变奏曲《我和我的祖国》以中国近现代史为创作蓝本,包含鸦片战争、新中国成立、共和国曲折发展、改革开放、民族复兴等五大乐章,表现一序列历史变迁。伴随音频演奏一段段历史故事呈现其中,以表达对祖国深厚的感情。
可以说,这在交响变奏曲的音乐史上尚属首例。音乐层面,它超越了此前的单维度、短篇幅、娱乐性的范围,突围多维度、长篇幅、经典式交响乐曲;更重要的是,在AI技术的融入上,平安科技自研AVM自动变奏模型训练系统,再利用深度学习对音乐实现特征学习与提取,并结合强化学习技术让机器学会变奏手法。
广义上讲,AI作曲并不是一个新名词。从最早使用随机统计模型,到如今深度神经网络的应用,利用AI实现智能创作已成为世界范围内科学家广泛探索的事情。尽管如此,在研究方法层面,我们仍看到许多反复出现的问题:以数据驱动的算法,如何避免同质化的音乐风格?如何让AI更好地“理解”音乐?
带着这个问题,记者(公众号:记者)对AI交响变奏曲《我和我的祖国》曲目团队技术负责人进行了专访。
“除了算法和数据标注上的一些技术手段,我们也在考虑直接对音乐的音频做相应的分析,目的也是能够让AI能对音乐本身的理解和认知变得越来越深刻。”该技术负责人表示。
雄厚技术铺垫助力,勇攀AI音乐无人区
其实早在一年前,平安AI作曲就在由瑞士联邦理工学院(EPFL)举办的世界AI作曲国际大赛中获得第一名。今年2月,平安科技再次凭借AI创作的流行乐曲《青春记忆》拿下由清华大学艺术与科学研究中心等联合举办的全球AI艺术大赛(GAAC)的第一名。
频率颇高的成果突破背后,离不开平安AI团队过去两年多在智能创作领域的探索积淀。早在2017年,平安科技就启动了音乐画像脸谱、音乐流行预测以及人工智能作曲三大音乐发展方向,尝试用AI融入音乐领域。目前团队已积累了大量标注分析数据、自主研发可完成特定任务的生成模型,并构建了符合音乐理论的评价体系。
此次创作筹备近两个月,其中最核心的部分模型训练则用了近一个半月时间。
AI交响变奏曲《我和我的祖国》曲目团队技术负责人解释道,“通常来讲,一首交响曲的整个创作周期长达一年,这次创作实际上仅用一个半月,但其背后是长达两年的技术储备、模型学习和数据积淀。从交响变奏曲创作的技术角度来讲,AI作曲仍存在很大的挑战,尤其是创作出一个满意的作品交由人类指挥家认可并演奏。”要知道,交响变奏曲不同于一般的音乐生成过程,它有故事脉络,有强烈的情感抒发诉求。为此,项目组从以下三个层次进行技术演化:
自研AVM自动变奏模型
基于节奏、和声、织体、配器等方面建立专家变奏规则库,用于基础模型训练,然后利用深度学习和强化学习技术对音乐作品做多维度的特征学习与提取,训练出具有风格融合能力的AVM自动变奏模型。
训练超70万首乐曲数据集,打造海量维度音乐标签体系
为了让机器学习及理解音乐的重要特征,团队训练数据使用了超过70万首乐曲,包括各类题材的古典音乐作品、红色歌曲、民歌等。并且,音乐标签的标注遵循乐理知识,除了情绪、风格的标签以外,也包含主题、发展手法、和声、曲式、对位、配器、调性、调式、拍号等各类音乐元素。
灵活运用音乐评价模型和专家规则
对机器进行深度学习和强化学习训练的还有音乐评价模型,即基于大量作曲家的作品学习所构建的评价网络。原则是遵循主流审美的同时,又需要兼顾作曲专家的评价标准。同时,为防止AI作曲生成过于自由,平安在人工智能乐曲创作的过程中融入了包含和声约束、对位约束、曲式结构约束等规则在内的专家规则。
总的来说,在《我和我的祖国》这首改编作品中,除了开头与结束采用了原始旋律外,中间融入了AI变奏的创作。在AI应用的过程中,团队综合运用深度学习、强化学习和迁移学习的联合方案,搭建自动变奏模型、音乐评价模型、专家规则系统,基于对海量历史音乐作品的数据库和体系化的音乐标签工程,拆解乐曲音符组合空间,优选最佳音乐片段,从而完成本次创作。
平安AI+的独特基因
那么,为什么一家外人眼中搞金融、医疗、智慧城市的综合金融服务集团,竟然也涉足了音乐这一看似不相关的艺术领域?
翻看平安集团过去30年的跨越式发展,不难发现隐藏其后的推动力量。目前,平安用科技赋能金融,以平台建设为主,搭建了金融、医疗、汽车、房产、智慧城市等五大生态圈,整体的业务布局已然浮现,而平安人工智能研究院恰恰是集团底层技术储备和应用落地上的重要一环。
AI交响变奏曲《我和我的祖国》曲目团队技术负责人表示:“平安人工智能研究院的建立,主要有两件事:一是深入底层技术的研究和能力储备;二是与当前企业应用的场景结合起来。”在他看来,AI智能创作是研究院项目板块中重要的组成部分之一。尽管落地上尚未清晰,更多还是一个相对比较初期、尝试摸索和论证验证的阶段,但在底层技术的支撑是通用的。
此前,与金融、医疗、健康等业务的结合落地上,平安推出了智能闪赔、平安声纹、平安票据OCR识别、平安语音识别、平安语音合成、平安医疗影像等产品。
在记者看来,平安“AI+音乐”领域探索的成功将主要归于三点因素:
一是不仅拥有深度学习技术的储备,更重要的还是团队对音乐的深刻理解。
平安人工智能研究院的AI作曲项目团队有大量的既懂得音乐理论又了解计算机算法的复合型人才,能够将前沿的AI技术与柔性的音乐情感相融合,不断突破人工智能技术的边界,挖掘AI技术在音乐领域的潜能,实现AI作曲创作的最优发展。
二是有相对可以落地的场景呈现,并懂得如何去挖掘,如音乐治疗、智能作曲。
从形式上看,AI变奏曲之后,平安科技也将会在古典乐、流行乐、作词作曲演唱等方面做更多的尝试和突破。AI融入艺术创作,大大降低了普通大众的创作门槛,可以让更多人加入到音乐创作,探索更多的音乐形式,极大地丰富了人们的生活。
三是数据和场景的不断积累,将反哺集团在其他产业链条上的技术纵深,从某种意义上讲,这将会是一种降维突破。
事实上,平安科技已经在尝试挖掘一些有趣的场景,把更多、更丰富、更个性化的艺术作品,通过AI的形式释放出来。目前,从全行业来看,短视频配乐、游戏配乐、影视配乐等场景中已涌现出了诸多对AI作曲的需求。未来,利用AI技术打造诸多应用产品,实现产品输出和业务输出,通过构建多角度一体化解决方案助力主营业务和生态圈层向更多元和精深的方向发展。
或许,在平安科技构筑差异化优势的思考下,AI音乐创作仅是一小步的尝试,但这不影响其结合自身科技积淀、主营业务以及所在行业的优势开始有侧重点的发力。除却商业层面的因素外,企业也会因其承担的社会价值层次的不同,从不同的角度去定义,对AI艺术的发展产生不同程度的影响。
一不小心,AI让我们认识了全新的自己
未来,平安将进一步拓展AI音乐应用的场景和领域,例如音乐鉴赏、音乐教育、音乐治疗等,此外,人工智能技术又进一步渗透到人类意识形态的艺术多维领域,如绘画、作诗等。
不难预想,AI不仅改变了我们的创造能力,而且还提出了关键技术突破问题。未来,AI如何拓展人类的创造力?如何利用技术拓展艺术的边界,丰富艺术的多元性? AI可以绘画、编曲,但能否跟人类创作的作品一样动人?
在谈及AI对艺术产业的变革时,项目技术负责人认为,利用AI实现智能创作,实际上可以帮助作曲家、艺术家更高效地创作,探索他们原本不可能的作品、风格尝试。但这其中,人的因素仍是艺术创作中最核心最重要的一环。
这一回答,无疑道出了未来人工智能发展的最大空间,AI所实现的东西越多,人类对创造力的标准也就越高。如何能够最贴近人类的意识形态,实现思维的丰富和想象力的突破,是AI技术面临的最大难点。在更多的艺术领域,AI技术的介入极大地降低了艺术准入门槛,也让艺术领域以更多样的形式深入生活、产业,甚至在某种程度上改善人类精神世界的发展进程。
其实AI承载历史的案例一直在持续:故宫博物院因为AI技术变成了网红,《清明上河图》因AI、3D、VR技术让历史“真实地”流动在眼前,而被熊熊大火重挫的巴黎圣母院也会在AI技术里找到另一个新的“自己”。
《我和我的祖国》AI交响变奏曲也是这种浪漫艺术与严谨科学的完美融合。
我们还看到,在新中国成立70周年的长篇卷轴上,我国的多项技术曾都带来过革命性的突破。比如早期基于控制论的核技术,到打破封锁的超级计算机技术,再到载人航天卫星技术,均让国家实力大幅跃升。
走过工业化和信息化的70年后,我们进入了崭新的智能化时代,平安《我和我的祖国》AI交响变奏曲克服了技术壁垒,某种程度上,也将人工智能技术带进了崭新领地,势必会在伟大历史节点上留下其浓墨重彩的一笔。