作者 | Xin Ling
编辑 | 靖宇
2023 年 11 月,世界等到了披头士乐队 The Beatles 的最后一首新歌——Now and Then。之所以是新歌,因为它此前从未被正式公诸于世。之所以是最后一首,因为它承载着告别的忧郁,凝聚着过往的沧桑。
这首歌曲之所以引起关注,不仅因为是披头士乐队创作遗产中的一部分,更因其经过人工智能(AI)修复后获得了「年度最佳唱片奖」和「最佳摇滚表演奖」的提名,将与碧昂斯、泰勒·斯威夫特等歌手竞争奖项。
一切源于一年前,格莱美主办方更新了一系列评选规则,在涉及 AI 音乐的条款中划定了界限:参选作品可以使用 AI 元素,但完全由 AI 生成的作品则没有资格获得任何奖项。
格莱美主办方 CEO 兼总裁 Harvey Mason Jr. 对此表示,业界需要接纳 AI 并建立标准,以适应人工智能对艺术界和整个社会的影响。
这在音乐史上堪称震撼,全球最具权威的音乐奖承认了 AI 可以参与艺术创作,但仍然明确了评选作品中 AI 的参与只可作为辅助,不能直接生成。
事实上,权威组织的认证总是晚于技术发展的速度,近两年来,在大模型的暴力推进下,AI 生成式音乐快速发展,正在逐渐走入我们的生活。如今面对 AI 与音乐的结合,比格莱美态度更重要的,是技术、产业、学界、第三方等,拥有不同的价值导向和专业能力,这种多元视角的参与,让新技术朝符合艺术价值与人类价值的方向发展。
毕竟,我们现在比以往任何时候都更需要能讲述我们故事的音乐,不论这音乐来自艺术家,还是人工智能。
01
「Now and Then」:
跨越时间与生死
或许你不了解摇滚乐,但你一定听过披头士的名字。虽然只活跃了短短数年时间(1962-1970),其影响力却穿越多个时代,深刻地改变了流行音乐,成为几代人心中不朽的传奇。
披头士成立于 1960 年,主要成员分别是约翰・列侬、林戈・斯塔尔、保罗・麦卡特尼和乔治・哈里森。其中,乐队灵魂人物约翰・列侬于 1980 年 12 月 8 日,在纽约被自己的歌迷枪杀,年仅 40 岁。
「Now and Then」最初由约翰·列侬于 20 世纪 70 年代末创作并演唱。直到 1994 年,列侬的妻子小野洋子与乐队其他成员分享了「Now and Then」以及另外两首歌曲「Free as a Bird」和「Real Love」的录音时,人们才发现这首歌。
约翰·列侬和小野洋子|图源:视觉中国
保罗・麦卡特尼、乔治・哈里森和林戈・斯塔尔重新组合,尝试制作乐队精选集专辑,其中也包括三首母带中的「新歌」。
他们在列侬的样带基础上进行了全乐队编曲,成功完成了「Free as a Bird」和「Real Love」,但「Now and Then」的进展最终停滞了,主要原因是受限于技术问题,导致原始磁带难以处理。
「在约翰的样带中,钢琴的声音有点难以听清。当然,在那个年代,我们还没有音轨分离技术。」麦卡特尼在关于这首歌的纪录片中说道:「每当我们想要多一点约翰的声音时,钢琴就会出现,使歌声变得模糊。」
最终,三人小组没有完成「Now and Then」。「我们有点力不从心,时间也不够了。」麦卡特尼说。
这首歌就这样被搁置起来。2001 年 11 月 29 日,乔治・哈里森因肺癌去世,让人们更加怀疑这首歌能否最终面世。
麦卡特尼说:「我们花了将近四分之一个世纪的时间来等待再次创作 Now and Then 的合适时机。」
02
AI 让「Now and Then」重见天日
转折出现在 2021 年,麦卡特尼和斯塔尔与导演彼得·杰克逊合作拍摄了一部名为「披头士:回归」(The Beatles: Get Back)的纪录片系列。片中恢复老乐队音频的技术令观众大吃一惊。制作公司 WingNut Films 采用 MAL 音频技术对电影的单声道音轨进行解混。
麦卡特尼介绍称,这项技术可以让他们隔离单个乐器和人声,并区分披头士乐队录音中的各种声音。2022 年,他们问自己:「我们还能用这项技术做什么?」因此,他们决定使用它来增强「Now And Then」演示。
老帅哥保罗・麦卡特尼|图源:TechCrunch
麦卡特尼录制了一条贝斯音轨,斯塔尔加入了鼓声,制作人吉尔斯・马丁(Giles Martin)接替了父亲乔治・马丁(披头士乐队制作人)的工作,制作了弦乐编曲。
所以,听完这首歌我们会发现,四个人的和声部分有 30 多岁的约翰・列侬、50 多岁的乔治・哈里森、80 多岁的林戈・斯塔尔和 82 岁的保罗・麦卡特尼。
AI 技术的加入,让人们在披头士乐队解散已经过去了半个世纪之久的今天,见证了该乐队最后一首歌曲——「Now and Then」的问世。
尽管人工智能技术在音频修复和提升中的作用不可忽视,但它所使用的技术手段与纯粹的「生成式 AI」有着本质的区别。
在「Now and Then」的创作过程中,AI 并没有被用来「复活」列侬或哈里森的声音,而是通过机器学习算法对已有的录音进行「增强」,对音频进行降噪和解混。这一过程中,列侬的声音依然是来自 20 世纪 70 年代的原始录音,而非 AI 生成的新声音。
「我父亲一定会喜欢的,因为他从不羞于尝试录音技术,我觉得这真的很美。」列侬之子西恩・列侬(Sean Ono Lennon)说道。
麦卡特尼也有同感:「约翰的声音是如此清晰,非常动人。Now and Then 可能是披头士的最后一首歌,我们都在里面演奏过,所以它是真正的披头士作品。」
03
「我们比以往任何时候都更需要音乐」
经过 AI 技术修复的作品得到全球最具权威的音乐奖的承认,这在音乐史上尚属首次。当然,格莱美明确了评选作品中 AI 的参与只可作为辅助,不能直接生成。事实上,所谓机构认证总是晚于技术发展的速度,近两年来,在大模型暴力求解的推进下,生成式音乐快速发展,曾经被认为只有人类才能创作的音乐领域正在被生成式音乐一点点颠覆。
2023 年 1 月,谷歌首先发起冲锋,推出的 MusicLM 模型可以根据文本提示词生成 24kHz 频率、长达 5 分钟的纯音乐,可指定曲风、乐器、情绪等,但尚无法模拟人声。
不到两年时间,就在这个月,suno v4 最新 demo 已达到人声与机器生成之间真假难辨的水平,无论从音质还是从审美与音乐听感上,效果都堪称惊艳。
Suno v4 人声音乐 Demo
以 Suno 音乐为代表的生成式 AI 应用正在低阶配乐、公播音乐、短视频 BGM 等品类中发挥作用。音乐人可用 Suno 们启发灵感,「可编辑」已成为大势所趋。正如 AI 对所有行业的影响,罐头音乐这种低阶工种,会逐渐就被 AI 接管。
但是,笔者并不认为音乐会被 AI 取代。相反的,我们比任何时候都更需要音乐。
音乐人陈珊妮曾提出一个锐利的见解,可以作为艺术界评论当前技术对音乐影响的代表声音。她认为,如今特异的音乐越来越少,因为数字音乐以来,音乐一直在被分类,让人便于管理和更快聆听。但如果有个人特质的东西不在电子类、嘻哈类,那它是什么?它的流量就会降低。
AI 音乐也类似,它容易让各种技术指标趋于均值,但美感并不是这样的。
这是艺术家经常感受到的「技术带来的局限」:技术机械地根据流量数据对音乐套用「公式」,缺乏人在创作时带有的灵魂与爱,而后者被认为是艺术之所以成立的根本。
这其实是将用于「行活」的技术与拥有灵魂的顶尖艺术家做对比,在笔者看来,这是用 AI 音乐的下限和人类创作的上限做对比,对技术来说并不公平。
那么,AI 音乐水准的上限是什么?
腾讯音乐旗下 TME 天琴实验室高级总监吴斌从技术原理视角给出了他的判断:大模型技术路线的实质是,从人类内容中学习,它本质上没有一个抓手去超越人类内容;但如果我们讨论 AGI,就涉及另一个技术路线:强化学习。它能让 AI 在一个环境中自行探索试错,理论上就有可能突破人类已有内容的瓶颈。
对于这一判断,虽然还没有案例出现,但是身处技术飞速发展的时代,我们有理由对 AGI 的未来怀有期待。
对于技术与艺术的结合,我们需要来自艺术家的审美经验、人文关怀及理性的质疑声音,也需要来自技术从业者从底层原理出发的可靠推论,以及产业、学界等多元视角,用理性精神引导人工智能在艺术创作领域的良性发展。AI 的力量让音乐跨越生死,也让未来的创作充满更多可能性。无论技术如何进步,音乐的核心始终是情感与故事,而这需要人类与 AI 的协作去共同书写。
*头图来源:披头士