AI歌手,不甘心只做“AI孙燕姿”

华语乐坛,满眼都是孙燕姿。

各种音乐平台中,以“AI孙燕姿”为歌手的歌单和播客正在越来越多,哪怕孙燕姿本人亲字回应也无法遏制这样的风潮。

“我想说的是,你跟一个每几分钟就推出一张新专辑的人还有什么好争的......我还是能分辨出区别的,它没有情绪,没有音调和呼吸(或任何你能想到的术语)的变化。很抱歉,我怀疑这只是一个非常短期内的回应。”

歌手们在担心,人类是否真的无法敌过AI了?而在“被替代”的恐惧背后,更多问题落在了版权层面。第三方是否有权利不经许可就复刻歌手本人的声音?“孙燕姿们”要如何拿回对自己声音的控制权?

近日,一款AI歌手音乐创作软件“网易云音乐・X Studio”悄然上线。软件内置12名高度拟人且声线迥异的AI歌手,其中就包括声线酷似王菲的AI若溪(代号F970)。网友不禁好奇,若溪与王菲是否有关?AI歌手的训练数据从何而来?

打开凤凰新闻客户端 提升3倍流畅度

这个问题问向小冰,软件的出品方之一。

小冰在国产AI歌姬方面的研究历史可以追溯到2014年,当时小冰公司还是微软小冰团队,他们发布了一款名为"少女小冰"的聊天机器人。随着技术的发展,小冰逐渐扩展了其功能,当中包括AI在音乐领域的应用。在2017年,小冰推出了AI歌手的试验版本,该版本已具备一定的音乐创作和演唱能力。

更清醒的听众或许会坚持AI孙燕姿只是人们理解AIGC的又一个俏皮作品,歌迷也并不会真的放弃自己心爱的歌手转而完全把注意力放在一个没有生命的替代版本上。人们对AI孙燕姿的讨论或许最终会转化成:AI究竟能在音乐创作中延伸到什么程度?

这场讨论其实早已开始了。

“M435”

“虚拟歌手的软件,其实我们都是有用的,不管是付费的,还是免费的,我们都会去接触,因为在日常的创作过程中是经常会用到的。”

孙玉镜的回答让人有些意外。作为幻想动漫音乐的创始人和艺术总监,他带着团队负责《罗小黑战记》的全部配乐制作。《罗小黑战记》是国内2D动画中质量颇高的作品,但因为制作十分用心,更新的总是缓慢,追更的粉丝甚至开玩笑说要为这部动画做好“泡枸杞养生”的准备。

用心和纠结同样贯彻在动画配乐上。为了更理想的创作效果,孙玉镜的创作过程中已经有了很多AI元素渗入,比如“M435”。

“比如说我们做了一首歌——拿摇滚举例——我们自己制作人去写这个旋律,我们自己可能拿自己的嗓子去唱。但是制作人可能在音乐的理论方面,制作方面非常专业,但是唱的话,可能就会效果差一些。但是我们还是需要自己去唱一下,然后再做编曲的工作会顺利很多。”

“后来我们直接就用M435”——一个摇滚音色的AI歌手——来唱,然后我们就能快速的确定这个旋律,这个词到底是不是我们想要的东西。”

“M435”有另外一个名字——AI歌手崔璨。

他当然不是崔健(虽然这个名字让人浮想联翩),但显然,一个“AI歌手”背后的意义,远不止“咬字和音色准不准确”那么简单。

“M435”诞生自人工智能小冰框架,被内置于上述AI歌手音乐创作软件X Studio中。创作者输入词曲,3秒内可生成专业歌手水准的AI演唱干声。

打开凤凰新闻客户端 提升3倍流畅度

崔璨和软件中另外11位AI歌手一起,组成首个虚拟歌手厂牌 WOWAIDO!出道。首张迷你专辑《WOWAIDO!Ⅰ地心引力》6月15日在网易云音乐上线。不到24小时,其中《致你》这首歌的评论已达到999+,演唱者为AI何畅(代号F11)和AI徐梦甜(代号F801)。抖音百万粉丝的AI夏语冰、AI陈水若也在成员名单中出现。

AI歌手在评论区与网友展开“一对一”互动 图源:小冰

AI歌手在评论区与网友展开“一对一”互动 图源:小冰

永远在线的歌手

我们一直以听众的角度来看待AI歌手的井喷。但其实对于音乐创作者来说,X Studio生产出的不同风格的歌手,填补了音乐创作中的一块空白,并且这些歌手永远稳定可靠。

X Studio的AI歌手阵营具备高度拟人及多样化的声线风格,可适配流行、民谣、国风、电子、摇滚等各种曲风,也包括埋头儿童音乐的李召洋苦苦寻找的童音。

毕业于四川音乐学院的李召洋在老师的身份之外也是一位儿童音乐的制作人,但儿童音乐产业发展远不及成人音乐成熟,他总是感觉一方面家长的需求极高,但适合的童音却难找——并且哪怕找到了也很难要求一个几岁的孩子按照要求稳定的唱完一首歌。

他开始在AI歌手中寻找这样的声音。少女小冰(代号F002)的声线是他在同类产品中能找到的最接近童声的声音。

这是他喜欢使用X Studio的关键原因。他曾使用少女小冰的声音发表作品《笠翁对韵》,获得第5届唱工委音乐奖最佳儿童音乐专辑提名。

孙玉镜从AI歌手何畅开始了解到X Studio。何畅是X Studio中最成熟的一个AI歌手,曾与马伯骞、卞子严、小柯这些音乐人有过合作,演唱Burberry品牌曲《Runaway2.0》、成都大运会推广曲《在成都等你》、北京冬奥献礼曲《唯你无他》等。

“对玩家也好,或者是对从业者,制作人也好,AI歌手如果有成熟作品做得很好,他会想,我用这个AI歌手,只要用心调,也能做到这样,那大家肯定是愿意使用的。”

在孙玉镜眼中,AI歌手与人类歌手是一样的,每个人或“人”都有自己的特色。他们优势互补,能在创作的不同阶段帮到自己。“AI歌手24小时在线且状态恒一,在创作初期的词曲、编曲阶段,能帮创作者随时调整完善,看到至少80%成品的样子。在创作末期的录音阶段,由于人与人的交流更直接,人类歌手能按我的示范快速调整对某处细节的演绎。”

X Studio也确实给了使用者极大的创作自由度。

它内置了小冰歌唱模型、一致性超级自然语音、流式渲染歌声合成和视觉神经网络渲染等技术。创作者能通过调整参数,实现AI歌手的滑音、转音、颤音、咬字、节奏、音色、强弱等变化,细腻演绎作品效果。这意味着在标准音色和演唱风格的基础上,使用者可以将其打磨成更具有个人风格或者更符合自己设想的AI歌手。

除此之外,X Studio另一个强大的能力在于支持合并AI音轨的数量高达30轨,也就是说每个音乐人都可以拥有一支“30人”的合唱团。

音乐制作人宋承容的朋友圈

音乐制作人宋承容的朋友圈

消除版权疑云

最使音乐创作者头痛的无异于版权问题,而在X Studio中的AI歌手均无版权风险。

有网友将自己的AI音乐作品放在网络上,使用的声音原型是小冰的AI歌手若溪,在做了更细节的调音后,AI歌手的声线像极了王菲,它唱了一首《红豆》。

AI孙燕姿之后,或许会有更多歌手被AI化。理论上只要你有一个你想要训练成的音色的音频数据集——比如两个小时王菲的唱片或采访音源——然后根据这个音频数据集来训练模型,接着用这么训练完的模型去推理和替换另一首歌中声线——比如刀郎的《情人》,你最终就可以听到王菲版本的《情人》。

这是一个更麻烦的流程,且伴随着巨大的版权风险。

北京大成律师事务所高级合伙人肖飒在一次采访中表示,一个翻唱行为要合法化,需要取得权利人的许可。肖飒指出,一首歌曲的产生,往往涉及诸多权利人,其著作权体系较为复杂。具体而言,可能包含该歌曲词曲作者的著作权、该歌曲演唱者作为表演者的权利以及相关公司作为录音录像制作者的权利。

“理想情况下需要取得前述所有权利人的许可,否则其翻唱行为极有可能侵犯前述主体的相应权利,从而需要承担侵权责任。即便是AI翻唱,也受到此种规则的限制。”

创作者训练了一位知名歌手的声音来唱一首新歌,这首歌火了,是这个创作者的功劳,还是AI或者那位知名歌手的?创作者要面对的是音乐工业中复杂的权利人体系,知名歌手本人要面对的是无法掌控自己声音的使用场景以及潜在的取得收益的机会。这是不断出现的知名歌手AI化背后的普遍问题。

这个问题的解决亟需音乐平台作为中间一环进场。后者本身已经包含了音乐工业从创作者到歌手的完整流程。这也是此次X Studio的更新重点。

这或许是“AI孙燕姿们”合法化的第一步。小冰公司透露,已有真人歌手主动授权公司“克隆”自己的声音,来保留巅峰状态。歌手能决定AI声音的用途并取得相关收益。经过本人训练调优,AI声音将有机会获得更好的表现。当市场出现越来越多“正版”声音,良币驱逐劣币,或许能解决“孙燕姿们”的问题,也能给予音乐创作者更多选择。

官方同时表示,小冰始终倡导AI技术的安全发展之路。软件包含高安全性和隐私保护策略,所有AI歌手均经过严格的数据训练,所有创作均可溯源,希望此举能为AI创作的未来提供良性发展参考。

尾声

或许我们可以从音乐合成器的历史中找到一些对AI歌手的信心。

合成器是一种电声乐器,原理是以产生的电信号通过放大器推动扬声器产生声音。这让它可以模拟那些真实存在的乐器音色,比如钢琴、鼓甚至弦乐。另一方面,合成器也可以在调试过后去形成现实中的环境采样声音,或甚至在现实中根本无法找到的声音。

合成器在上个世纪60年代从流行音乐切入开始受人关注。80年代Yamaha推出的数字合成器DX7以及90年代随着计算机普及进一步兴起的软件合成器则一步步巩固了合成器在音乐制作中的角色,甚至围绕合成器形成了Synthwave这样的音乐流派。

将AI歌手放在真实歌手的对立面上,不如将AI歌手看作一种继续发展的合成器。

音乐制作过程中,合成器的能力已经从最初对于真实乐器的还原进化到对于各种环境声音,比如涨潮和虫鸣的还原,相比之下,变幻莫测的人声是合成器的终极命题。两者都在经历一个从被质疑到被普遍接受的过程。

而合法化后的“AI孙燕姿”们,最终会对未来的音乐创作带来帮助。

打开APP阅读更多精彩内容