随着一个又一个AI独角兽陆续崛起,英伟达的市值跃升到全球第一之后,数据拥有者们也逐步意识到了手中数据的价值可能要远比想象中更大。就在Reddit方面向AI搜索爬虫发出侵权警告的同时,日前索尼音乐、环球音乐和华纳音乐联合起诉了AI公司Suno和Udio,指控后者通过使用自己的版权内容来训练音乐生成式AI,而1首歌索赔15万美元的价码更堪称是狮子大开口。
近日有消息显示,YouTube方面正在与相关唱片公司进行谈判,希望获得后者所拥有的歌曲版权,以便让人工智能工具可以克隆艺人的流行音乐,并希望通过预付款的方式赢得持唱片业的支持。据知情人士透露,YouTube最近向索尼、华纳和环球等头部唱片公司提供了现金,试图说服更多的艺术家允许将他们的音乐用于训练人工智能。
不过YouTube和唱片公司的交易更像是Meta、Snap等社交媒体的方案,即支付一次性费用来获得音乐的使用权,而不是类似Spotify、Apple Music等流媒体平台与唱片公司之间基于版税的模式。
为什么在文字、图片、声音、视频等不同的媒介里,做声音生意的唱片公司似乎最敏感。以图文为主的Reddit不光是卖数据最积极,面对AI厂商违规窃取数据时也只是发出侵权警告。面对OpenAI使用YouTube视频训练Sora的情况,谷歌CEO桑达尔·皮查伊也不过是宣称将采取相应的法律行动来解决问题。
唱片公司对于AI音乐产品极为敏感的原因,其实在于音乐创作本身的特殊性,因为音乐并非简单的数字游戏。在数学层面,12个音可以组成的旋律被认为是几乎无穷无尽,在4/4拍的一小节中且一个八度内,符合十二平均律的情况下,可从全音符选用至32分音符,能组合出的旋律比宇宙的寿命在数字层面还大。问题是数学层面的旋律虽然无限大,但能被大众接受、被认为是美的旋律却极为有限。
按照音乐创作者的说法,好听的旋律早在后浪漫主义时期(1850年~1910年左右)就已经被写完了,古典音乐的没落不就是因为最动听的旋律进行已经被演绎完了,再遵循旧路则无法超越前人,以至于必须切换赛道。可是当代流行音乐在和声语言上又极为匮乏,使得音乐创作有如带着镣铐跳舞。所以商业化创作在首要满足流行度的前提下,在调式选择、节奏的复杂度,以及音域宽度等方面都会受到一定得限制。
比如受限于歌手的唱功,如今的流行乐基本都在两个八度内,调式也局限于自然大调、和声小调、五声音阶。为了让自己的创新度处于大众能接纳的范围内,大家熟知的“4536251”、“1451”,以及卡农和弦被用得过于频繁,使得市面上许多歌曲自然就显得千篇一律,“抖音神曲”其实就是在这一背景下出现的。换而言之,如果想要音乐作品不与他人雷同,几乎就代表者创作者拒绝商业化。
在AIGC没有被应用在音乐产业之前,采样技术就已经让音乐产业陷入到了同质化的困境中,在有限的风格里进行创作总是会有一些相似度,以至于流行音乐“撞调”的现象如此频繁,使得创作者都见怪不怪了。简单来说,最商业化的流行音乐本身的天花板并不高,所以AI的介入就会导致一个极为可怕的未来,即大量好听的音乐会在短时间内被AI“算出来”,最终音乐界就会面临一个创作空间被无限压缩的窘境。
对于唱片公司来说,大众化的流行音乐无疑是他们获得盈利的阵地,所以当然不希望AIGC将音乐创作的水搅得更浑浊。这也是为什么索尼等唱片公司会在起诉书中指出,Suno、Udio在未经许可的情况下复制音乐,训练他们的AI系统创作音乐,这些音乐将直接与人类艺术家的作品竞争,贬值、并最终淹没后者的作品。
更何况AI音乐工具的出现,就意味着没有受过专业音乐训练的普通人,即使缺乏乐理知识,对于旋律、十二音什么的完全不了解,也能在AI的辅助下产出被大众接受的音乐。事实上,目前Suno AI已经可以从现有人类音乐数据的节拍、和声、旋律、和弦中,生成基于不同“场景”、“情绪”和“流派”的音乐,实现了仅需提供歌曲描述或自定义歌词,即可创作出包含人声、旋律和歌词的完整歌曲。
如果人人都可以做出能听的音乐作品,这对于唱片公司显然不仅不是好事、反而会成为灭顶之灾,因为快速增长的AI音乐会大幅降低市场对于版权方的依赖。由于AI会降低音乐创作的门槛,进而导致作为既得利益者的唱片公司无法保持市场竞争力。在经历了上世纪末以Napster为代表的互联网音乐平台对于实体唱片业毁灭性的打击,被逼得焦头烂额的唱片公司不得不放下身段拥抱数字化的故事之后,这些唱片公司绝对不愿让Suno等AI公司成为下一个Napster。
因此除非YouTube真的愿意出大价钱,否则唱片公司必然不愿意出卖自己的绞索。未来最有可能出现的场景大概率会是猫鼠游戏,即便AI厂商用技术手段获得音乐数据,再尽可能地用类似“洗稿”的方式来撇清侵权责任,而唱片公司则会不顾一切地用法律武器向各个AI厂商开火。