上个月,文生音频的新星Suno用AI音乐让全球音乐圈看到了AI的力量,万万没想到才过去一个月,Suno文生音频头把交椅还没坐稳就迎来了挑战者,一个被众多体验者称之为“音乐版Sora”的AI大模型——Udio。
Udio与Suno类似,用户只需输入简单的提示词,比如音乐风格、音乐流派、歌词内容、音色等,等待几秒就能快速生成带有歌词和节拍的音乐片段。如果说Suno团队的初衷是降低编曲门槛,让更多普通人深入接触音乐创作,那么Udio的野心显然要来得更大,许多音乐人体验后表示Udio在器乐和人声的还原度上几乎达到了以假乱真的地步,跳脱出了过去合成音乐“音与音合成粘连”的问题。
短短4个半月时间,音乐圈就被AI音乐“颠覆”了两次。作为实际体验Suno创作的一员,雷科技对Udio的真实水平十分好奇,究竟它是否真的有网上宣传的实力,我们一试便知。
Udio专业效果碾压,但使用起来有硬伤
点开Udio的官网,给人的第一感觉像是某个听歌软件。推荐优秀作品吸引了小雷的注意,反而置顶的创作栏在一众五颜六色的图标中显得有些不起眼,很容易让人忽视。Suno页面布局相对合理,起码能让第一次使用的用户快速找到创作入口。
图源:Udio
图源:Suno
点开创作页面,Udio可以自由输入关键词生成音乐,也可以点击输入框右边的骰子摇出随机关键词,这个设定对缺乏灵感的用户是个不错的功能,分分钟能摇出好听的歌曲。Udio支持自选歌曲风格,也可以输入现有的音乐家名称让AI判断歌曲流派标签。
不仅如此,Udio创作栏提供推荐关键词,其中包括内容、歌曲流派等,能节省用户自行查阅的时间。同样的,Udio支持用户自定义歌曲的歌词,只需要在自定义歌词选项卡中填写文本就可以,如果你实在想不出,也可以让AI自动生成歌词。
图源:Udio
那既然我们想对比Udio和Suno生成的音乐效果,直接来场相同关键词的比试是最直观的。对此,小雷随机摇了个关键词“a song about finding solace in nature, heavy metal”,翻译过来就是“一首寻求大自然抚慰的重金属音乐”。
在生成阶段,两者表现就产生了差距。同样是生成两首音乐,Udio花了35秒生成出时长33秒的作品,而Suno只用了不到10秒就生成了1分48秒的作品,Suno的生成效率方面明显要比Udio更高。
歌词方面,小雷感觉两者半斤八两,AI生成歌词基本都是没有营养的词语拼凑,看来想要收获高质量的AI音乐,还得用户自定义歌词。补充一句Udio虽然单次生成只有33秒,但用户是可以对成品进行拓展的,并且它还能点击“混音”微调已生成作品。
最后是比拼的重头戏,为了测试的客观性,小雷去除了歌词、混音等人为因素,为的就是展示Suno和Udio最原始的硬实力,让我们一起来听听两个AI生成模型的音乐效果。
从个人观感来评价,小雷认为Udio并没有展现出网上所说比Suno强两倍的实力。相反,小雷认为Suno生成的音乐更符合我的审美,无论是生成效率,还是生成效果,Suno都要更胜一筹。不过,评价是主观的,如果大家有不同的观点,欢迎在评论区发表你的看法。
单次测试结果不能代表什么,小雷随后试听了多首Udio首页的推荐音乐,发现原来不是Udio不行,只是小雷不会用。Udio优秀音乐的人声表现异常亮眼,无论是什么歌曲流派,Udio生成音乐的音色更细腻,演唱细节也更丰富,完全没有Suno那种合成电音的感觉,在金字塔作品的比拼中,个人认为Udio完胜。
但Udio的缺点也十分明显,生成音乐的效率和完整度不如Suno,尽管音乐可以通过后续拓展延长时长,但多次操作带来的出错率显然更高,音乐歌词和风格偶尔也会出现断层。当然,Udio目前仍处于Beta测试阶段,后续或许会继续优化使用体验。
音乐人联合抵制,AI音乐路在何方
据悉,Udio团队去年12月才正式成立,由一批前谷歌Deepmind工程师共同打造。有趣的是,谷歌DeepMind去年11月发布了音乐生成模型Lyria,Udio团队的4位联合创始人就在Lyria的贡献者名单上,很难不让人猜想Lyria与Udio可能存在千丝万缕的关系。
不管是否存在换皮重生的可能,总之Udio和Suno一样,已经掀起了AI音乐圈的又一轮狂欢。然而,AI音乐与传统音乐圈即对立又统一的复杂关系,令不少音乐人产生了抵触情绪。4月2日,包括Billie Eilish和Katy Perry等多位知名歌手在内,有超过200个国际乐坛音乐人联合发表了公开信,呼吁数字音乐开发商停止使用AI来侵犯和贬低人类艺术家的权利。
公开信主要内容片段,图源:艺术家版权联盟网站
音乐人联合抵制AI音乐,代表着音乐圈中某部分群体的看法,但不同领域对AI音乐有不一样的看法,音乐圈之外,已经有人开始探索AI音乐商业化的可能性了。
日前,一款名为YeloMelo的AI音乐小程序通过了工信部备案,支持用户上传自己创作的AI音乐。与Suno、Udio不同,YeloMelo提供方便用户交流分享的社区平台,在雷科技看来,背后的商业逻辑与国内曾经盛极一时的音乐社区十分相似,AI音乐生成模型让没有任何乐理知识的普通人也能创作自己的音乐,随着创作人和音乐数量的增加,大众需要交流分享的平台,这批用户带来的流量是AI音乐未来商业化的基础。
除了流量红利外,AI音乐在影视和游戏领域也有不错的商业化潜力。音乐作为影响玩家情绪的重要渠道之一,配乐对游戏的重要性不言而喻,游戏大厂虽然拥有自己的音乐设计团队,但如果能通过AI音乐节省人力成本,显然是个不错的方案。同理,小团队也能运用AI生成替代外包公司。
AI在影视领域的进程则更为迅速,印度泰卢固语喜剧《Save the Tigers》第二季大结局片尾的演职员表中,音乐团队歌词一栏明确标注了ChatGPT,算是AI聊天机器人首次公开用于音乐创作。ChatGPT都助力影视剧打造音乐,专门用于生成音乐的Suno、Udio自然能做得更好。
图源:Save the Tigers
AI音乐商业化路径目前并不明确,但已经开始对各领域产生不一样的影响,即便受到部分群体的抵制,相信也很难阻挡AI音乐的全面崛起。相比起抵制,AI音乐当前最大的问题仍是许多AIGC内容无法解决的版权问题。
版权问题,是AI音乐崛起的最后一关
众所周知,训练数据是AI大模型成长的必需养分,好的生成效果取决于更多的训练数据和更大参数的模型。Suno和Udio能在一众AI生成音乐模型中脱颖而出,除了模型上的进步外,绝对离不开数量庞大的训练数据。
Suno团队至今未公布Suno模型是用什么数据训练而成,如果他们在未经允许的情况下,使用了有版权保护的作品,那么他们将面临起诉,而用户借助Suno生成的音乐作品也有着同样的风险。
而Udio官方同样没有透露数据来源,但他们表示产品有版权保护措施,模型配有自动过滤器,确保在平台上创作的音乐都是原创的,至于可信度几何就见仁见智了。
过去AI生成文字、图片同样面临着各种版权问题,不过由于版权界定模糊等问题,仅出现少数明确判定侵权的案例,多数还是游离在法律边缘的灰色地带。音乐创作对比图文,版权复杂程度更高,从编曲到演唱者,再到拥有实际版权的唱片公司,层层递进的版权意识可能会让AI音乐面对比图文更高的被维权风险。
尽管两家目前都还没有传出相关风险,但版权问题不解决始终是悬在头顶上的一把利剑,随时反噬。如果Suno、Udio们无法从根本上解决版权风险,那么AI音乐商业化或许只是一个空想。
北京国际汽车展览会(北京车展)将于4月25日-5月4日隆重举行,本届车展以“新时代 新汽车”为主题,是“汽车从电动化走向智能化”的风向标。
届时,包括比亚迪、小米、AITO问界、小鹏、蔚来、理想、极氪、极越、长安深蓝等头部品牌将悉数登场,除新车型“大比武”外,自动驾驶技术的推进、智能座舱的演化和AI大模型与汽车的结合,都将是重要看点。雷科技旗下“关注电动车,更懂智能化”的账号电车通将派出报道团前往北京现场,进行一线专业报道,敬请关注。