今天小编分享的科技经验:Suno不会取代人类音乐,但AIGC重构内容产业已成必然,欢迎阅读。
自从 ChatGPT 面世以来,生成式 AI 已经给我们带来了诸多惊喜,并且 AI 对于不同行业的影响力还在不断扩散。2024 年才刚过去 3 个月,就已经涌现出一批新的 AI 大模型:文字生成视频的 Sora、支持 200 万字长文本处理的 Kimi,以及文生音频的新星—— Suno。
「音乐界的 ChatGPT」、「可能席卷全世界的可怕 AI 音乐」、「颠覆音乐圈」,这些是无数网友和媒体在体验过 Suno 后给出的真实评价。
图源:rollingstone
Suno 是 AI 初创公司 Suno 推出的音乐生成模型,无论用户是否拥有乐理知识,只需输入简单的提示词,比如音乐风格、音乐流派、歌词内容、音色等,等待几秒就能快速生成带有歌词和节拍的 2 分钟音乐。
值得注意的是,近期 Suno 公司还推出了 V3 版本,该版本首次能够生成广播质量的音乐,并新增了更丰富的音乐风格和流派选项,比如古典音乐、爵士乐、Hiphop、电子等新潮曲风。官方表示 V4 版本已经在开发中,并计划推出全新功能。
看到这里,雷科技抱着好奇打开了Suno 官网。我们首先看到的是许多首由 Suno 生成的音乐,以英文歌曲为主。随机试听了几首之后,感觉旋律还挺上头,这让我对 Suno 的表现有了更高的期待。
图源:Suno
点击右上角的制作按钮,就能进入到主界面了。在探索页面,我们能看到由网友创作的优秀作品,有电子音乐、重金属摇滚、传统民谣、蓝调等不同流派,Suno 根据播放量和点赞量对歌曲进行排名。可以看出,Suno 支持包括中文、英文在内的多种语言,对中文生成的 AI 歌曲非常友好。像「如梦令」、「水调歌头」等歌曲听起来十分舒服,相当符合国人的歌曲喜好。
注册好账号,我们打开创造页面。整体界面和 ChatGPT 类似,拥有关键词输入框、音乐流派、模型选择等选项。
话不多说,下面正式开始「音乐小白」的创作之路。为了体现 Suno 的实力,雷科技特意用中文输入了自己都无法理解的关键词:「用民谣描述关于金刚与哥斯拉的爱情故事」。
等待数秒后,雷科技第一首歌曲「金刚与哥斯拉的爱情故事」制作完成。从歌词来看,Suno 精准识别到了金刚和哥斯拉两个关键词,并在它们怪物身份上延伸出了战斗等场景描述。
点击播放歌曲,结果让我感到震惊,完全不相信这是由我给与的关键词创作而成的歌曲。至少听起来没有 AI 生成常有的生涩感,歌词押韵,甚至还附带有和声、分段。作为「音乐小白」,雷科技感觉这首歌曲是符合要求的,具体效果大家可移步到雷科技微信(ID:leitech)回复 "Suno" 品鉴。
图源:Suno
随后雷科技连续生成了几首不同流派、不同主题的歌曲,新鲜感过去后,雷科技发觉 Suno 生成相同曲风的歌曲有种千篇一律的感觉,虽然歌词和旋律不一样,但个人感觉与抖音上常听的口水歌非常相似。
在查阅资料的过程中,雷科技发现 Suno 原来还有进阶玩法。在创造界面的自定义模式下,用户可以自行制定 Intro(引子或前奏)、Verse(诗歌部分 / 主歌)、Chorus(合唱部分 / 副歌)、Bridge(桥接部分)、Outro(尾奏)等部分的歌词,并通过关键词技巧,让 AI 理解用户表达。
因为涉及到实际乐理知识,不懂音乐的朋友理解起来相当麻烦,雷科技将其总结为:「风格 + 情感 + 乐器 + 节奏 + 人声」。如果你觉得自己想歌词太麻烦,但又对歌词感兴趣,可以结合 ChatGPT,让 AI 生成符合你要求的歌词文本。
如果你想参考现有歌曲的节奏,则需将歌曲的 BPM(节奏)和 Key(调高)输入到关键词中。
一番体验下来,雷科技认为 Suno 表现十分惊人。无论是面向小白的一键生成,还是专业向的自定义生成,都能在极短时间内生成出颇具质量的歌曲。尤其是自定义生成,探索页面的优秀作品向我们展示了 Suno 的无限可能。至少从目前看来,还没有人能断言 Suno V3 版本的上限,每日不断涌现的最新作品就是最好的证明。
目前 Suno 新注册用户每天能生成 10 首歌曲,对于玩票性质的普通用户已经足够,如果你还有更多需求,还可以订阅「Pro」和「Premier」计划,分别是 8 美元 / 月和 24 美元 / 月。
可能有很多人会感到好奇,究竟是一家什么样的公司才能创造出如此神奇的 Suno V3。目前,Suno 团队成立仅两年,团队成员只有 12 个人,部分团队成员此前服务于 Meta、TikTok 和 Kensho Technologies 等科技公司。
其实在 Suno 出现之前,市面上已经出现了数款 AI 音乐生成工具,Dream Track、Jammable 以及 Project Music GenAI 就是其中的代表。Suno 之所以能在互联网上形成病毒式传播,主要原因是其简化了普通人创造歌曲的步骤,用户只需简单引导就能自动完成人声、歌词、风格、曲谱等内容。
这令普通人与专业音乐创作者之间的差距瞬间缩小,就像 Midjourney 生成影像引起设计行业动荡那样,Suno 同样引起了部分音乐人的警觉。虽然现阶段 Suno 的创作水平还远远没有达到足以颠覆音乐圈的阶段,但 AI 最可怕的是学习能力。Suno 团队在 2023 年 7 月才在生成模型中加入了人声音乐功能,仅仅过去 9 个月时间,就已经迭代至 V3 版本,或许没有人能预测出 Suno 的最终水平。
在雷科技看来,Suno 确实可以让普通人大批量创造「原创」歌曲,但颠覆音乐圈的可能性不高。
首先,歌曲的本质是人们的自我表达,和文字、图片是一个道理,只不过歌曲的表现形式更为复杂,光是声音层次就能形成若干种可能。
AI 固然可以通过高强度的学习,还原出各种声音与曲风,甚至未来还能形成连贯性的长音乐。
但一首好的歌曲之所以能与听众形成共鸣,是因为它与人、社会有着充分联系,这也是为什么我们在听部分歌曲时会激动、会难过的原因。而 AI 音乐暂时还没有表现出对应的能力,鉴于当前情况,我更愿意称之为「无情的创作机器」。
其次,还是老生常谈的版权问题。Suno 团队至今未公布 Suno 模型是用什么数据训练而成,如果他们在未经允许的情况下,使用了有版权保护的作品,那么他们将面临起诉,而用户借助 Suno 生成的音乐作品也有着同样的风险。
许多用户除了生成全新歌曲外,还会对现有歌曲进行二创,这部分操作是否合法,至今仍未有定论。AI 生成内容给现有法律体系带来了不少难题,AI 网文、AI 影像,AI 音乐、AI 复活等技术的诞生给知识产权带来了新的复杂性,如何避免法律风险,合法且道德引导用户使用 Suno 制作音乐,是阻碍 Suno 发展的首要难题。
实际上,Suno 团队也意识到了 AI 音乐和音乐圈之间的复杂关系,他们表示团队正致力于让人们深入接触音乐创作,而非替代音乐家。
最后,Suno 真正颠覆的应该是专门打造网络神曲的制作公司,一直以来,公式化创作歌曲是这批公司的强项,但 Suno 显然比他们更具优势。在 Suno 的冲击下,这个行业又将迎来新一轮洗牌。
大模型进入人们视线范围的时间其实并不长,但它给人们生活带来了切切实实的改变。更高的效率和更低的门槛,两者是大模型的最大魅力。在「AI+X」的场景中,过去行业的限入门槛没了,人人都可以是创作者,每个人都能尽情表达自我。
Suno 像 ChatGPT、Sora、Kimi 等诸多前辈一样,成功引起了对应行业的震撼。虽说还无法达到人类输出实际情感的要求,但其歌曲生成效率已经成功打败了 99% 的音乐人,并且这个优势还会不断扩大。
雷科技实际体验 Suno 的时间并不长,但在攻略的帮助下已能创作出一些看似有点专业性的歌曲。「音乐小白」尚且如此,专业音乐创作者使用 Suno 的效率必然更高,得到的惊喜自然也会更多。
当 AI 音乐泛滥,用户如何在歌曲海洋中找到符合自己审美的音乐,或许又会成为新的难题。大模型与音乐内容结合的新一代 AI 音乐推荐,也将迎来新的机会。
Suno 以及其代表的 AIGC 平台,正在重构内容产业秩序。
雷科技想起了抖音以及 TikTok。从名字可以看出,抖音十分注重 " 音乐 " 在短视频内容中的价值,TikTok 的前身业务很大一部分源自于字节收购的 Musical.ly。毫不夸张地说,抖音以及 TikTok 均是从 " 音乐 " 出发去建构了短视频帝国,这正是快手等短视频平台不具备的特质。如今,抖音在事实上也已成为网红音乐制造机。
因此,Suno 的出现,以及 AIGC 的爆发,最直接冲击的应该是抖音等短视频内容平台,因为内容的生产逻辑正在发生剧变。或许正是因为此,一手将抖音做大的抖音集团前 CEO 会辞任转而主攻剪映。字节在 AIGC 上的储备与实力跟其体量无法匹配,也无法跟微软、Google、Meta、百度、阿里等巨头比肩。好在字节正在加码 AIGC,因为 AI 是字节的基因,AIGC 是字节最不能输的战争——至于游戏、教育、飞书等业务,都不属于核心。
AIGC 的浪潮正以超出所有人预期的速度,奔涌而来。