一首歌仅需0.1元，Suno等音乐大模型引发业内新焦虑

今天小编分享的财经经验：一首歌仅需0.1元，Suno等音乐大模型引发业内新焦虑，欢迎阅读。

" 大模界 " 是每日经济新闻推出一档专注生成式 AI 与大模型技术的前沿科技报道栏目。

在这里，我们将聚焦生成式 AI 技术浪潮，展现从文字、影像、音频、视频的大模型如何编织数字化世界。

在这里，我们将解码、评测国内外各类大模型，探究它们如何成为变革各行各业的重要力量。

在这里，我们将关注 AIGC 行业发展，联手行业领军人物和顶尖专家，共同揭示最新产品创新和技术突破，前瞻未来发展趋势。

欢迎关注 " 大模界 "，您将见证 AIGC 如何重塑内容生态，如何以前沿之力推动社会进步。让我们共同开启一场关于 AI 新纪元的无限旅程！

" 改变是潜移默化的，可能就在某个平凡的日子，一首触动心灵的歌曲闯入你的生活，当你深入了解其源头时，发现那是 AI 写的，那时候浪潮就悄悄来临了。" 伯雅文娱创始人、唱作人范志昊说道。这位音乐制作行业的资深人士正致力于探索 AI 在音乐创作中的辅助作用。" 总有人会做这些事，你永远无法阻挡历史车轮的脚步。"

近来，SunoV3 等音乐 AI 技术的诞生，如同一股强劲的暗流，冲击着传统音乐行业的壁垒，引发了众多音乐从业者对未来职业前景的忧虑，他们同时也在思考如何在 AI 时代中找到自己的位置。

六间房视频集团创始人、Bit Computing Pte.Ltd. 创始人 /CEO 刘岩如今正在开发一款音乐大模型，他在接受《每日经济新闻》记者电话采访时表示：" 当前市面上部分被冠以‘音乐大模型’之名的产品，其实并未达到严格意义上大模型的标准。音乐大模型因其更高的技术门槛、更窄的应用场景，或不会出现大规模爆发的情况，但有可能超越国外成为全球领先。"

一首歌仅需 0.1 元

自今年 3 月以来，国内外涌现出大量 AI 生成式音乐工具，行业格局在一夜之间发生了翻天覆地的变化。

此前，OpenAI 的 MuseNet、谷歌的 MusicLM 以及 Meta 的 MusicGen 等 AI 音乐项目已经引起了业界广泛关注。而如今，一款名为 Suno 的 " 音乐版 chatgpt" 音乐大模型点燃了全球音乐界的热情。因为这款模型能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全过程，因此被誉为 " 消灭 " 了音乐创作门槛。

音乐制作人闫东炜在第一时间试用了 Suno，他兴奋地表示：" 输入几个关键词，不到一分钟就能生成了。" 然而，他也指出了 Suno 的局限性：虽然借助 AI 可以找音乐灵感，但听多了感觉出来的基本都是流行歌。未来抖音上的歌可能会越来越相似，像流水线一样生产。如果要不断地坐在电腦前输入关键词来生成歌曲，这个过程可能会显得有些无聊。

尽管如此，Suno 仍然获得了不少业内人士的高度评价。范志昊评价：Suno 生成的音乐是有下限的，它的创作至少听着顺耳。

范志昊表示，可以借助 AI 预测音乐内容，并帮助公司找到合适的歌手。此外，AI 还降低了音乐创作的门槛，让更多人能够享受到创作的乐趣。" 本来听到好的作品会有共鸣，但如果变成自己去写，快乐是不一样的。这个市场的潜在需求非常大。" 范志昊坦言。

AI 音乐引发热潮的另一个重要原因在于使用门槛和价格的降低。以闫东炜使用过的一款 AI 音乐工具为例，基础版免费，PRO 版价格大约是 10 美元一个月，能生成 500 首歌；更高级的版本只需 30 美元一个月，就能生成约 2000 首歌。这意味着，一首 AI 歌曲的成本仅需 0.1 元左右。

范志昊表示：" 原先找专业作曲人创作歌曲的成本很高，即使是友情价也得是千元以上。但现在有了 AI，几十块钱就能生成上百条音乐作品，价格差距非常大。" 他还提到，如果机器不排队的话，几乎可以即刻生成一个词曲的 demo（試映片）。

AI 音乐并非完美无缺。闫东炜认为，AI 可以创作，但不善于修改。每次修改完都完全不一样，因此较为复杂的歌曲客户还是会找人工来做。尽管如此，他认为 AI 音乐在技术上已经高过很多网络上的口水歌。

范志昊也坦言，国内的 AI 工具和 Suno 相比仍有一定差距。虽然音乐 AI 能够生成各种风格的歌曲，但水平却参差不齐。其中，pop 和爵士风格相对较为出色。pop 风格之所以让人惊喜，是因为其训练数据丰富，结构相对可复制；而爵士风格则因为能写出好风格的人本身就比较少，所以显得尤为亮眼。

AI 会取代音乐人？

据媒体报道，当地时间 4 月 2 日，200 多名国际乐坛知名音乐人联署公开信，呼吁 AI 开发者、科技公司、平台和数字音乐服务商停止使用 AI 侵犯及贬低人类艺术家的权利，要求他们承诺不开发与之相关的 AI 音乐生成技术等，也不能拒绝向艺术家提供合理报酬。参与联署的艺人共有 246 名，大多来自欧美乐坛，其中包括比莉 · 艾利什（Billie Eilish）、凯蒂 · 佩里（Katy Perry）、妮琪 · 米娜（Nick Minaj）等。

近年来，AI 音乐生成技术迅速发展，一系列以 "AI 歌手 " 为名的翻唱作品在网络上走红。例如，"AI 孙燕姿 " 翻唱的《发如雪》、"AI 王心凌 " 翻唱的《套马杆》等视频，播放量均超过百万。随后，"AI 周杰伦 ""AI 林俊杰 ""AI 许嵩 " 等 " 歌手 " 也如雨后春笋般涌现。

相关技术的普及也引发了社会各界的担忧。许多行业人士担心，AI 的广泛应用可能会危及他们的生计和职业发展。对此，闫东炜表示，虽然 AI 对音乐创作者的影响有限，但确实降低了普通人进入音乐创作的门槛，这可能会对整个音乐行业产生一定的冲击。" 流行歌手不会失业，粉丝喜欢的是这个人，他唱得好，有作品更好。"

闫东炜进一步解释说，现在客户只需将需求发送给 AI，便能快速生成音乐作品，这在一定程度上减少了对传统音乐制作公司的需求。然而，他也强调，AI 生成的音乐往往结构单一，对于专业领網域的需求帮助有限。音乐制作人仍需要根据客户需求进行后期的修改和调整，以确保作品的质量和独特性。

"AI 最先替代的就是艺术家，人工智能可以体验无数次恋爱、失恋、死亡，因此他会比人更有情感，AI 在其他领網域最大的问题是‘幻觉’，可能会造成误判，但这种‘幻觉’在艺术上就可能是突破和创新。" 刘岩说。

范志昊表示，AI 对音乐行业的影响是双面的。它既可以降低创作门槛，让更多人能够尝试音乐创作；也可能导致一部分人的工作被 AI 替代，尤其依赖简单创作和翻唱的艺人可能失去工作机会，例如有些唱 demo 的歌手已经被替代了。

"AI 对音乐人的冲击并不是直接的竞争，而是潜移默化的竞争。AI 音乐的普及可能会改变音乐人的职业发展方向。" 在范志昊看来，未来，音乐人可能更需要注重个人 IP 的经营和发展，而非仅仅依赖于网络歌曲的翻唱和创作。

此外，范志昊还提到了未来音乐产业的发展趋势。他表示，随着音乐产量的不断增加，每年人们能够听到的歌曲数量已经远远超过了他们的消化能力。AI 的出现进一步加剧了音乐市场的竞争，抢占了原有的音乐空间。这导致一些认真做曲库、做内容的音乐人可能会受到影响，他们的作品可能会因为 AI 的普及而被淹没在海量的音乐中。

对于 AI 音乐对传统市场的冲击问题，刘岩也表达了自己的看法。他认为，AI 音乐生成技术能够在短时间内产生大量歌曲，以目前能力和需求看，一年后，市场上 90% 的歌曲可能都是 AI 生成的了，传统意义上的 " 新歌 " 可能连 1% 的比例都占不到了，仅从数据上看，行业的格局一定会被打破。

" 黑盒 " 是小公司跟大厂竞争的壁垒

音乐大模型的发展正处于一个关键时期。继 Suno 之后，国内的科技公司也不甘落后，昆仑万维推出了 " 天工 SkyMusic"，发布的 9 首由 " 天工 SkyMusic" 生成的音乐作品，展示了从说唱到古风等多种风格的音乐创作能力，这些作品的时长从 10 秒到 51 秒不等。

一年前，刘岩和他的团队就敲下音乐大模型开发的第一行代码，决心布局该行业。在他看来，音乐大模型相较于文字和视频大模型，面临着更高的技术门槛。" 音乐和视频一样是一种长时序的技术形式，如果说视频可以抽成每一秒钟 24 帧影像的话，音乐则每一秒钟包含上万个采样点，且每个采样点之间的相关性强，这使得音乐成为最复杂的模态之一。"

刘岩进一步阐述道，当前市面上部分被冠以 " 音乐大模型 " 之名的产品，其实并未达到严格意义上大模型的标准。一些作品的生成依赖于音乐结构和规则的技术，或是通过将音乐转化为 MIDI 等符号语言再进入模型来实现，这种方式虽然能够产生近人类水平的音乐，但不能触及音乐的本质——对音乐情感、内涵及整体结构的理解与创造性表达，永远不会超越现有音乐的水平。

" 真正意义上的音乐大模型应当具备端到端的学习能力，训练数据直接来源于日常聆听的完整音乐作品而非翻译后的 MIDI，并能够从构思歌词、设计旋律、编排伴奏直至模拟人声演绎等全过程进行一体化的创作。遗憾的是，当前大多数模型仅在音乐创作的旋律和伴奏等某一个环节上取得进展，尚未实现全方位的音乐生成。" 刘岩说。

目前用户无法透视模型的内部逻辑，只能看到其外在表现。刘岩认为，AI 这一天然的 " 黑盒 " 效应，让音乐大模型出现了不少鱼目混珠的情况。然而，" 黑盒 " 效应也为中小企业和创业团队带来了独特的发展机遇。

范志昊早在半年前就开始集结团队，专注于研究音乐 AIGC 辅助生态。他认为，" 黑盒 " 是小公司跟大厂竞争的唯一的壁垒，因为互联网产品的运作逻辑可以轻易被剖析和模仿，而 AI 则不然，这就要求开发者投入更多的心血与专注。在他看来，这不是大厂有钱就可以做好的。" 除非他一下子砸很多钱进去，但这又不是一个潜力特别大的市场。"

与语言大模型广泛应用于多元场景不同，音乐大模型从诞生之初便瞄准了特定的应用场景——降低音乐创作门槛，使以往专业音乐人才方能完成的工作，如今普通人借助大模型只需通过自然语言描述就能得到高质量的歌曲作品。

这一点使音乐大模型在特定领網域具有一定的市场潜力。刘岩认为：" 语言大模型我们很难超越，但音乐大模型我们可以把它做成全世界最好的模型。"

记者| 毕媛媛宋美璐

编辑|何小桃梁枭盖源源

校对 |段炼

｜每日经济新闻 nbdnews 原创文章｜

未经许可禁止转载、摘编、复制及镜像等使用

每日经济新闻