一曲封神！“音乐界Sora”Udio发布，效果直逼人类唱歌

今天小编分享的互联网经验：一曲封神！“音乐界Sora”Udio发布，效果直逼人类唱歌，欢迎阅读。

本周一，钛媒体 AGI 发布了 " 比 Suno 好 10 倍的 AI 音乐应用 " 消息，引发关注，甚至当时名字都还没得到正式确认。

如今，这款 AI 音乐产品终于被官宣了。

北京时间 4 月 11 日凌晨，全新的音乐生成应用 Udio 正式亮相，输出效果超越热门的 Suno，尤其是中文歌曲甚至直逼人类唱歌水平，堪称 " 录音室 " 级别，成为 Suno 劲敌，引发广泛关注。

目前，Udio 已经开始公测，用户可免费体验，每月可生成 1200 首作品。体验地址：https://www.udio.com/

据了解，Udio 采用先进的 AI 技术，通过简单的文字输入，就能生成各类风格的原创音乐作品。从抒情的福音音乐，到沧桑的蓝调，再到梦幻的流行电音，应有尽有。同时，Udio 还支持多种语言，用户可以创作出日语流行、俄罗斯流行、拉丁节奏等多元化的音乐作品。

就目前体验来看，Udio 的优势和特点包括两部分：体验比 Suno 好，更好的可扩展性。

其中，Udio 生成的音乐效果比前段时间大火的 Suno 有了质的提升；同时，可扩展性方面，用户不仅可以指定音乐的引子和尾声，还能以此为基础向前向后延伸，生成更长的音乐作品。完成创作后，只需点击 " 发布 "，作品就能与 Udio 社区的其他创作者们分享交流。

注册 Udio 帐户后，任何人都可以通过输入文本提示来创建曲目，其中可以包括歌词、故事方向和音乐流派标签。然后，Udio 分两个阶段处理该任务。首先，它利用类似于 ChatGPT 的大型语言模型 ( LLM ) 根据提供的提示生成歌词（如果需要）。接下来，它使用 Udio 没有公开的方法合成音乐，但这很可能是一种扩散模型，类似于 Stability AI 的 Stable Audio。

根据给定的提示，Udio 的 AI 模型会生成两个不同的歌曲片段供您选择。然后，您可以将歌曲发布到 Udio 社区，下载音频或视频檔案以在其他平台上共享，或直接在社交媒体上共享。其他 Udio 用户也可以重新混音或在现有歌曲的基础上进行创作。Udio 的服务条款规定，该公司对音乐世代不享有任何权利，并且它们可以用于商业目的。

企业层面，公开消息显示，Udio 的创始团队来自谷歌 DeepMind 等顶尖 AI 机构，团队在音乐和技术领網域均有深厚积淀。他们的目标是让 Udio 成为一款真正改变游戏规则的音乐创作工具，不仅面向专业音乐人，也希望让广大非音乐人也能轻松参与到音乐创作当中。

尽管 Udio 团队尚未透露其模型或训练数据的具体细节（其中可能充满了受版权保护的材料），但它告诉《tom 指南》，该系统具有内置措施来识别和阻止与特定的艺术家，确保生成的音乐保持原创。

当前，Suno、Udio 也让一些人类音乐家感到害怕。上周，超过 200 名音乐艺术家签署了一封公开抗议信，批评 Udio 这种由 AI 驱动的音乐生成衣务，影响音乐者创作。一位 Reddit 评论者在有关 Udio 的帖子中写道：" 说实话，这太令人沮丧了。" " 我仍然普遍乐观地认为，从长远来看，音乐在某种程度上会很好。但是，为什么要这样做？为什么要自动化艺术？"

也有分析称，就像 Sora 一样，Udio 生成的音乐和 Spotify 上听到的歌曲几乎没有任何区别。而且根据他的感受，" 要比 Suno 好 10 倍。"

早前钛媒体注意到相关报道，Udio 称为 xgboost 技术，后来被证实后者是一种数据集技术，它采用开源数据集 Medley-solos-DB，最初发布时间为 2019 年 9 月 29 日。该研究参与方包括纽约大学、加州大学伯克利分校、Spotify 等机构人员。另据论文显示，山东理工大学工程与信息技术系 Yijie Liu,Yanfang Yin，Qigang Zhu，Wenzhuo Cui 等人采用利用 XGBoost 结合特征融合进行乐器识别。

据报道，Udio 团队正在快速迭代优化，计划未来陆续推出更长音频、更高音质，以及更强大的可控性等众多新功能。

针对 AI 音乐生成生态，Suno 首席执行官 Mikey Shulman 在红杉资本活动上表示，这是一个非常酷的工具，它正在扩大用户，从而让我们对倾听创造性音乐的品味能够引起更多人的共鸣。未来 suno 会有大量的玩家，占比或超过 80%。

（本文首发钛媒体 App，作者｜林志佳）