今天小编分享的互联网经验:一曲封神!“音乐界Sora”Udio发布,效果直逼人类唱歌,欢迎阅读。
本周一,钛媒体 AGI 发布了 " 比 Suno 好 10 倍的 AI 音乐应用 " 消息,引发关注,甚至当时名字都还没得到正式确认。
如今,这款 AI 音乐产品终于被官宣了。
北京时间 4 月 11 日凌晨,全新的音乐生成应用 Udio 正式亮相,输出效果超越热门的 Suno,尤其是中文歌曲甚至直逼人类唱歌水平,堪称 " 录音室 " 级别,成为 Suno 劲敌,引发广泛关注。
目前,Udio 已经开始公测,用户可免费体验,每月可生成 1200 首作品。体验地址:https://www.udio.com/
据了解,Udio 采用先进的 AI 技术,通过简单的文字输入,就能生成各类风格的原创音乐作品。从抒情的福音音乐,到沧桑的蓝调,再到梦幻的流行电音,应有尽有。同时,Udio 还支持多种语言,用户可以创作出日语流行、俄罗斯流行、拉丁节奏等多元化的音乐作品。
就目前体验来看,Udio 的优势和特点包括两部分:体验比 Suno 好,更好的可扩展性。
其中,Udio 生成的音乐效果比前段时间大火的 Suno 有了质的提升;同时,可扩展性方面,用户不仅可以指定音乐的引子和尾声,还能以此为基础向前向后延伸,生成更长的音乐作品。完成创作后,只需点击 " 发布 ",作品就能与 Udio 社区的其他创作者们分享交流。
注册 Udio 帐户后,任何人都可以通过输入文本提示来创建曲目,其中可以包括歌词、故事方向和音乐流派标签。然后,Udio 分两个阶段处理该任务。首先,它利用类似于 ChatGPT 的大型语言模型 ( LLM ) 根据提供的提示生成歌词(如果需要)。接下来,它使用 Udio 没有公开的方法合成音乐,但这很可能是一种扩散模型,类似于 Stability AI 的 Stable Audio。
根据给定的提示,Udio 的 AI 模型会生成两个不同的歌曲片段供您选择。然后,您可以将歌曲发布到 Udio 社区,下载音频或视频檔案以在其他平台上共享,或直接在社交媒体上共享。其他 Udio 用户也可以重新混音或在现有歌曲的基础上进行创作。Udio 的服务条款规定,该公司对音乐世代不享有任何权利,并且它们可以用于商业目的。
企业层面,公开消息显示,Udio 的创始团队来自谷歌 DeepMind 等顶尖 AI 机构,团队在音乐和技术领網域均有深厚积淀。他们的目标是让 Udio 成为一款真正改变游戏规则的音乐创作工具,不仅面向专业音乐人,也希望让广大非音乐人也能轻松参与到音乐创作当中。
尽管 Udio 团队尚未透露其模型或训练数据的具体细节(其中可能充满了受版权保护的材料),但它告诉《tom 指南》,该系统具有内置措施来识别和阻止与特定的艺术家,确保生成的音乐保持原创。
当前,Suno、Udio 也让一些人类音乐家感到害怕。上周,超过 200 名音乐艺术家签署了一封公开抗议信,批评 Udio 这种由 AI 驱动的音乐生成衣务,影响音乐者创作。一位 Reddit 评论者在有关 Udio 的帖子中写道:" 说实话,这太令人沮丧了。" " 我仍然普遍乐观地认为,从长远来看,音乐在某种程度上会很好。但是,为什么要这样做?为什么要自动化艺术?"
也有分析称,就像 Sora 一样,Udio 生成的音乐和 Spotify 上听到的歌曲几乎没有任何区别。而且根据他的感受," 要比 Suno 好 10 倍。"
早前钛媒体注意到相关报道,Udio 称为 xgboost 技术,后来被证实后者是一种数据集技术,它采用开源数据集 Medley-solos-DB,最初发布时间为 2019 年 9 月 29 日。该研究参与方包括纽约大学、加州大学伯克利分校、Spotify 等机构人员。另据论文显示,山东理工大学工程与信息技术系 Yijie Liu,Yanfang Yin,Qigang Zhu,Wenzhuo Cui 等人采用利用 XGBoost 结合特征融合进行乐器识别。
据报道,Udio 团队正在快速迭代优化,计划未来陆续推出更长音频、更高音质,以及更强大的可控性等众多新功能。
针对 AI 音乐生成生态,Suno 首席执行官 Mikey Shulman 在红杉资本活动上表示,这是一个非常酷的工具,它正在扩大用户,从而让我们对倾听创造性音乐的品味能够引起更多人的共鸣。未来 suno 会有大量的玩家,占比或超过 80%。
(本文首发钛媒体 App,作者|林志佳)