今天小编分享的科技经验:看懵专业音乐人,Udio让AI音乐进入「以假乱真」新境界?,欢迎阅读。
上个月,文生音频的新星 Suno 用 AI 音乐让全球音乐圈看到了 AI 的力量,万万没想到才过去一个月,Suno 文生音频头把交椅还没坐稳就迎来了挑战者,一个被众多体验者称之为 " 音乐版 Sora" 的 AI 大模型—— Udio。
Udio 与 Suno 类似,用户只需输入简单的提示词,比如音乐风格、音乐流派、歌词内容、音色等,等待几秒就能快速生成带有歌词和节拍的音乐片段。如果说 Suno 团队的初衷是降低编曲门槛,让更多普通人深入接触音乐创作,那么 Udio 的野心显然要来得更大,许多音乐人体验后表示 Udio 在器乐和人声的还原度上几乎达到了以假乱真的地步,跳脱出了过去合成音乐 "音与音合成粘连 " 的问题。
短短 4 个半月时间,音乐圈就被 AI 音乐 " 颠覆 " 了两次。作为实际体验 Suno 创作的一员,雷科技对 Udio 的真实水平十分好奇,究竟它是否真的有网上宣传的实力,我们一试便知。
点开Udio 的官网,给人的第一感觉像是某个听歌軟體。推荐优秀作品吸引了小雷的注意,反而置顶的创作栏在一众五颜六色的圖示中显得有些不起眼,很容易让人忽视。Suno 页面布局相对合理,起码能让第一次使用的用户快速找到创作入口。
图源:Udio
图源:Suno
点开创作页面,Udio 可以自由输入关键词生成音乐,也可以点击输入框右边的骰子摇出随机关键词,这个设定对缺乏灵感的用户是个不错的功能,分分钟能摇出好听的歌曲。Udio 支持自选歌曲风格,也可以输入现有的音乐家名称让 AI 判断歌曲流派标签。
不仅如此,Udio 创作栏提供推荐关键词,其中包括内容、歌曲流派等,能节省用户自行查阅的时间。同样的,Udio 支持用户自定义歌曲的歌词,只需要在自定义歌词选项卡中填写文本就可以,如果你实在想不出,也可以让 AI 自动生成歌词。
那既然我们想对比 Udio 和 Suno 生成的音乐效果,直接来场相同关键词的比试是最直观的。对此,小雷随机摇了个关键词 "a song about finding solace in nature, heavy metal",翻译过来就是 " 一首寻求大自然抚慰的重金属音乐 "。
在生成阶段,两者表现就产生了差距。同样是生成两首音乐,Udio 花了 35 秒生成出时长 33 秒的作品,而 Suno 只用了不到 10 秒就生成了 1 分 48 秒的作品,Suno 的生成效率方面明显要比 Udio 更高。
歌词方面,小雷感觉两者半斤八两,AI 生成歌词基本都是没有营养的词语拼凑,看来想要收获高质量的 AI 音乐,还得用户自定义歌词。补充一句 Udio 虽然单次生成只有 33 秒,但用户是可以对成品进行拓展的,并且它还能点击 " 混音 " 微调已生成作品。
最后是比拼的重头戏,为了测试的客观性,小雷去除了歌词、混音等人为因素,为的就是展示 Suno 和 Udio 最原始的硬实力,让我们一起来听听两个 AI 生成模型的音乐效果。
从个人观感来评价,小雷认为 Udio 并没有展现出网上所说比 Suno 强两倍的实力。相反,小雷认为 Suno 生成的音乐更符合我的审美,无论是生成效率,还是生成效果,Suno 都要更胜一筹。不过,评价是主观的,如果大家有不同的观点,欢迎在评论区发表你的看法。
单次测试结果不能代表什么,小雷随后试听了多首 Udio 首页的推荐音乐,发现原来不是 Udio 不行,只是小雷不会用。Udio 优秀音乐的人声表现异常亮眼,无论是什么歌曲流派,Udio 生成音乐的音色更细腻,演唱细节也更丰富,完全没有 Suno 那种合成电音的感觉,在金字塔作品的比拼中,个人认为 Udio 完胜。
但 Udio 的缺点也十分明显,生成音乐的效率和完整度不如 Suno,尽管音乐可以通过后续拓展延长时长,但多次操作带来的出错率显然更高,音乐歌词和风格偶尔也会出现断层。当然,Udio 目前仍处于 Beta 测试阶段,后续或许会继续优化使用体验。
据悉,Udio 团队去年 12 月才正式成立,由一批前谷歌 Deepmind 工程师共同打造。有趣的是,谷歌 DeepMind 去年 11 月发布了音乐生成模型 Lyria,Udio 团队的 4 位联合创始人就在 Lyria 的贡献者名单上,很难不让人猜想 Lyria 与 Udio 可能存在千丝万缕的关系。
不管是否存在换皮重生的可能,总之 Udio 和 Suno 一样,已经掀起了 AI 音乐圈的又一轮狂欢。然而,AI 音乐与传统音乐圈即对立又统一的复杂关系,令不少音乐人产生了抵触情绪。4 月 2 日,包括 Billie Eilish 和 Katy Perry 等多位知名歌手在内,有超过 200 个国际乐坛音乐人联合发表了公开信,呼吁数字音乐开发商停止使用 AI 来侵犯和贬低人类艺术家的权利。
公开信主要内容片段,图源:艺术家版权联盟网站
音乐人联合抵制 AI 音乐,代表着音乐圈中某部分群体的看法,但不同领網域对 AI 音乐有不一样的看法,音乐圈之外,已经有人开始探索 AI 音乐商业化的可能性了。
日前,一款名为 YeloMelo 的 AI 音乐小程式通过了工信部备案,支持用户上传自己创作的 AI 音乐。与 Suno、Udio 不同,YeloMelo 提供方便用户交流分享的社区平台,在雷科技看来,背后的商业逻辑与国内曾经盛极一时的音乐社区十分相似,AI 音乐生成模型让没有任何乐理知识的普通人也能创作自己的音乐,随着创作人和音乐数量的增加,大众需要交流分享的平台,这批用户带来的流量是 AI 音乐未来商业化的基础。
除了流量红利外,AI 音乐在影视和游戏领網域也有不错的商业化潜力。音乐作为影响玩家情绪的重要渠道之一,配乐对游戏的重要性不言而喻,游戏大厂虽然拥有自己的音乐设计团队,但如果能通过 AI 音乐节省人力成本,显然是个不错的方案。同理,小团队也能运用 AI 生成替代外包公司。
AI 在影视领網域的进程则更为迅速,印度泰卢固语喜剧《Save the Tigers》第二季大结局片尾的演职员表中,音乐团队歌词一栏明确标注了 ChatGPT,算是 AI 聊天机器人首次公开用于音乐创作。ChatGPT 都助力影视剧打造音乐,专门用于生成音乐的 Suno、Udio 自然能做得更好。
图源:Save the Tigers
AI 音乐商业化路径目前并不明确,但已经开始对各领網域产生不一样的影响,即便受到部分群体的抵制,相信也很难阻挡 AI 音乐的全面崛起。相比起抵制,AI 音乐当前最大的问题仍是许多 AIGC 内容无法解决的版权问题。
众所周知,训练数据是 AI 大模型成长的必需养分,好的生成效果取决于更多的训练数据和更大参数的模型。Suno 和 Udio 能在一众 AI 生成音乐模型中脱颖而出,除了模型上的进步外,绝对离不开数量庞大的训练数据。
Suno 团队至今未公布 Suno 模型是用什么数据训练而成,如果他们在未经允许的情况下,使用了有版权保护的作品,那么他们将面临起诉,而用户借助 Suno 生成的音乐作品也有着同样的风险。
而 Udio 官方同样没有透露数据来源,但他们表示产品有版权保护措施,模型配有自动过滤器,确保在平台上创作的音乐都是原创的,至于可信度几何就见仁见智了。
过去 AI 生成文字、图片同样面临着各种版权问题,不过由于版权界定模糊等问题,仅出现少数明确判定侵权的案例,多数还是游离在法律边缘的灰色地带。音乐创作对比图文,版权复杂程度更高,从编曲到演唱者,再到拥有实际版权的唱片公司,层层递进的版权意识可能会让 AI 音乐面对比图文更高的被维权风险。
尽管两家目前都还没有传出相关风险,但版权问题不解决始终是悬在头顶上的一把利剑,随时反噬。如果 Suno、Udio 们无法从根本上解决版权风险,那么 AI 音乐商业化或许只是一个空想。
北京国际汽车展览会(北京车展)将于 4 月 25 日 -5 月 4 日隆重举行,本届车展以 " 新时代 新汽车 " 为主题,是 " 汽车从电动化走向智能化 " 的风向标。
届时,包括比亚迪、小米、AITO 问界、小鹏、蔚来、理想、极氪、极越、长安深蓝等头部品牌将悉数登场,除新车型 " 大比武 " 外,自动驾驶技术的推进、智能座舱的演化和 AI 大模型与汽车的结合,都将是重要看点。雷科技旗下 " 关注电动车,更懂智能化 " 的账号电车通将派出报道团前往北京现场,进行一线专业报道,敬请关注。
>