今天小编分享的互联网经验:拒绝机械感!30秒生成商用级歌曲,「歌歌AI」完成新一轮融资,欢迎阅读。
作者 | 邓咏仪
编辑 | 苏建勋
在键盘上敲出短短一行命令:请给我写一首充满喜悦 / 悲伤 / 的歌,等待片刻,一首完整的、甚至带有人声、歌词的 " 歌曲 " 就已经完成——进入 2024 年,Suno 等产品带来的热度还没散去,如今国内已经有不少瞄准 AI 音乐领網域的产品,如雨后春笋般出现。
36 氪此前报道的「歌歌 AI」是其中的一员。这家公司近期获得新一轮数百万元投资,投资方为锡创投。
音律闪动成立于 2022 年 8 月,瞄准 AI 生成音乐方向,其主要产品为「歌歌 AI」app。
音律闪动 CTO 王枢沛告诉 36 氪,音律闪动的团队为来自互联网大厂的技术专家,以及在音乐产业中的资深制作人。在生成式 AI 出现前,团队就已经有通过 AI 技术来探究在音乐领網域中的应用——早在 2016 年,团队成员就开始开发 AI 写歌产品,并有项目创业经验。
真正促使团队创业的,是在 2022 年左右看到以 Transformer 架构为主的技术突破," 我们认为,这个技术能够真正改变音乐产业。" 王枢沛表示。因此,从 2023 年成立开始,音律闪动就开始从底层模型开始训练,在经历 2023 年的小程式版试运营后,在 4 月完成了独立的 app 开发,近期刚刚上线。
" 让所有人都成为音乐人 " 是歌歌 AI 的目标,从产品形态来看,歌歌 AI 是一款面向所有爱音乐的用户的 AI 写歌軟體。使用方法也非常 " 傻瓜式 ",容易上手——
用户进入 app 界面,即可看到三种模式:自由模式、惊喜模式、纯音乐模式,通过对话和 "AI 制作人 " 沟通,生成自己想要的音乐。
在自由模式下,用户可以输入简单一句话的 Prompt,让 AI 生成拥有具体主题、完整旋律和人声的歌曲。
比如,36 氪就以自由和勇气为主题,请 AI 帮忙写一首歌曲,不到 1 分钟内,歌歌 AI 就生成了一首时长为 2 分 20 秒的《希望之歌》,并且带有完整填词。
来源:歌歌 AI
整首歌拥有比较和谐的旋律和编曲,并且旋律变换也相对丰富。不过在填词上,还是有个别词句会不通,或者断句尚有问题,但用户可以通过手动调整来完成歌词修改。哪怕不懂乐理,还可以通过简单点选操作,来调整每个字的音高。
" 除了修改歌词和旋律,还有包括 AI 演唱的这个声音,用户也可以在选择付费后进行修改,替换成自己的声音。" 王枢沛表示。
对于要求更高的用户,歌歌 AI 还提供了更专业的 " 惊喜模式 ",能够生成满足商业级场景的歌曲。
在这一模式下,用户能够对音乐风格、具体的配器提出更多要求。AI 能够生成更完整的旋律,会有完整的主歌、副歌、桥梁等结构。
并且,人声的变换也更加丰富——无论是颤音、旋律的高低变换过度都更自然,听起来更接近自然人声演唱的状态,"AI 感 " 减少很多。
在所有模式下,歌歌 AI 都基于一定的免费积分,用户可以消耗积分以生成音乐。一旦用户对 AI 生成的 demo 比较满意,希望 " 扩写 ",就能在对话框里和 "AI 制作人 " 对话,以修改风格等等,同时付费来让 AI 生成更完整的歌曲。目前的三档付费价格分别为包月 18 元、48 元、98 元。
音律闪动 COO 王枢沛对 36 氪表示,惊喜模式使用的是端到端的大模型技术,为了保证音乐效果质量更高,暂时不支持具体的歌词和人声修改,这也是与市面上大部分 AI 生成音乐产品相比,歌歌 AI 的优势所在。
"AI 文字、图片生成现在都有开源框架,技术层面是比较开放的,但从 AI 生成音乐赛道整体来看,技术路线是比较封闭的,各家都有自己的训练技术差异。" 王枢沛表示。
总体来说,上一代将 AI 技术应用到音乐中的尝试,普遍能做到的程度是,先生成 MIDI 音乐,即简单将旋律数字化,形成较为单调、机器感的单旋律。
在上一代 AI 技术逐步成熟之后,AI 生成音乐进入到了用小模型、专家系统训练的阶段。简单而言,一种方式是通过人工标注大量的音乐片段,分 " 科目 " 训练模型,比如旋律、歌词、编曲等,都有单独的小模型。等到这些模型能够产出比较成熟的片段之后,再 " 拼接 " 起来,形成完整旋律。但这种方法的缺点是,由于各个元素是割裂的,拼接之后的机器感难以消除,也很难达到和谐的效果。
而从 AI 生成音乐的训练上,为了保证歌曲能做到质量更高、更自然,歌歌 AI 对标海外产品,选择了端到端的大模型路线,即音乐数据不需要经过特别细致的处理,就输入到模型中进行训练。这样能够生成比较完整、统一的旋律。
歌歌 AI 的另一个亮点在于,并不局限于 " 用 AI 写歌 " 的定位上,而是希望能够基于生成式 AI 技术,真正让音乐创作、分发方式的链条发生根本性变化。
音律闪动团队认为,目前音乐平台的推荐音乐内容千篇一律,并且推荐内容页不真正切合需求。" 全国现在每天大概产生新产生约十几万首歌,但生成式 AI 技术能够让这个数字变成成百上千万。" 王枢沛表示,AI 技术的普及,也会让人们生成更个性化的音乐,成为打破现在音乐巨头垄断的机遇。
除了歌曲生成等基本功能外,歌歌 AI 也拓展了多个板块,涉及生成和分发。
比如,用户通过 AI 模型录入自己声音并生成歌曲,可选择不同风格和曲风,甚至发行全网。
歌歌 AI 近期也正在与国内主要音乐平台洽谈对接,以后希望做到的效果是,用户生成音乐后可以做到自动修音、AI 混音处理,最后——全网一键发行,用户能够通过自己生成的 AI 音乐,获得版税。
并且,和短视频的结合也是重要的传播节点。当前,歌歌 AI 已经能够支持下载带有 AI 音乐的小视频,未来也会拓展到 AI 生成视频、直播场景。
本轮融资后,歌歌 AI 团队也会继续加速产品迭代,并且投入到市场增长方面。
团队方面,目前歌歌 AI 团队不到 10 人,CEO 龙勇拥有 20 年音乐制作经验,曾是中国好声音、中国有嘻哈、TME 官方合作伙伴,有丰富制作运营音乐和版权经验;COO 王枢沛是浙江大学工学 / 美国伯克利音乐学院音乐制作和吉他表演双专业学士;CTO 张文铂为「我要写歌」APP 创始人。