谷歌发布音乐AI工具MusicFX：一句话就能生成一首音乐

今天小编分享的互联网经验：谷歌发布音乐AI工具MusicFX：一句话就能生成一首音乐，欢迎阅读。

谷歌继续向音乐领網域发起挑战，人人都能作曲的时代似乎又近了一步。

12 月 14 日，谷歌推出 AI 音乐创作工具 "MusicFX"，仅需几句话，用户即可生成原创的音乐作品。

谷歌在介绍中指出，这一名为 "MusicFX" 的创作工具结合了谷歌此前发布的 MusicLM 模型和DeepMind 的水印技术 SynthID，以便在事后识别出它们是否由 AI 制作而成，一定程度上可以解决创作人对于版权问题的担忧。

分析认为，MusicFX 的出现也将成为 AI 领網域的一个重要里程碑，为音乐家、制作人和音乐爱好者开辟了尝试和创作多种音乐的新可能性：

MusicFX 为音乐创作者提供了丰富的音效和声音素材，用户可以创作各种类型的音乐，同时支持调整音调、节奏和音量，还可以添加混响、回声等效果。无论是想要营造舒缓的氛围还是冒险紧张的氛围，MusicFX 都可以满足。

MusicFX 当前仍需要通过谷歌一个 AI 实验性产品网站（AI Test Kitchen）进入，这一平台的建立是为了让用户在尽早体验其最新的 AI 技术的同时，也能提供早期反馈，这种合作方法能帮助谷歌完善技术，并遵守道德标准。

媒体分析认为，MusicFX 的发布不仅仅将为音乐生成提供全新的工具，也代表了 AI 发展过程中的趋势，用户在帮助企业完善和塑造人工智能方面的作用变得越来越重要，通过在早期阶段让用户参与进来，谷歌不仅增强了技术，还主动解决了潜在的道德问题。

此外，MusicFX 的出现可能会降低音乐创作的门槛，让更多没有经过专业音乐培训的爱好者们参与进来。

但 MusicFX 的出现并非没有争议，有观点认为，如何解决人工智能生成的内容对版权、所有权和音乐原创性的影响还没有答案，谷歌决定在 AI 生成音乐中使用水印，表明了他们对这些问题的关注，但这一问题并没有解决，AI 生成的内容是否属于原创？

对于接下来的计划，谷歌表示，他们会继续根据用户意见继续完善 MusicFX，MusicFX 有可能重新定义音乐创作及与音乐互动的方式，AI Test Kitchen 可能会成为未来 AI 发展的典范，这种方法可以推动人工智能发展进入负责任的新时代，在这个时代，技术与社会价值观和规范齐头并进。

MusicLM 有多强大？

在今年年初，谷歌 MusicLM 横空出世，可以直接将文字、影像自动生成音乐，并且曲风多样，凡是想听的音乐，基本都能自动生成。

MusicLM 是一个以文本为条件的音频生成模型，可以从文本描述中生成高保真的音乐。该模型采用层次化的序列到序列的方法，这使它能够生成几分钟内一致的音乐。

MusicLM 使用三种模型来提取作为条件自回归音乐生成输入的音频表示。SoundStream，w2v-BERT 和 MuLan。

其中，AudioLM 模型可视作 MusicLM 的前身，MusicLM 就是利用了 AudioLM 的多阶段自回归建模作为生成条件，可以通过文本描述，以 24kHz 的频率生成音乐，并在几分钟内保持这个频率。

相较而言，MusicLM 的训练数据更多。研究团队引入了首个专门为文本 - 音乐生成任务评估数据 MusicCaps 来解决任务缺乏评估数据的问题。MusicCaps 由专业人士共建，涵盖 5500 个音乐 - 文本对。基于此，谷歌用 280000 小时的音乐数据集训练出了 MusicLM。

但媒体此前分析称，MusicLM 肯定不是完美无缺的，或者说离完美仍有相当的距离。一些样本还有质量问题，而且虽然 MusicLM 在技术上可以生成人声，包括完成和声，但还有很多地方需要改进。大多数 " 歌词 " 也是蹩脚的英语或纯粹的胡言乱语，然后由合成的声音演唱，听起来像是奇怪的 " 混合物 "。

AI 生成音乐的版权风险：到底算不算原创？

AI 跟人一样，偶尔会偷懒直接抄袭这些素材，版权该如何保护？

谷歌的研究员在一次实验中发现，该系统生成的音乐中约有 1% 是直接复制自其训练的歌曲。这个问题足以让研究人员不愿意过早发布 MusicLM。另外，用搜集来的素材供 AI 学习，这本身是否就已经涉及到侵犯版权？

实际上目前已经有了相关案例。2020 年，美国说唱歌手 Jay-Z 的唱片公司对 YouTube 频道 Vocal Synthesis 提出版权警告，理由是它使用 AI 创作了 Jay-Z 翻唱比利 · 乔尔（Billy Joel）的 "We Didn't Start the Fire" 等歌曲。

美国音乐出版商协会的埃里克 · 桑雷 ( Eric Sunray ) 撰写的一份白皮书认为，像 MusicLM 这样的 AI 音乐生成器通过 "从训练数据库中吸收作品中连贯的音频，侵犯了美国版权法的复制权"。

进一步说，AI 生成的音乐虽然是 " 原创 "，但往往像不同音乐人作品的杂糅，也就是说有洗稿甚至是山寨的嫌疑。

因而此次谷歌运用DeepMind 的水印技术 SynthID 生成的 ID 便是对版权问题的重视，谷歌表示，生成的所有歌曲都带有数字水印，人的耳朵听不见也不会影响音乐的效果。主要通过音频波转换为二维可视化来实现。即便数字水印遭受了添加噪声、音质压缩、音频调速等破坏性操作，仍然可以检测到歌曲中的水印。

但有分析师指出，尽管谷歌加了水印证明该音乐作品是 AI 创作而成却依旧没能解决根本问题，由 AI 系统生成的音乐到底算不算原创作品？可以和 " 人造音乐 " 同台竞技吗？

伴随着关注与争议，或许在不远的未来，这些问题都将有清晰的答案。