今天小编分享的互联网经验:在AI领網域更进一步!Meta推出新款音频和音乐生成式AI工具AudioCraft,欢迎阅读。
8 月 2 日周三,Meta 推出一款新的面向音频和音乐的名为 AudioCraft 的生成式 AI 工具,该工具可以帮助用户根据文本提示创作音乐和音频。
这款 AI 工具将 AudioGen、EnCodec 和 MusicGen 三种模型或技术融为一体,可用文本内容生成高质量、近乎真人创作的音频和音乐。
其中,MusicGen 接受过 Meta 拥有的和特别授权的音乐训练,可以从文本提示生成音乐;AudioGen 接受过公共音效训练,可从文本提示生成音频,比如模拟狗叫或脚步声;再加上 EnCodec 编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。
Meta 称,AudioCraft 系列模型能够产生具有长期一致性的高质量音频,并且易于使用:
与该领網域之前的工作相比,通过 AudioCraft,我们简化了音频生成模型的整体设计——为人们提供了使用 Meta 在过去几年中开发的现有模型的完整方法,同时也使他们能够突破极限 并开发自己的模型。
Meta 指出,AudioCraft 适用于音乐、声音、音频檔案的压缩和生成。因为它很容易构建和重用,所以想要构建更好的声音生成器、压缩算法或音乐生成器的人可以在同一个代码库中完成这一切,并在其他人所做的基础上进行构建。
Meta 称:
拥有坚实的开源基础将促进创新并补充我们未来制作和聆听音频和音乐的方式。通过更多的控制,我们认为 MusicGen 可以变成一种新型乐器——就像合成器首次出现时一样。
所有 Facebook 用户都可以安装 AudioCraft,Meta 特别邀请研究人员和音乐专业人士使用这一工具:
我们将 AudioCraft 系列模型视为音乐家和声音设计师提供灵感的工具,帮助人们快速集思广益并以新的方式迭代他们的作品。 我们迫不及待地想看看人们用 Audiocraft 创造了什么。
Meta 于 2022 年 10 月推出了其第一个版本的 EnCodec,作为一种 AI 工具,用于在不损失音质的情况下压缩和解压缩音频檔案,以便用户快速轻松地共享音频文档。其目的是提高所有音频檔案的质量,而不仅仅是音乐檔案。当时,它特别针对提高语音通话和语音消息的质量,特别是在网络连接不佳等不利情况下。此后该模型不断发展,如今与 AudioGen 和 SoundGen 一起推出,作为一种工具,帮助合成声音和音乐在实际播放时显得更为真实。
虽然一些艺术家已经采用人工智能生成工具来获得更多创造力,但其他艺术家却对侵犯版权持批评态度。