今天小編分享的互聯網經驗:在AI領網域更進一步!Meta推出新款音頻和音樂生成式AI工具AudioCraft,歡迎閱讀。
8 月 2 日周三,Meta 推出一款新的面向音頻和音樂的名為 AudioCraft 的生成式 AI 工具,該工具可以幫助用戶根據文本提示創作音樂和音頻。
這款 AI 工具将 AudioGen、EnCodec 和 MusicGen 三種模型或技術融為一體,可用文本内容生成高質量、近乎真人創作的音頻和音樂。
其中,MusicGen 接受過 Meta 擁有的和特别授權的音樂訓練,可以從文本提示生成音樂;AudioGen 接受過公共音效訓練,可從文本提示生成音頻,比如模拟狗叫或腳步聲;再加上 EnCodec 編解碼器的改進版本,用戶可以更高效率地生成更高質量的音樂。
Meta 稱,AudioCraft 系列模型能夠產生具有長期一致性的高質量音頻,并且易于使用:
與該領網域之前的工作相比,通過 AudioCraft,我們簡化了音頻生成模型的整體設計——為人們提供了使用 Meta 在過去幾年中開發的現有模型的完整方法,同時也使他們能夠突破極限 并開發自己的模型。
Meta 指出,AudioCraft 适用于音樂、聲音、音頻檔案的壓縮和生成。因為它很容易構建和重用,所以想要構建更好的聲音生成器、壓縮算法或音樂生成器的人可以在同一個代碼庫中完成這一切,并在其他人所做的基礎上進行構建。
Meta 稱:
擁有堅實的開源基礎将促進創新并補充我們未來制作和聆聽音頻和音樂的方式。通過更多的控制,我們認為 MusicGen 可以變成一種新型樂器——就像合成器首次出現時一樣。
所有 Facebook 用戶都可以安裝 AudioCraft,Meta 特别邀請研究人員和音樂專業人士使用這一工具:
我們将 AudioCraft 系列模型視為音樂家和聲音設計師提供靈感的工具,幫助人們快速集思廣益并以新的方式迭代他們的作品。 我們迫不及待地想看看人們用 Audiocraft 創造了什麼。
Meta 于 2022 年 10 月推出了其第一個版本的 EnCodec,作為一種 AI 工具,用于在不損失音質的情況下壓縮和解壓縮音頻檔案,以便用戶快速輕松地共享音頻文檔。其目的是提高所有音頻檔案的質量,而不僅僅是音樂檔案。當時,它特别針對提高語音通話和語音消息的質量,特别是在網絡連接不佳等不利情況下。此後該模型不斷發展,如今與 AudioGen 和 SoundGen 一起推出,作為一種工具,幫助合成聲音和音樂在實際播放時顯得更為真實。
雖然一些藝術家已經采用人工智能生成工具來獲得更多創造力,但其他藝術家卻對侵犯版權持批評态度。