谷歌發布音樂AI工具MusicFX：一句話就能生成一首音樂

今天小編分享的互聯網經驗：谷歌發布音樂AI工具MusicFX：一句話就能生成一首音樂，歡迎閲讀。

谷歌繼續向音樂領網域發起挑戰，人人都能作曲的時代似乎又近了一步。

12 月 14 日，谷歌推出 AI 音樂創作工具 "MusicFX"，僅需幾句話，用户即可生成原創的音樂作品。

谷歌在介紹中指出，這一名為 "MusicFX" 的創作工具結合了谷歌此前發布的 MusicLM 模型和DeepMind 的水印技術 SynthID，以便在事後識别出它們是否由 AI 制作而成，一定程度上可以解決創作人對于版權問題的擔憂。

分析認為，MusicFX 的出現也将成為 AI 領網域的一個重要裏程碑，為音樂家、制作人和音樂愛好者開辟了嘗試和創作多種音樂的新可能性：

MusicFX 為音樂創作者提供了豐富的音效和聲音素材，用户可以創作各種類型的音樂，同時支持調整音調、節奏和音量，還可以添加混響、回聲等效果。無論是想要營造舒緩的氛圍還是冒險緊張的氛圍，MusicFX 都可以滿足。

MusicFX 當前仍需要通過谷歌一個 AI 實驗性產品網站（AI Test Kitchen）進入，這一平台的建立是為了讓用户在盡早體驗其最新的 AI 技術的同時，也能提供早期反饋，這種合作方法能幫助谷歌完善技術，并遵守道德标準。

媒體分析認為，MusicFX 的發布不僅僅将為音樂生成提供全新的工具，也代表了 AI 發展過程中的趨勢，用户在幫助企業完善和塑造人工智能方面的作用變得越來越重要，通過在早期階段讓用户參與進來，谷歌不僅增強了技術，還主動解決了潛在的道德問題。

此外，MusicFX 的出現可能會降低音樂創作的門檻，讓更多沒有經過專業音樂培訓的愛好者們參與進來。

但 MusicFX 的出現并非沒有争議，有觀點認為，如何解決人工智能生成的内容對版權、所有權和音樂原創性的影響還沒有答案，谷歌決定在 AI 生成音樂中使用水印，表明了他們對這些問題的關注，但這一問題并沒有解決，AI 生成的内容是否屬于原創？

對于接下來的計劃，谷歌表示，他們會繼續根據用户意見繼續完善 MusicFX，MusicFX 有可能重新定義音樂創作及與音樂互動的方式，AI Test Kitchen 可能會成為未來 AI 發展的典範，這種方法可以推動人工智能發展進入負責任的新時代，在這個時代，技術與社會價值觀和規範齊頭并進。

MusicLM 有多強大？

在今年年初，谷歌 MusicLM 橫空出世，可以直接将文字、影像自動生成音樂，并且曲風多樣，凡是想聽的音樂，基本都能自動生成。

MusicLM 是一個以文本為條件的音頻生成模型，可以從文本描述中生成高保真的音樂。該模型采用層次化的序列到序列的方法，這使它能夠生成幾分鍾内一致的音樂。

MusicLM 使用三種模型來提取作為條件自回歸音樂生成輸入的音頻表示。SoundStream，w2v-BERT 和 MuLan。

其中，AudioLM 模型可視作 MusicLM 的前身，MusicLM 就是利用了 AudioLM 的多階段自回歸建模作為生成條件，可以通過文本描述，以 24kHz 的頻率生成音樂，并在幾分鍾内保持這個頻率。

相較而言，MusicLM 的訓練數據更多。研究團隊引入了首個專門為文本 - 音樂生成任務評估數據 MusicCaps 來解決任務缺乏評估數據的問題。MusicCaps 由專業人士共建，涵蓋 5500 個音樂 - 文本對。基于此，谷歌用 280000 小時的音樂數據集訓練出了 MusicLM。

但媒體此前分析稱，MusicLM 肯定不是完美無缺的，或者説離完美仍有相當的距離。一些樣本還有質量問題，而且雖然 MusicLM 在技術上可以生成人聲，包括完成和聲，但還有很多地方需要改進。大多數 " 歌詞 " 也是蹩腳的英語或純粹的胡言亂語，然後由合成的聲音演唱，聽起來像是奇怪的 " 混合物 "。

AI 生成音樂的版權風險：到底算不算原創？

AI 跟人一樣，偶爾會偷懶直接抄襲這些素材，版權該如何保護？

谷歌的研究員在一次實驗中發現，該系統生成的音樂中約有 1% 是直接復制自其訓練的歌曲。這個問題足以讓研究人員不願意過早發布 MusicLM。另外，用搜集來的素材供 AI 學習，這本身是否就已經涉及到侵犯版權？

實際上目前已經有了相關案例。2020 年，美國説唱歌手 Jay-Z 的唱片公司對 YouTube 頻道 Vocal Synthesis 提出版權警告，理由是它使用 AI 創作了 Jay-Z 翻唱比利 · 喬爾（Billy Joel）的 "We Didn't Start the Fire" 等歌曲。

美國音樂出版商協會的埃裏克 · 桑雷 ( Eric Sunray ) 撰寫的一份白皮書認為，像 MusicLM 這樣的 AI 音樂生成器通過 "從訓練數據庫中吸收作品中連貫的音頻，侵犯了美國版權法的復制權"。

進一步説，AI 生成的音樂雖然是 " 原創 "，但往往像不同音樂人作品的雜糅，也就是説有洗稿甚至是山寨的嫌疑。

因而此次谷歌運用DeepMind 的水印技術 SynthID 生成的 ID 便是對版權問題的重視，谷歌表示，生成的所有歌曲都帶有數字水印，人的耳朵聽不見也不會影響音樂的效果。主要通過音頻波轉換為二維可視化來實現。即便數字水印遭受了添加噪聲、音質壓縮、音頻調速等破壞性操作，仍然可以檢測到歌曲中的水印。

但有分析師指出，盡管谷歌加了水印證明該音樂作品是 AI 創作而成卻依舊沒能解決根本問題，由 AI 系統生成的音樂到底算不算原創作品？可以和 " 人造音樂 " 同台競技嗎？

伴随着關注與争議，或許在不遠的未來，這些問題都将有清晰的答案。