今天小編分享的互聯網經驗:谷歌發布音樂AI工具MusicFX:一句話就能生成一首音樂,歡迎閲讀。
谷歌繼續向音樂領網域發起挑戰,人人都能作曲的時代似乎又近了一步。
12 月 14 日,谷歌推出 AI 音樂創作工具 "MusicFX",僅需幾句話,用户即可生成原創的音樂作品。
谷歌在介紹中指出,這一名為 "MusicFX" 的創作工具結合了谷歌此前發布的 MusicLM 模型和DeepMind 的水印技術 SynthID,以便在事後識别出它們是否由 AI 制作而成,一定程度上可以解決創作人對于版權問題的擔憂。
分析認為,MusicFX 的出現也将成為 AI 領網域的一個重要裏程碑,為音樂家、制作人和音樂愛好者開辟了嘗試和創作多種音樂的新可能性:
MusicFX 為音樂創作者提供了豐富的音效和聲音素材,用户可以創作各種類型的音樂,同時支持調整音調、節奏和音量,還可以添加混響、回聲等效果。無論是想要營造舒緩的氛圍還是冒險緊張的氛圍,MusicFX 都可以滿足。
MusicFX 當前仍需要通過谷歌一個 AI 實驗性產品網站(AI Test Kitchen)進入,這一平台的建立是為了讓用户在盡早體驗其最新的 AI 技術的同時,也能提供早期反饋,這種合作方法能幫助谷歌完善技術,并遵守道德标準。
媒體分析認為,MusicFX 的發布不僅僅将為音樂生成提供全新的工具,也代表了 AI 發展過程中的趨勢,用户在幫助企業完善和塑造人工智能方面的作用變得越來越重要,通過在早期階段讓用户參與進來,谷歌不僅增強了技術,還主動解決了潛在的道德問題。
此外,MusicFX 的出現可能會降低音樂創作的門檻,讓更多沒有經過專業音樂培訓的愛好者們參與進來。
但 MusicFX 的出現并非沒有争議,有觀點認為,如何解決人工智能生成的内容對版權、所有權和音樂原創性的影響還沒有答案,谷歌決定在 AI 生成音樂中使用水印,表明了他們對這些問題的關注,但這一問題并沒有解決,AI 生成的内容是否屬于原創?
對于接下來的計劃,谷歌表示,他們會繼續根據用户意見繼續完善 MusicFX,MusicFX 有可能重新定義音樂創作及與音樂互動的方式,AI Test Kitchen 可能會成為未來 AI 發展的典範,這種方法可以推動人工智能發展進入負責任的新時代,在這個時代,技術與社會價值觀和規範齊頭并進。
MusicLM 有多強大?
在今年年初,谷歌 MusicLM 橫空出世,可以直接将文字、影像自動生成音樂,并且曲風多樣,凡是想聽的音樂,基本都能自動生成。
MusicLM 是一個以文本為條件的音頻生成模型,可以從文本描述中生成高保真的音樂。該模型采用層次化的序列到序列的方法,這使它能夠生成幾分鍾内一致的音樂。
MusicLM 使用三種模型來提取作為條件自回歸音樂生成輸入的音頻表示。SoundStream,w2v-BERT 和 MuLan。
其中,AudioLM 模型可視作 MusicLM 的前身,MusicLM 就是利用了 AudioLM 的多階段自回歸建模作為生成條件,可以通過文本描述,以 24kHz 的頻率生成音樂,并在幾分鍾内保持這個頻率。
相較而言,MusicLM 的訓練數據更多。研究團隊引入了首個專門為文本 - 音樂生成任務評估數據 MusicCaps 來解決任務缺乏評估數據的問題。MusicCaps 由專業人士共建,涵蓋 5500 個音樂 - 文本對。基于此,谷歌用 280000 小時的音樂數據集訓練出了 MusicLM。
但媒體此前分析稱,MusicLM 肯定不是完美無缺的,或者説離完美仍有相當的距離。一些樣本還有質量問題,而且雖然 MusicLM 在技術上可以生成人聲,包括完成和聲,但還有很多地方需要改進。大多數 " 歌詞 " 也是蹩腳的英語或純粹的胡言亂語,然後由合成的聲音演唱,聽起來像是奇怪的 " 混合物 "。
AI 生成音樂的版權風險:到底算不算原創?
AI 跟人一樣,偶爾會偷懶直接抄襲這些素材,版權該如何保護?
谷歌的研究員在一次實驗中發現,該系統生成的音樂中約有 1% 是直接復制自其訓練的歌曲。這個問題足以讓研究人員不願意過早發布 MusicLM。另外,用搜集來的素材供 AI 學習,這本身是否就已經涉及到侵犯版權?
實際上目前已經有了相關案例。2020 年,美國説唱歌手 Jay-Z 的唱片公司對 YouTube 頻道 Vocal Synthesis 提出版權警告,理由是它使用 AI 創作了 Jay-Z 翻唱比利 · 喬爾(Billy Joel)的 "We Didn't Start the Fire" 等歌曲。
美國音樂出版商協會的埃裏克 · 桑雷 ( Eric Sunray ) 撰寫的一份白皮書認為,像 MusicLM 這樣的 AI 音樂生成器通過 "從訓練數據庫中吸收作品中連貫的音頻,侵犯了美國版權法的復制權"。
進一步説,AI 生成的音樂雖然是 " 原創 ",但往往像不同音樂人作品的雜糅,也就是説有洗稿甚至是山寨的嫌疑。
因而此次谷歌運用DeepMind 的水印技術 SynthID 生成的 ID 便是對版權問題的重視,谷歌表示,生成的所有歌曲都帶有數字水印,人的耳朵聽不見也不會影響音樂的效果。主要通過音頻波轉換為二維可視化來實現。即便數字水印遭受了添加噪聲、音質壓縮、音頻調速等破壞性操作,仍然可以檢測到歌曲中的水印。
但有分析師指出,盡管谷歌加了水印證明該音樂作品是 AI 創作而成卻依舊沒能解決根本問題,由 AI 系統生成的音樂到底算不算原創作品?可以和 " 人造音樂 " 同台競技嗎?
伴随着關注與争議,或許在不遠的未來,這些問題都将有清晰的答案。