今天小編分享的互聯網經驗:拒絕機械感!30秒生成商用級歌曲,「歌歌AI」完成新一輪融資,歡迎閱讀。
作者 | 鄧詠儀
編輯 | 蘇建勳
在鍵盤上敲出短短一行命令:請給我寫一首充滿喜悅 / 悲傷 / 的歌,等待片刻,一首完整的、甚至帶有人聲、歌詞的 " 歌曲 " 就已經完成——進入 2024 年,Suno 等產品帶來的熱度還沒散去,如今國内已經有不少瞄準 AI 音樂領網域的產品,如雨後春筍般出現。
36 氪此前報道的「歌歌 AI」是其中的一員。這家公司近期獲得新一輪數百萬元投資,投資方為錫創投。
音律閃動成立于 2022 年 8 月,瞄準 AI 生成音樂方向,其主要產品為「歌歌 AI」app。
音律閃動 CTO 王樞沛告訴 36 氪,音律閃動的團隊為來自互聯網大廠的技術專家,以及在音樂產業中的資深制作人。在生成式 AI 出現前,團隊就已經有通過 AI 技術來探究在音樂領網域中的應用——早在 2016 年,團隊成員就開始開發 AI 寫歌產品,并有項目創業經驗。
真正促使團隊創業的,是在 2022 年左右看到以 Transformer 架構為主的技術突破," 我們認為,這個技術能夠真正改變音樂產業。" 王樞沛表示。因此,從 2023 年成立開始,音律閃動就開始從底層模型開始訓練,在經歷 2023 年的小程式版試運營後,在 4 月完成了獨立的 app 開發,近期剛剛上線。
" 讓所有人都成為音樂人 " 是歌歌 AI 的目标,從產品形态來看,歌歌 AI 是一款面向所有愛音樂的用戶的 AI 寫歌軟體。使用方法也非常 " 傻瓜式 ",容易上手——
用戶進入 app 界面,即可看到三種模式:自由模式、驚喜模式、純音樂模式,通過對話和 "AI 制作人 " 溝通,生成自己想要的音樂。
在自由模式下,用戶可以輸入簡單一句話的 Prompt,讓 AI 生成擁有具體主題、完整旋律和人聲的歌曲。
比如,36 氪就以自由和勇氣為主題,請 AI 幫忙寫一首歌曲,不到 1 分鍾内,歌歌 AI 就生成了一首時長為 2 分 20 秒的《希望之歌》,并且帶有完整填詞。
來源:歌歌 AI
整首歌擁有比較和諧的旋律和編曲,并且旋律變換也相對豐富。不過在填詞上,還是有個别詞句會不通,或者斷句尚有問題,但用戶可以通過手動調整來完成歌詞修改。哪怕不懂樂理,還可以通過簡單點選操作,來調整每個字的音高。
" 除了修改歌詞和旋律,還有包括 AI 演唱的這個聲音,用戶也可以在選擇付費後進行修改,替換成自己的聲音。" 王樞沛表示。
對于要求更高的用戶,歌歌 AI 還提供了更專業的 " 驚喜模式 ",能夠生成滿足商業級場景的歌曲。
在這一模式下,用戶能夠對音樂風格、具體的配器提出更多要求。AI 能夠生成更完整的旋律,會有完整的主歌、副歌、橋梁等結構。
并且,人聲的變換也更加豐富——無論是顫音、旋律的高低變換過度都更自然,聽起來更接近自然人聲演唱的狀态,"AI 感 " 減少很多。
在所有模式下,歌歌 AI 都基于一定的免費積分,用戶可以消耗積分以生成音樂。一旦用戶對 AI 生成的 demo 比較滿意,希望 " 擴寫 ",就能在對話框裡和 "AI 制作人 " 對話,以修改風格等等,同時付費來讓 AI 生成更完整的歌曲。目前的三檔付費價格分别為包月 18 元、48 元、98 元。
音律閃動 COO 王樞沛對 36 氪表示,驚喜模式使用的是端到端的大模型技術,為了保證音樂效果質量更高,暫時不支持具體的歌詞和人聲修改,這也是與市面上大部分 AI 生成音樂產品相比,歌歌 AI 的優勢所在。
"AI 文字、圖片生成現在都有開源框架,技術層面是比較開放的,但從 AI 生成音樂賽道整體來看,技術路線是比較封閉的,各家都有自己的訓練技術差異。" 王樞沛表示。
總體來說,上一代将 AI 技術應用到音樂中的嘗試,普遍能做到的程度是,先生成 MIDI 音樂,即簡單将旋律數字化,形成較為單調、機器感的單旋律。
在上一代 AI 技術逐步成熟之後,AI 生成音樂進入到了用小模型、專家系統訓練的階段。簡單而言,一種方式是通過人工标注大量的音樂片段,分 " 科目 " 訓練模型,比如旋律、歌詞、編曲等,都有單獨的小模型。等到這些模型能夠產出比較成熟的片段之後,再 " 拼接 " 起來,形成完整旋律。但這種方法的缺點是,由于各個元素是割裂的,拼接之後的機器感難以消除,也很難達到和諧的效果。
而從 AI 生成音樂的訓練上,為了保證歌曲能做到質量更高、更自然,歌歌 AI 對标海外產品,選擇了端到端的大模型路線,即音樂數據不需要經過特别細致的處理,就輸入到模型中進行訓練。這樣能夠生成比較完整、統一的旋律。
歌歌 AI 的另一個亮點在于,并不局限于 " 用 AI 寫歌 " 的定位上,而是希望能夠基于生成式 AI 技術,真正讓音樂創作、分發方式的鏈條發生根本性變化。
音律閃動團隊認為,目前音樂平台的推薦音樂内容千篇一律,并且推薦内容頁不真正切合需求。" 全國現在每天大概產生新產生約十幾萬首歌,但生成式 AI 技術能夠讓這個數字變成成百上千萬。" 王樞沛表示,AI 技術的普及,也會讓人們生成更個性化的音樂,成為打破現在音樂巨頭壟斷的機遇。
除了歌曲生成等基本功能外,歌歌 AI 也拓展了多個板塊,涉及生成和分發。
比如,用戶通過 AI 模型錄入自己聲音并生成歌曲,可選擇不同風格和曲風,甚至發行全網。
歌歌 AI 近期也正在與國内主要音樂平台洽談對接,以後希望做到的效果是,用戶生成音樂後可以做到自動修音、AI 混音處理,最後——全網一鍵發行,用戶能夠通過自己生成的 AI 音樂,獲得版稅。
并且,和短視頻的結合也是重要的傳播節點。當前,歌歌 AI 已經能夠支持下載帶有 AI 音樂的小視頻,未來也會拓展到 AI 生成視頻、直播場景。
本輪融資後,歌歌 AI 團隊也會繼續加速產品迭代,并且投入到市場增長方面。
團隊方面,目前歌歌 AI 團隊不到 10 人,CEO 龍勇擁有 20 年音樂制作經驗,曾是中國好聲音、中國有嘻哈、TME 官方合作夥伴,有豐富制作運營音樂和版權經驗;COO 王樞沛是浙江大學工學 / 美國伯克利音樂學院音樂制作和吉他表演雙專業學士;CTO 張文鉑為「我要寫歌」APP 創始人。