一曲封神！“音樂界Sora”Udio發布，效果直逼人類唱歌

今天小編分享的互聯網經驗：一曲封神！“音樂界Sora”Udio發布，效果直逼人類唱歌，歡迎閲讀。

本周一，钛媒體 AGI 發布了 " 比 Suno 好 10 倍的 AI 音樂應用 " 消息，引發關注，甚至當時名字都還沒得到正式确認。

如今，這款 AI 音樂產品終于被官宣了。

北京時間 4 月 11 日凌晨，全新的音樂生成應用 Udio 正式亮相，輸出效果超越熱門的 Suno，尤其是中文歌曲甚至直逼人類唱歌水平，堪稱 " 錄音室 " 級别，成為 Suno 勁敵，引發廣泛關注。

目前，Udio 已經開始公測，用户可免費體驗，每月可生成 1200 首作品。體驗地址：https://www.udio.com/

據了解，Udio 采用先進的 AI 技術，通過簡單的文字輸入，就能生成各類風格的原創音樂作品。從抒情的福音音樂，到滄桑的藍調，再到夢幻的流行電音，應有盡有。同時，Udio 還支持多種語言，用户可以創作出日語流行、俄羅斯流行、拉丁節奏等多元化的音樂作品。

就目前體驗來看，Udio 的優勢和特點包括兩部分：體驗比 Suno 好，更好的可擴展性。

其中，Udio 生成的音樂效果比前段時間大火的 Suno 有了質的提升；同時，可擴展性方面，用户不僅可以指定音樂的引子和尾聲，還能以此為基礎向前向後延伸，生成更長的音樂作品。完成創作後，只需點擊 " 發布 "，作品就能與 Udio 社區的其他創作者們分享交流。

注冊 Udio 帳户後，任何人都可以通過輸入文本提示來創建曲目，其中可以包括歌詞、故事方向和音樂流派标籤。然後，Udio 分兩個階段處理該任務。首先，它利用類似于 ChatGPT 的大型語言模型 ( LLM ) 根據提供的提示生成歌詞（如果需要）。接下來，它使用 Udio 沒有公開的方法合成音樂，但這很可能是一種擴散模型，類似于 Stability AI 的 Stable Audio。

根據給定的提示，Udio 的 AI 模型會生成兩個不同的歌曲片段供您選擇。然後，您可以将歌曲發布到 Udio 社區，下載音頻或視頻檔案以在其他平台上共享，或直接在社交媒體上共享。其他 Udio 用户也可以重新混音或在現有歌曲的基礎上進行創作。Udio 的服務條款規定，該公司對音樂世代不享有任何權利，并且它們可以用于商業目的。

企業層面，公開消息顯示，Udio 的創始團隊來自谷歌 DeepMind 等頂尖 AI 機構，團隊在音樂和技術領網域均有深厚積澱。他們的目标是讓 Udio 成為一款真正改變遊戲規則的音樂創作工具，不僅面向專業音樂人，也希望讓廣大非音樂人也能輕松參與到音樂創作當中。

盡管 Udio 團隊尚未透露其模型或訓練數據的具體細節（其中可能充滿了受版權保護的材料），但它告訴《tom 指南》，該系統具有内置措施來識别和阻止與特定的藝術家，确保生成的音樂保持原創。

當前，Suno、Udio 也讓一些人類音樂家感到害怕。上周，超過 200 名音樂藝術家籤署了一封公開抗議信，批評 Udio 這種由 AI 驅動的音樂生成衣務，影響音樂者創作。一位 Reddit 評論者在有關 Udio 的帖子中寫道：" 説實話，這太令人沮喪了。" " 我仍然普遍樂觀地認為，從長遠來看，音樂在某種程度上會很好。但是，為什麼要這樣做？為什麼要自動化藝術？"

也有分析稱，就像 Sora 一樣，Udio 生成的音樂和 Spotify 上聽到的歌曲幾乎沒有任何區别。而且根據他的感受，" 要比 Suno 好 10 倍。"

早前钛媒體注意到相關報道，Udio 稱為 xgboost 技術，後來被證實後者是一種數據集技術，它采用開源數據集 Medley-solos-DB，最初發布時間為 2019 年 9 月 29 日。該研究參與方包括紐約大學、加州大學伯克利分校、Spotify 等機構人員。另據論文顯示，山東理工大學工程與信息技術系 Yijie Liu,Yanfang Yin，Qigang Zhu，Wenzhuo Cui 等人采用利用 XGBoost 結合特征融合進行樂器識别。

據報道，Udio 團隊正在快速迭代優化，計劃未來陸續推出更長音頻、更高音質，以及更強大的可控性等眾多新功能。

針對 AI 音樂生成生态，Suno 首席執行官 Mikey Shulman 在紅杉資本活動上表示，這是一個非常酷的工具，它正在擴大用户，從而讓我們對傾聽創造性音樂的品味能夠引起更多人的共鳴。未來 suno 會有大量的玩家，占比或超過 80%。

（本文首發钛媒體 App，作者｜林志佳）