今天小編分享的互聯網經驗:對話中國移動咪咕音樂總經理朱泓:15秒是AI視頻最好形态,歡迎閲讀。
國移動咪咕音樂黨委書記、董事長、總經理 朱泓
去年這個時候,見到朱泓,他明顯要興奮很多。
彼時正值 Suno V3 版本剛發布,引爆了音樂圈,所有人都歡呼,音樂行業的 "ChatGPT 時刻 " 來了。
當時,钛媒體 APP 與中國移動咪咕音樂黨委書記、董事長、總經理朱泓聊了聊,他對 AI 音樂前景滿心期待。
他對钛媒體 APP 説,AI 可以讓你成為一個神,因為我們可能連五線譜都看不懂,但是沒有關系,AI 可以讓普通人在内容生產上變得更全能,是人類智慧的延伸。
今年,钛媒體 APP 與他再次談論起音樂大模型,感受到了多了一些冷靜與理智。
" 其實任何一個應用從‘好玩’到‘優美’,之間是有距離的。我們現在是‘好玩’的狀态,還沒有到特别美的狀态。" 朱泓對钛媒體 APP 説。
他説,藝術與技術的融合,還是要進一步深入的,還沒有融合到特别好的狀态。如果 AI 創作出來歌曲,我們一聽,就覺得特别動聽的時候,就到了 " 人人都是創作者 " 的時代。
" 其實音樂讓人滿意,是最難的一件事。聽音樂,叮叮當當的,好像很容易,但它必須打動情緒來加持。它是一個非常抽象的藝術。音樂,什麼叫滿意?我覺得我不好判斷。我只能説,它會越來越讓人愉悦。所以我們現在視頻上也會投入更多,也是因為看到這個形态的落差。" 朱泓説。
現實的确是如此。目前,一首高完成度的 AI 歌曲,中間飽含了大量人工手搓的成分。
舉個例子,去年 12 月,钛媒體為 T-EDGE 大會創作了 AI 主題曲《One the EDGE of Tomorrow》,詞、曲和 MV,均由 "AI 工具 + 人工輔助 " 完成,讓我們更進一步地感受到了 AI 全流程創作帶來的驚喜。
這首曲作者之一,知名音樂人楊樾後來説,當時用 AI 工具生成了 60 多版曲譜,才找到那個對的感覺。而這支 3 分 30 秒 MV 誕生的背後,也花了钛媒體視頻編輯近兩天的時間,用 AI 生成多個片段,然後人工後期編輯完成。
至于為何 Suno 當時一度讓國内音樂圈興奮不已?或許,很大程度上,是因為這個產業,處于騰訊音樂和網易雲音樂七三分主導的局面久矣。
市場渴望看到一些變化,尤其是在這個需要創意的產業。在兩大巨頭的夾縫之中,市場其他平台玩家,在以差異化的方式尋找突圍路徑。
咪咕音樂是離賽場最近的選手。
咪咕音樂的前身是,2006 年成立的中國移動無線音樂基地。早期,中國移動依托彩鈴業務,積累了大量音樂版權資源。比如,周傑倫和林俊傑等歌手的獨家版權,是通過彩鈴業務獲取的。
很長一段時間,彩鈴業務是中國移動的核心增值服務之一,也使得咪咕音樂在版權談判中獲得了不少優勢,形成了龐大的曲庫基礎。這也解釋了為何咪咕音樂至今仍保留彩鈴功能,并成為其差異化競争力之一。
當移動互聯網開始普及,咪咕音樂逐漸從傳統彩鈴服務商,轉型為綜合音樂平台,彩鈴仍是其核心功能模塊。
随着 5G 和 AI 技術的發展,咪咕音樂推出視頻彩鈴服務。現在,用户可通過 AI 工具(如 " 一語成片 "" 一語成歌 "" 一圖變裝 ")快速生成個性化的視頻彩鈴。
钛媒體 APP 了解到,咪咕音樂已經通過運營商資源,聚焦彩鈴業務(尤其是力推視頻彩鈴)、AI 工具和線下演藝,形成了獨特的 " 音樂 + 智媒 " 模式。
截至 2025 年 1 月,全場景用户有 1.63 億,超 4.2 億視頻彩鈴用户,超 8500 萬視頻彩鈴主叫用户,AI 智創彩鈴用户超 1260 萬。
據朱泓透露,去年,咪咕音樂把視頻彩鈴從功能型業務,變成媒體性業務以來,一年之内實現了 8000 萬月活用户,觸達了 8 億人。
AI 大模型的急速進化,也給他帶來了很多緊迫感。
" 我們也是誠惶誠恐。很快,因為變化太快。" 朱泓透露,DeepSeek 開源之後,目前已有 45% 以上的央企接入," 它是一個倒逼機制,别人的效率和體驗都提升了,你不做,你就被超越,或者被幹掉。"
今年,咪咕音樂重點戰略業務之一是,推廣 AI 視頻彩鈴。
咪咕 AI 視頻彩鈴主打 15 秒的微短視頻。朱泓認為,這個時長恰到好處,因為不僅對平台算力的需求量可控,而且,内容生成耗時是用户可接受的,是 AIGC 總體成本使用的平衡的最佳時長。
這個 "15 秒 ",上一次被這樣反復提及的時刻,還是 4G 和移動互聯網普及,張一鳴最開始做短視頻的時候。
拿下來 " 今日頭條 " 這張王牌後,張一鳴宣布 "All in 短視頻 ",他當時力推主打 "15 秒 "(而後拓展至更長時長)的抖音,突破了 BAT 時代巨頭的圍剿。
朱泓告訴钛媒體 APP,把創作門檻降低以後,用户的熱情是高漲的。他還用了一個年輕人易懂的詞語來形容視頻彩鈴:通話皮膚,類似 " 遊戲皮膚 " 的概念。
今年春節一個月期間,咪咕音樂激發了 1300 萬人使用 AI 智創彩媒進行創作。
但他可能要面臨一個問題是,外界普遍印象中,大家都不愛打電話,需要語音溝通的時候,更多的是啓用微信的 " 語音通話 " 模塊。
視頻彩鈴,還有可能成為一項極具前景的業務嗎?
" 這個問題是我經常被問到的。" 朱泓對钛媒體 APP 説,他們做過一個全量的大規模調研,已經得出了結論,微信不會替代掉通話。
首先,通訊網絡顯示,最近三到五年的通話數據是平穩的;其次,在陌生人溝通過場景中,電話還是第一選擇,是剛需。
在他看來,更為重要的是,在熟人場網域之中,溝通重要事情的時候,電話是第一優先級,主要考慮到不會受到網絡不穩定性的影響。
從最初音頻彩鈴到 AI 視頻彩鈴,彩鈴始終是咪咕音樂的核心競争力之一,AI 視頻彩鈴在咪咕音樂新的商業化增量中扮演重要角色。
然而,對大眾用户來説,在節衣縮食、減少娛樂消費開支的當下,嘗鮮的熱情過去之後,究竟還有誰會為視頻彩鈴額外單獨付費?
個體商户,小微商家,以及,有宣傳需求的個人可能更會。
基于手機通話場景,去年,咪咕音樂上線了一項 " 視宣号 " 的營銷產品,依托咪咕音樂 4000 萬正版曲庫資源,為商户提供正版的門店公播音樂,解決店鋪音樂的版權問題。
簡單理解是,消費者撥打商家電話時,能在電話接通前,通過手機螢幕看到商家預先設定好的視頻彩鈴内容。而商家可以在螢幕中展示店鋪最新的產品和活動信息等,并且,開通 5G 新通話之後,視頻内容還可以在通話的過程中循環播放。
截至 2024 年 11 月,視宣号已覆蓋 20 多個行業,吸引了 150 萬家商户訂購服務,計劃在今年擴展超 280 萬家商户。
以下是钛媒體 APP 與朱泓的對話實錄,經編輯:
钛媒體 APP:你之前談到説,今年是智能體的元年,你是如何理解智能體的?
朱泓:我認為智能體的核心,首先解決的是,更高效地鏈接的問題。連接人的時候,智能體對人的理解力會大幅度提升,因為你老用它去學習,它就了解你的畫像,了解你的習慣,大幅提升了對自己的理解。
第二個是多模态。互動的多模态,多種方式,讓我們更便捷。智能體的發展,和智能眼鏡的發展一體的。智能眼鏡一發展,我們的語音互動體驗會大幅度提升。
所以,智能體可以更理解你,另外,智能體可以和你自然互動的時候沒有障礙,就連接人的這一面,很多問題解決了。
因為智能體能夠連接非常多的模型,通過不同的模型解決不同的問題,進行非常方便地組合。智能體的靈活性又非常強,再加上基于大模型的推理和認知等,智能體能夠成為每個人的貼身秘書。
钛媒體 APP:是哪幾個信号出現,讓你覺得今年可以定義為智能體元年?
朱泓:信号是有的。第一,各個行業都在做智能體,我們自己也在做,而且做的難度也不高。我們很快就研發出來一些東西,出來之後表現直接就提升,這是最重要的。
還有,像 DeepSeek 這類大模型的開源,是一個觸動。開源之後,很多公司對最新的 AI 科技應用的成本幾乎就沒有了,當然,還有硬體成本,軟體成本沒有了,所以,一下子,全行業立刻就得跟上。
這相當于科技平權帶來的另外一個問題,就是你不跑,你就被别人所超越。所以,它是一個倒逼機制,别人的效率和體驗都提升了,你不做,你就被超越,或者被幹掉。今天跟不上,明年再跟就沒有了。
钛媒體 APP:我觀察到咪咕音樂的智能體,目前以對話的形式呈現,聚焦在音樂的場景,除了這個之外,你對智能體會還會有哪些期待呢?
朱泓:肯定是會從我們的音樂場景慢慢擴展了,擴展到更多的應用場景,但是,我們先要把我們的音樂這個產品做好,只有做透了以後,我們再説其他的有沒有機會。
钛媒體 APP:去年咪咕音樂重點推出了與音樂大模型相關的應用,今年重點之一是接入了 DeepSeek,你怎麼看 DeepSeek 與音樂場景結合的?
朱泓:最近我們聽了王興興的一個演講,他談到,DeepSeek 這種推理模型和多模态的模型,是不一樣的。多模态的核心是表達,而推理模型的核心是邏輯。你把叙事説出來,是文字,你得把它表達出來,所以,這兩者是相輔相成的,非常重要。
他還説到一個是智能硬體的驅動,三類模型推動了整個 AI 大發展。我認為,在内容領網域這兩個可以搭配,寫劇本可以靠 DeepSeek,表達還得要多模态,這是一個并行發展的。
钛媒體 APP:你們今年在 AI 大模型上會有哪些進展呢?
朱泓:我們音樂方面,智能體是重點要推動的,另外,就是 AIGC 的一些獨特能力,比如説,數字人的互動,形象的介入,聲音的優化,這些都是我們自己要去重點研發的。然後,對于推理類的模型,我們現在沒有做,本來也沒有做,就會接入 DeepSeek,還有中國移動九天系列模型來做。
钛媒體 APP:我看到咪咕音樂 APP 上的音樂智能體,也在跟一些第三方的模型廠商合作。
朱泓:比如説,天工音樂,是我們生态的一部分。我們一旦涉及文生音樂或者圖生音樂,就是調用天工的能力。所以,我們就通過智能體這些模型進行組合,這也是整體好的地方,就很方便自己。
钛媒體 APP:你去接觸外部的模型商的時候,最看重的是什麼?
朱泓:最看重他們在垂類模型上的引領能力。如果足夠好,我們就合作。
钛媒體 APP:其實講到音樂大模型話,去年你談到一點,音樂上,人人都可以創作的時代已經來了。但其實,去年一整年發展下來,AI 音樂也沒有大爆,沒有形成一個全民音樂創作的時刻,你怎麼看?
朱泓:對。是啥原因呢?我們也一直在跟進。任何一個應用從 " 好玩 " 到 " 很優美 ",這之間是有距離的。我們現在是 " 好玩 " 的狀态,還沒有到特别美的狀态。藝術與技術的融合,還要進一步去深入地推進,還沒有融合得特别好啊。但是如果創作出來的歌曲,一聽就特别動聽的時候,那個時候,就到了人人都是創作者的時代。
钛媒體 APP:你覺得那一天會來嗎?
朱泓:會的,會非常快。
钛媒體 APP:到了那一天,職業音樂創作者應該怎麼選擇?
朱泓:其實我的觀點是,你要麼被 AI 駕馭,要麼你駕馭 AI。那職業音樂人需要知道怎麼駕馭它。你車跑那麼快,你必須知道怎麼去弄方向,AI 還是有風險的。
钛媒體 APP:對于創作者生态,你們對于 AIGC 創作也提出了一些分賬體系?
朱泓:對,我們正在研究這件事情。我們将拿出 5% 到 10% 的收入,給到優秀的 AI 創作者。我們正在計劃的一個方案,近期就會對外公布這個想法,對優秀的 AI 創作者給予相應的激勵,刺激并促進整個生态的繁榮。
钛媒體 APP:現在 AI 音樂創作出來的歌曲,還是有些同質化,剛開始感到新奇,但是不久後就會覺得厭倦,你認為呢?
朱泓:AI 音樂模型是這樣,用的人越多,它會越聰明。我們的這個大模型,也會不斷地根據用户使用提升。所以,為什麼我們要去刺激用户去使用,這是有原因的。越用越聰明,是在你既有的一套底層邏輯底層理論體系不變的情況下。
但是,我們現在的問題是,AIGC 日新月異。也許某一天,一個新的模型出現,DeepSeek 把 OpenAI 給幹掉,是革命性的東西。我們現在是開放态度,你有我們就用。所以,我現在不能説,就慢慢訓練它就會越來越動聽,還是説,有一個新的模型出來讓它越來越動聽。我不知道,但是一切都有可能。
钛媒體 APP:你覺得什麼時候,我們可以真正看到 AIGC 音樂大爆發?
朱泓:其實音樂讓人滿意,是最難的一件事。聽音樂,叮叮當當的,好像很容易,但它必須打動情緒來加持。它是一個非常抽象的藝術。音樂,什麼叫滿意?我覺得我不好判斷,我只能説,它會越來越讓人愉悦。所以我們現在視頻上也會投入更多,也是因為看到這個形态的落差。
钛媒體 APP:咪咕音樂現在重點打造的業務是 AI 視頻彩鈴,看着有點像互聯網公司做短視頻的早期,我能想象大概它的場景,以及,哪些人會用,但是,我們現在也感覺到一個趨勢是,大家好像很少去打電話了,尤其是年輕人,更多是在打微信語音電話,所以,視頻彩鈴的前景會好嗎?
朱泓:對。這個問題是我經常被問到的。其實我們做過一個比較全量的,非常大規模的調研,微信是否會代替通話。這個問題已經被解決掉了,為什麼呢?因為從我們通信網的數據來看,最近三到五年基本上是平穩的,沒有繼續下跌。第二,在陌生人的溝通過程中,語音還是第一選擇,陌生人之間沒有微信。
還有就是重要的事情,是通話的第一優先級,我們很清楚,它不會受到網絡的影響,必須保證重要的事情,一定是通過電話的方式來解決。所以在這些場景下,我們的價值仍然是非常高的,更何況,我們還有很多像 5G 新通話等其他通訊功能。
人們通過互聯網進行的信息互動,也能夠實現,就給老百姓一個選擇權。通話不會消亡,它永遠在一些特别場景是剛需,所以我們要把它做好。
钛媒體 APP:AI 視頻彩鈴現在主推 15 秒,後續這種視頻產品會擴大時長,還是更多地提升 15 秒之内的表達能力?
朱泓:更多是在表達上。為啥呢?現在的短視頻越來越短,我們其實是不适應這個潮流的。這既是一個平衡點,其實也是未來的方向,就是那麼短的時間内,你怎麼做更好地表達?其實非常難,越短越難。
钛媒體 APP:如果我們基于音樂場景的話,可能還是要 3-5 分鍾。
朱泓:創作高潮部分,原來也就是 30 秒或者 45 秒,就夠了。你能記住就這麼一些。
钛媒體 APP:當年抖音、快手最開始也就是 15 秒,然後發展成了多元的生态。咪咕的 15 秒 AI 視頻彩鈴,也會遵循這個發展邏輯嗎?你覺得它未來更多的想象空間在哪裏?
朱泓:其實我們現在已經實現了,不用想象,它正在發生。你接電話以後的視頻,把它連起來那就夠了。你通一個電話,三五分鍾,你打電話一接起來,視頻聲音斷掉,你繼續説你的,視頻接着播放。
我跟他聊天,然後看視頻。這就是我們馬上要發生的事兒。這一下視頻彩鈴所傳遞的信息量就會非常豐富,表現力就會非常強。
钛媒體 APP:在螢幕上不斷地在播放視頻,是要做下一個抖音?
朱泓:我覺得形态不一樣,我們是運營商的形态。我們朝着運營商特色和互聯網特點的路上,往前走。
钛媒體 APP:那個不斷播放通話視頻場景,是不是可以承載很多商業化,挂個購物車,帶個貨什麼的?
朱泓:對,可以。技術正在朝這個方向發展,但現在不具備。我們先把這個用户通話過程的視頻播放的問題先解決掉。
钛媒體 APP:視頻彩鈴業務一個很大的亮點,是今年春節期間這個用户暴增。
朱泓:對,我們一下就激發了用户參與創作的熱情,因為我們春節那撥用户,是小白用户,不是 PGC,也不是以前生產過視頻的人。所以,從這件事情上,我們很有信心,所以我們才會講,如果我們提供更多的場景,更好的工具,那會有更多的人參與。
钛媒體 APP:你預期視頻彩鈴業務,将來會在整個咪咕音樂體系中,收入上會扮演一個什麼角色?
朱泓:我們當然希望是我們主要的增長業務,因為我們看好這個未來,所以體系中,現在最看好這個。當然,因為每個人的創作熱情,還遠遠沒被激發出來,自我表達的熱情,遠遠沒有激發出來。
钛媒體 APP:AI 視頻彩鈴後續的市場拓展上有什麼計劃?
朱泓:我們本身就有很強的拓展能力,我們在運營商的渠道上就可以拓展。我們現在需要的是把產品做好,產品還在打磨。
打磨的方向是,讓人們更容易去創造出他們想要的内容。就比如説剛才你説音樂這件事情,AI 出的歌,你説特别美嗎?還不夠特别美。那麼就怎麼樣讓它更美,或者是,怎麼樣更好地理解每一個消費者,讓他能夠很好地去運用我們這個工具,這也是我們持續在做的事情。
整個 AIGC 肯定是沒有到特别成熟的時候,還遠遠沒有。但是我覺得會很快,我們也是誠惶誠恐。很快,因為變化太快。
我們現在是自研加開源合作。因為我們自己只能做一部分,做不了所有。自研這一塊,剛剛提到的智能體,音樂類的,我們現在已經突破了音頻這個事情,還要做一點音樂 MV,這是我們的重點。
我發現其實我們這一套產品,那個商業模式,用户盤子天然就在那,包括模式是音樂,我們的手機要付費。
钛媒體 APP:這樣大規模投入 AI 建設,對你們來説,成本是可以覆蓋的嗎?
朱泓:我們現在是能覆蓋。而且在算力成本方面,運營商有獨特優勢,因為我們提供算力網絡,我們是基礎設施的建設者。我們有這樣一個盤子,就天然地适合我們去做投資,對運營商來説它就比較合理。(本文獨家首發于钛媒體 APP,作者|李程程)