今天小編分享的科學經驗:昆侖萬維方漢:大模型的技術紅利在消退,商業模式創新者将成赢家,歡迎閱讀。
接下來,到底什麼樣的玩家才能吃上AI 大模型的紅利?
誠如大家所看到的那樣,即便是 OpenAI 這樣的 " 頂流 " 剛發布了 Sora,也未能對其他視頻生成模型造成碾壓性的衝擊。
但遙想最初 ChatGPT 發布之際,不僅在全球範圍内掀起一股技術新浪潮,更是吃了足足一年半以上的技術紅利。
因此,站在現在這個時間節點,剛才的問題是值得深入思考一番。
而就在前不久的 MEET 2025 智能未來大會中,昆侖萬維董事長兼 CEO方漢便針對這個問題給出了他的答案:
AI 大模型 SOTA(State of the Art)的技術紅利變得越來越短暫,也将逐漸消退。
AI 大模型產品需要關注 " 新 " 與 " 好 ",商業模式能夠創新者将成為真正的赢家。
在現場,方漢基于昆侖萬維自身發展和入局大模型多年的經驗,以《智能邊界:AI 大模型如何推動應用創新》為主題分享了他的所見所聞、所思所想。
MEET 2025 智能未來大會是由量子位主辦的行業峰會,20 餘位產業代表與會讨論。線下參會觀眾 1000+,線上直播觀眾 320 萬 +,獲得了主流媒體的廣泛關注與報道。
核心觀點梳理
用戶不關心内容是否由 AI 制作,他們只關心内容是否新穎和優質。
技術紅利逐漸縮短,AI 產品需要關注 " 新 " 與 " 好 ",以用戶為導向實現商業價值。
AI 公司需要從單純的工具提供者轉變為平台型企業,通過產品和商業模式創新來實現這一轉變。
中國企業在算法優化和商業模式創新上投入更多精力。
AIGC 技術能顯著降低創作成本,使弱勢文化國家也能創作高質量内容。
(為更好呈現方漢的觀點,量子位在不改變原意的基礎上做了如下梳理)
昆侖萬維的 AI 大模型發展之道
各位尊敬的來賓,大家好,我是昆侖萬維的方漢,今天我來跟大家分享一下,我們公司在 AI 大模型這一波浪潮中間,從技術到產品,我們的動作和我們對產品的思考。
首先簡單介紹下我們公司。
昆侖萬維公司 2008 年成立,主要在中國做網絡遊戲的研發,2015 年上市之後開始轉型做出海互聯網平台。
從 2015 年到 2020 年,主要是把國外老的互聯網廠牌通過中國人強大的運營能力做大做強,其中包括全世界第三大浏覽器 Opera,還有海外的 K 歌軟體 StarMaker 等,都取得了很好的成績。
從 2020 年開始,我們開始做 AI 方向的大模型研發。2022 年 12 月,我們發布了國内開源的第一個 13B 的中文預訓練大模型。
目前我們有三大業務板塊,AGI 與 AIGC 業務、信息分發與元宇宙業務、投資業務。
我們在全球大概有 4 億月活躍用戶,海外收入占比 89.7%。在全世界 100 多個國家和地區都有業務,在 20 多個國家有我們的辦公室。
下面介紹一下我們在 AI 領網域的布局。
我們從硬體算力層到模型層到應用層都有投入,其實我們最關注的還是模型層與應用層。
在模型層,我們有語言大模型、多模态大模型、3D 大模型、視頻大模型、音樂大模型。
目前技術指标最好的是音樂大模型,這是國内目前唯一一家能夠跟國外音樂大模型 Suno 相媲美的音樂生成大模型。
應用層,我們在 AI 助手、AI 遊戲、AI 短劇、AI 音樂方面都有投入。
2022 年 12 月我們在開源了 13B 的中文預訓練大模型之後,2023 年 4 月發布了一個千億的天工 1.0 大模型。
2024 年 4 月,我們發布了天工 3.0,其中音樂大模型取得了行業 SOTA。
2024 年 11 月 20 日,我們發布了天工 4.0 4o 版和端到端的實時語音對話助手 Skyo;11 月 27 日,我們發布了天工 4.0 的推理版本 o1。
我們的天工 4.0 4o 版本,端到端實時語音對話系統,主要是把語音對話模型的時延從原來外挂式的 400 毫秒降到 100 毫秒,這個對于 C 端應用是至關重要的。
天工 4.0 o1 版本是國内第一款具有中文邏輯推理能力的 o1 模型,其中一個系列也馬上要開源。
這是我們的業務矩陣,在國内主要做 AI 搜索業務,在海外有 AI 遊戲、AI 音樂、AI 短劇和 AI 社交等業務。
我們國内的 AI 助手的產品也更新了,包括高級搜索、天工彩頁和天工寶典。
天工高級 AI 搜索功能是目前最懂金融、學術的 AI 搜索。
這是 AI 短劇平台SkyReels,它是全球首個集成視頻大模型與 3D 大模型的平台。
值得注意的是,Sora 已經正式對外發布了,但是你們可以看到,Sora 本身還是一個生成式模型。
國内的生成式模型有一個問題,用它來做實際作品的時候,要有一個很經典的動作,術語叫" 抽卡 ",就是同一個場景要用同一個 prompt 可能要生成 10 個甚至上百個視頻,從中間抽出一個可用的視頻。
也就是說,可控性是一個非常亟待解決的問題。我們走的路線是用 3D 大模型進行生成,再通過視頻大模型進行轉繪,這樣可以做到一次成片,這個對于視頻創作者來說把可控性大大提高了,不僅能夠極大降低用戶的使用成本,甚至還能極大地降低制作時間。
這是 AI 音樂。
AI 音樂的大模型使用的數據量将近 2000 萬首訓練數據,眾所周知,人類有史以來總共才有 4000 萬首音樂,我們大概用了一半的數據量。
目前我們在海外有面向 C 端的流媒體音樂平台 Melodio 和面向 B 端的創作平台Mureka。
此外,還有 AI 社交產品Linky,DAU 已經超過 50 萬。
SOTA 技術紅利将消退
下面是我們在做探索過程中的一些商業思考。
目前很明顯 AI 大模型已經到了中場甚至下半場,企業選擇何種商業模式來進行自己的產品研發和推廣?這是一個很重要的問題。
首先,我覺得由于風險投資的差異,導致中美 AI 的創業環境的不同。
因為我們在海外做的業務非常多,現在全世界的 AI 創新企業只有中國和美國是最多的,但是中國的 AI 創業企業能夠拿到的融資與美國同行相比,少非常多。
可以看到,海外 AI 創業公司還有一大部分在做基礎架構,它們的 B 端應用,在醫療健康、法律、金融等方向比較多,中國企業反而可能 2C、2B 都比較多。
此外,Scaling Law 到底有沒有放緩?争論點非常多。但我覺得能夠看到一個很明顯的事實。
為何 OpenAI 推出 4o?本質是因為訓練的 Scaling Law 已經放緩了,但是通過慢思考推理的 Scaling Law 又繼續湧現,所以你只要繼續加大推理時間,模型能力就會上升,這是從產品角度倒推的一個事實。
SOTA 的紅利變得越來越短暫。
GPT3.5 出來之後震驚全球,它的紅利至少持續一年半以上,但是像 Sora 正式發布後,我看到很多評測對其提出了批評意見,比如,圖生圖做得比較差、人臉都生成不出來、文生圖的可控性不好。
也就是說,Sora 在正式發布之後 , 并沒有表現出對同類的其他一些視頻生成模型的碾壓式的技術優勢,這樣導致了 Sora 的技術紅利能不能像 ChatGPT3.5 那樣持續很長時間?或者像 Dalle3 那樣壓根沒有吃到紅利?
在文生圖時代,做得最好的是 OpenAI 的 Dalle3,但是由于種種原因,最後市場上吃到紅利的其實是 Midjourney 和 Stable Difussion。
我認為,Sora 有可能吃不到 SOTA 的紅利。
中國的 AI 企業,除了拿不到更多投資,還存在一個問題,在算力上受到極大限制。我們能拿到硬體的算力是比較有限的。這樣會倒逼兩點。
首先,中國企業在算法迭代上有極大的動機和投入,例如,Sora 第一版本訓練用了将近 5000 — 8000 張卡,到中國第一個可用的視頻生成模型算力是花了不到 1000 張卡,最新的一個開源生成模型可能只花了 256 張卡。
中國團隊在算法的優化和迭代上所花的精力應該是美國同行的很多倍,因為沒有辦法,沒有卡,這就是所謂的以軟補硬。
同時 , 中國企業還有一個巨大問題,生存壓力特别大。一部分 AI 企業得不到更多資金,另一部分 AI 企業即便能拿到資金,投資人對企業盈利的時間點和商業模式都有極高要求,所以中國企業都在思考,用 AI 如何快速地盈利?
大家可以看到,現在在全球市場上瘋狂買量的 AI 企業一定是中國企業,因為所有的中國企業都在拼命地打磨自己的產品的盈利模式,而不是像美國同行一樣有充足的資金去做更深層的工作。
AIGC 技術能顯著降低創作成本
下面跟大家分享一下,文化平權和多語言帶來的藍海。
還是以 Sora 發布為例,大家可以看到,Sora 有一篇 PR 稿件标題叫《尼日利亞的 Minna》,這是一個 KOL,他用 Sora 創造了一個質量很好的視頻。
正巧我也在尼日利亞待過很長時間,據我了解,在尼日利亞拍攝一部電影的平均成本大概是 10 萬美金,不到 100 萬人民币,這樣導致尼日利亞當地根本沒有能力創造出與美國電影,不要說美國電影,甚至連印度電影都比不上的一個高質量的内容。
所以像尼日利亞這樣的亞非拉國家,他們能看的電影只有美國大片,為什麼?因為美國大片平均的制作成本在 1 億美金以上。
那麼,中國的大片什麼時候能與美國大片正面 PK?何時趕上美國?中國的電影,票房上 10 億之後、單部拍攝成本上億之後,中國的電影才可以正面與美國電影 PK。
到《流浪地球》這個級别,它的視聽效果與美國相比已經沒有差别了。這一切本質上都是用資金換來的。全球其他國家如果沒有這個資金,就只能看強勢文化的電影。
但是有了 AIGC 之後,包括内容生成,我相信以後單部大片的投資,從 1 億美金的制作成本很快可以降到幾百萬人民币,甚至幾十萬、幾千元人民币,這都是非常有可能的。
這樣的結果導致所有國家、所有弱勢文化地區都可以用 AI 技術來制作本國的内容。
與 TikTok 一樣,全世界人民都是用手機創作屬于自己的内容文化。我們認為 AIGC 技術的進步會極大降低所有人創作内容的門檻和所有人創作内容的成本。
這樣全球創作者的規模,包括電影創作者、音樂創作者、電視創作者、短劇創作者都會急劇擴大,這對中國平台型企業而言一定是非常大的優勢,這個過程中也會湧現下一代内容平台。
大家知道,去年 AI 公司裡薪酬最高的是算法工程師,這個與我們最早進入互聯網時代的時候一模一樣,1995 年一個程式員會寫 HTML,每個月可以掙一輛奧迪出來。
但是今天一個程式員只會 HTML,每個月連一個車輪子都掙不出來,這就是技術的迅速弱化。
中國互聯網最後真正賺到錢或者成長為巨頭的企業,大部分都是靠商業模式創新取得了成功。
對于用戶,他們根本不關心你的内容是 AI 做的還是人做的,只關心兩個點,内容要麼新,要麼好。
例如,眾所周知《黑神話》,這個遊戲的質量非常高,花了幾億元人民币的成本、工業化的生產,創造出全世界一流的内容,這就是 " 好 "。
對于其他沒有這麼多資金投入的企業來說,你的内容用戶怎麼會買單?那就要 " 新 "。
再舉一個例子,同樣是遊戲領網域,像重慶有一家公司,5 個人,100 多萬投入,最後做了一個戴森球計劃 , 賣了 8 億,就是在内容的形式上進行了創新。
我認為,對于 AI 產品來說,你只要關注你產品的形态是 " 新 " 還是 " 好 ",這樣用戶才會買單。
對于大多數 AI 創業企業來說,產品形式上的創新才是擊中用戶的根本點,而不是說是不是 AI、AI 用了百分之多少。
對于所有 AI 創業企業來說,當下都處在比技術、比指标的階段。我覺得絕大多數 AI 產品都是偏工具類的軟體。在打造工具類產品時,一定要思考整個產品的宗旨是什麼。
例如,在手機剛剛出現的時候,有很多企業做了很多視頻工具、美顏工具,其中有一家做工具類產品的公司,最後成長為中國的一個短視頻的巨頭,他的產品叫 "GIF 快手 ",就是把視頻可以轉成動畫 Gif,好在論壇上、聊天上去傳播。
對于今天的所有 AI 公司來說,我們現在做的都是工具,但我們一定要想,我們的工具怎麼樣通過產品模式和商業模式的創新,成為真正的平台型企業,而不是一輩子做一個工具。
基本上對于所有 AI 公司都一樣,要麼去卷通用人工智能,要麼通過 AIGC 為消費者創作更好的内容,讓消費者可以通過 AI 降低創作内容的門檻和創作内容的成本,更好地塑造和表達自我。
我也希望在座所有企業家和從業者能夠在 AI 時代大潮中抓住自己的時代紅利。
謝謝大家!
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>