今天小編分享的互聯網經驗:騰訊“散裝”大模型,歡迎閱讀。
圖片來源 @視覺中國
文|光子星球,作者 | 吳坤諺,編輯 | 吳先之
大模型浪潮下的互聯網行業暗流湧動,大家都在翹首以盼誰能率先跑出中國 GPT。
百度、360、阿裡、昆侖萬維、商湯、金山、科大訊飛 ...... 即使抛去高校國家隊和創業公司,已經在大模型領網域秀過肌肉的大廠也能拉出一張清單來。中國科技巨頭歷來喜歡追逐風口,大模型的航海時代自然也不會免俗,但有那麼一家巨頭卻很沉得住氣,至今未曾露出什麼大動作。
作為早在 2022 年 4 月便正式亮出旗下混元大模型的騰訊,在計算機視覺、自然語言處理、多模态内容理解、文案生成、文生視頻等多個方向均有所建樹,如今卻給外界一種 " 失聲 " 的感覺。
自今年 2 月起,騰訊在大模型領網域為外界所感知的大動作僅有兩次,一是 2 月 27 日針對類 ChatGPT 對話式產品已成立「混元助手(HunyuanAide)」項目組,騰訊史上最高專業職級擁有者張正友為項目 Owner;二是 4 月 14 日發布新一代 HCC(High-Performance Computing Cluster)高性能計算集群。
在友商紛紛下場展示實力與聲量,争取在大模型時代獲取更多認知,騰訊的失聲很可能是一部慢,步步慢。更有意思的是,騰訊控股自 3 月 29 日起便跌跌不休,以 Naspers 為首的大股東更是在持續減持套現,這興許也是資本市場對騰訊在大模型賽道失聲現狀的不滿情緒體現。
難道,騰訊還在 " 等風來 "?
" 失聲 " 是表象
北上廣不相信眼淚,互聯網大廠只相信效率。即使是 OpenAI 這個不停燒錢的公司也會不時對外放出一些意見以及信息,在信息爆炸的現代社會中試圖短暫地獲取關注力,而騰訊也是如此。
我們不妨以 2 月 27 日為節點,從騰訊對外宣布的動作中尋找其大模型訓練進度的蛛絲馬迹。據光子星球不完全統計,騰訊自 2 月 27 日起至今的動作集中在三方面,一個是 AI 商業化應用,另一個是視頻号,最後是政企合作。
細數下來,其實騰訊在各方面的動作并不小。除了分别于移動、聯通兩大運營商達成雲計算方面的合作外,3 月 30 日,騰訊發布 AI 智能創作助手 " 騰訊智影 "。4 月,騰訊在上海智慧車站前夕發布智慧出行汽車雲,發布了據稱是國内性能最強的大模型計算集群,還與字節跳動破冰,探索視頻合作。當時間到了 5 月,騰訊微視面向頭部的抖音、小紅書與快手招募創作者,于 5 月 9 日發布了 " 開悟 "AI 開放研究平台,更是開放 QQ 渠道為載體,讓 AI 繪圖工具 Midjourney 開啟官方中文版内測。
與率先發布通用大模型并展開應用探索的諸位友商相比,騰訊的聲量雖小卻也談不上 " 安靜 "。而且其中無論是 " 開悟 "AI 開放研究平台、" 騰訊智影 "AI 智能創作助、計算集群的發布還是 Midjourney 相關動作,其實都與大模型訓練有不小的關系。
智慧出行汽車雲是基于雲服務以及 AI 訓練的 " 車雲一體 " 服務," 開悟 " 本身是由 AI Labs 聯合王者榮耀項目組推出的,本身是借用遊戲場景進行 AI 訓練的平台;" 騰訊智影 " 這款支持虛拟數字人、文本配音、智能 AI 繪畫、文章轉視頻的應用本身也屬于大語言模型的功能範疇;Midjourney 開放内測是對 AI 原生應用于 C 端落地的探索;高效的計算集群更是在大模型訓練中不可或缺的基礎設施。
再往下深挖,這三個項目其實也分屬騰訊内部不同事業群。" 車雲一體 " 屬于 CSIG(雲與智慧產業事業群)," 開悟 " 屬于 IEG ( 互動娛樂事業群 ) ," 騰訊智影 " 應屬于 WXG(微信事業群),大模型計算集群分屬 TEG(技術工程事業群),QQ 的應用探索屬于 SNG(社交網絡事業群)。
這不免讓我們聯想到騰訊特色的 " 内部賽馬 " 機制,這是在過去的騰訊業務線中,不同競品之間養蠱最後确認勝者的流程。而光子星球自某位接近騰訊人士處獲悉,CSIG、TEG 與 PGC 均在訓練業務範圍内的大模型。
但考慮到大模型訓練極高的投入,内部賽馬将造成更大的沉沒成本。因此,目前的 " 賽馬 " 現象更大可能是 TEG 統領全局,由各個 BG 提供語料以及數據集标注,為各 BG 的業務線打造專屬模型,最後再通過知識蒸餾匯總到混元 AI 之中。
這樣的戰略布局好處很明顯,既可以最大限度調動全局并提供高質量數據集,也能在長時間的模型訓練中探索商業場景落地的可行路徑。但弊端也同樣顯著,大型組織架構中各個 BG 難以相互配合,龐雜組織架構難免的山頭林立也讓成果互通變得困難。
" 我們最開始以為這是互聯網十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇。所以我們覺得(AI)非常重要,但這的确需要有很多的積累 ",結合 Tony 在騰訊一季度财報會議上的講話,騰訊在試圖對外解釋自己的 " 不緊不慢 ",但在各家發力開卷的當下,未曾透露具體進度的回應總歸顯得有些蒼白。
不受待見的 AI Labs 走上風口浪尖
無論最終騰訊通過田忌賽馬落地了多少個 BG 的大模型應用,最終的目的一定是保證最頂端的 " 混元 " 能夠幫助騰訊在 AI 時代站穩腳跟,甚至再現移動互聯網時代的社交輝煌。
于是,一直以來在組織架構中顯得有些邊緣的 AI Labs 踏上舞台中央,享受着最集中的資源同時也承受着前所未有的壓力。
這是因為,以騰訊 AI Labs 以及阿裡達摩院為代表的大廠 AI 研究實驗室通常進行的是較為前沿且高通用的算法研究,研究成果通常會通過 API 接口或 SDK 形式對其他 BG 輸出,而業務性強的具體場景一般都需要算法的定制化,按需制作。相比以主導者的身份統籌業務 BG,更多的可能是以中台的定位幫助業務 BG 打造搭載前沿技術的產品。
光子星球自一位接近騰訊人士處了解到,AI Labs 一貫給其他 BG 的印象便是 " 不幹實事、論文灌水 ",之所以會讓同僚們產生如此刻板印象, 是因為許多前沿研究僅有成果而未能投產," 并非研究人員劃水 "。其中比較典型的是經過 AI Labs 多次優化後的智能音箱,作為騰訊 20 周年慶的員工禮物于内部送出的同時項目也面臨叫停的風險。
據了解,智能音箱項目于 2018 年 4 月上馬,隸屬于當時騰訊移動互聯網事業群(MIG)旗下的智能創新業務事業部,其發布首日便在京東商城取得了兩萬台的首日銷量。只是在智能音箱項目上線後 8 個月,CSIG 作為當時騰訊的業務重心也推出了自己的智能音箱項目叮當帶屏音箱,項目劃分問題與不同 BG 間微妙的 " 市場競争 " 關系耐人尋味,這或許也是智能音箱項目被叫停的原因。
" 當一群本應專研算法,頭腦風暴公司下一階段核心競争力的組織疲于應付各個業務 BG 的產品,甚至下場田忌賽馬,即使如此還是不能落下學術產出,(公司)還能指望它做得多好?" 一位接近騰訊人士說。
技術變現是大廠技術部門的永恒命題,關鍵在于着急與否。一位咨詢顧問告訴光子星球,相比于進入大廠的中台,淪為 " 算法外包工 ",無論是進入工業界的業務部門還是轉身高校專研學術,都是性價比更高的選擇。這或許也解釋了曾經騰訊 AI Labs 主任、斯坦福博士張潼于 2018 年 12 月離職并重返學術界的原因。
如果未曾出現大模型這樣目前公認的通往 AGI 的切實路徑,AI Labs 可能也不會走上風口浪尖。只是中台的角色定位不變的話,沒有強有力的話語權支撐,AI Labs 能否完成組織交付的任務還是要打一個問号。
畢竟曾經展開中台這個故事的阿裡已經通過分拆上市解構了中台神話,就像亟需數字化的中小企業中業務部門與 IT 部門相互不對付,中台與各事業群之間的微妙關系已然讓互聯網企業組織架構走進了一個死胡同。
成也賽馬,敗也賽馬?
人都是經驗的奴隸,如果說 AI Labs 為中台乃是騰訊發展至今的慣性使然,顯然這樣的慣性并不止一種。其中比較典型的是騰訊長期坐鎮南山巍然不動," 把半條命交給合作夥伴 " 的投資擴張邏輯,以及眾所周知的内部賽馬。
在 MaaS(model as a service)愈發為人所重視的當下,大模型如果可以被視作一個產品的話,極大可能是通往新世界的船票。因此在大模型賽道,騰訊想必不會将哥倫布的角色拱手讓人,尤其是模型層,只是在應用層可能會依靠合作夥伴建立生态圈,遠有微信上的豐富應用,近也有 QQ 上開始内測的 midjourney。
至于騰訊為何選擇 QQ 生态而非微信生态,可想而知的原因可能是 QQ 用戶群體相對年輕化,而且在 PC 端的產品呈現上顯然是 QQ 更勝一籌。此外,這一選擇也存在強烈的 " 試水 " 性質,畢竟 midjourney 本身還未曾以成熟的產品形式呈現,在 QQ 之前,僅以 API 形式接入了 discord。
更值得一提的是大模型賽道的賽馬,曾經賽馬跑出的神話實際上早已在算法時代為頭條系的崛起而破滅,因為賽馬機制本質上是建立在冗餘前提下,通過資源優勢以面找點,重復造輪子,有點類似于數學中的窮舉法。之所以神話破滅,是在于賽馬在保險的同時也讓騰訊喪失了曾經的敏捷,最典型的便是短視頻應用至今只跑出來了視頻号這個全村的希望。
不過,大模型賽道的賽馬說不定還真能行。
因為大模型訓練非一夕之功,更不是某個強烈需求敏捷能力的垂類。重資產投入、試錯成本高昂的預期以及應用層呈現的千奇百怪很大程度上彌平了賽馬機制的缺陷,一方面是應用多樣化避免了重復造輪子造成的資源浪費,另一方面是大模型特有的知識蒸餾讓試錯不再可怕,即使 OpenAI 珠玉在前,大家對國内的各家大模型仍抱有寬容的态度,無論是公眾層面還是公司内部。
所幸新一輪的賽馬或許不需要決出個勝負,更重要的是勝負之外的結果。騰訊也應該感謝 OpenAI 開啟的新時代,一個不再追求短平快,連方向路徑都已昭然若揭的時代,讓缺乏敏捷、缺乏對核心抓手的嗅覺的騰訊重回棋盤之上,與競對一起自天元落子。
只是大模型也并非萬能,最起碼,騰訊組織架構的頑疾以及整體戰略上的模糊尚待調整。
如果希望 AI Labs 是騰訊這艘船的哥倫布,那麼拆除組織架構内的部門牆以及重塑對創新的态度将是重中之重。例如光子星球自一位接近騰訊人士處了解到,AI Labs 曾出走多位頂尖人才,他們曾經在騰訊内部的創新成果也在出走後落地多個垂直領網域,甚至其中不乏龍頭的存在。
如果希望 AI Labs 這位哥倫布能真的發現新大陸,起碼需要堅定地朝着正确方向前進。這一點恰是騰訊在開啟賽馬之路後丢失的能力,因為賽馬的本質在于有力卻不知何處使。現在的騰訊能否在賽馬機制的路徑依賴下突破以面找點,以各個 BG 在應用層積累的數據庫為基礎,在高效協同之下跑出一個大模型來,我們還在等待這份答卷。
只是留給騰訊的時間可能不多了,随着夏季到來,今年又恰是厄爾尼諾之年,用電問題将愈發嚴峻,屆時大模型訓練想必會受到不小的影響。
一步慢可能步步慢,賽馬機制在短視頻上的失敗讓曾經的 " 後發先至 " 從神話變成遮羞布,大模型将是騰訊能否正視自身問題,向世界證明自己仍具備打硬仗能力的最好機會。畢竟,就算是在騰訊如今最重視的市值管理上,大股東們還在減持套現。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App