今天小編分享的科學經驗:明線與暗線:讀懂雲廠商鏖戰大模型,歡迎閱讀。
天氣轉涼,夏天即将過去。如果有人問,雲計算廠商在這個火熱的夏天做了什麼。答案是,他們做了三件事:大模型、大模型,以及大模型。
7 月,在華為開發者大會 2023(Cloud)期間,華為雲公布了盤古大模型 3.0,随後進行了生态等方面的更新。而在此前更早時候,阿裡雲公布了通義千問大模型,并在 8 月 3 日宣布其正式開源。
來到 9 月,雲計算廠商的大模型發布更加密集。9 月 5 日,百度智能雲在 2023 百度雲智大會發布了千帆大模型平台 2.0,進一步集成百度的文心系列大模型,只隔兩天,騰訊就在 2023 騰訊全球數字生态大會發布了混元大模型,其主要出口則是騰訊雲。
至此,中國幾大雲計算廠商可以說是在大模型領網域重兵集結。相較于 AI 算法公司與研究機構,雲計算廠商做的大模型更貼近產業與應用的一線,而且大模型與雲廠商原本的業務體系、營收模塊有着相對復雜的關系。因此,雲廠商的大模型之争,絕不是簡單的模型之間技術對比。
那麼,雲計算大廠做大模型究竟是為什麼?雲 + 大模型之戰的決勝點在哪?
本文中,我們希望通過多個層次的對比與梳理,和大家一起解答這個問題。
首先要明确兩個前提:一是伴随着各行業 IT 投入的降低,雲計算廠商普遍面臨着增速放緩,營收不利的情況。根據 IDC 報告預測,未來五年中國雲計算行業的平均增長速度将下調 10% 左右,雲計算廠商的正在普遍降低業務預期。因此,大模型突然爆火,對于雲計算行業來說是難得的視窗,這個機會或許利益沒有想象中大,但目前也不得不做。
另一個情況是,從用戶界面來看雲 + 大模型的需求是十分復雜的。有的用戶需要直接調取模型,有的用戶需要 AI 算力來自己訓練模型,還有用戶需要大量的模型定制化與解決方案集成。因此雲廠商做大模型并不是很多人想象的短兵相接白刃戰。大模型相關業務,需要面向多個市場,多種商業模式。這場賽事更像是一場陣地戰,各個戰略節點都不能出現缺口。
在這場大模型鏖戰的各個層面,都有一條明線和一條暗線在牽引着局勢的發展。
IaaS 層:明線堆卡
暗線啟動國產 AI 算力
大模型帶給雲計算廠商最直接的變化,其實并不來自于模型本身,而是大模型火了之後,湧現出來的大模型熱潮需要龐大的 AI 算力。大模型數據規模巨大,且訓練模型需要專屬的 AI 算力,這就給雲計算服務商短期帶來了用雲量的更新。在雲計算 IaaS 層市場整體相對低迷的情況下,大模型的出現也算是注入了一針強心劑。
這個層面上雲計算廠商的競争節點,用一個詞概括就是 " 堆卡 "。誰能提供充沛少排隊,且盡量價格低廉的 AI 算力,誰就算赢了。而 AI 算力的來源主要是英偉達的 GPU,于是就出現了雲計算廠商買空市面上 GPU 的現象,以及 " 雲廠商都是給英偉達打工 " 的說法。
但不管怎麼說,雲計算廠商在 IaaS 層的堆卡競賽都不會結束,大量用戶依舊會以計算成本和計算效率來作為選擇公有雲 AI 算力的考量依據。這個層面上,雲計算廠商就需要提升在計算集群性、計算兼容性方面的能力,盡量發揮出每一張 GPU 的價值。
比如說,百度智能雲就承諾在萬卡集群訓練大模型時,有效訓練時間達到 95% 以上,從而降低用戶的訓練時間成本,實現更好的計算加速比。阿裡雲則提出了能夠支持高達十萬卡 GPU 的單集群規模,可讓多個萬億參數大模型同時在線訓練。
而在堆卡這條明線之外,雲 + 大模型在基礎設施層的競賽其實還有一條暗線,就是 AI 算力的國產化。
不久之前,英偉達高端 GPU 面向中國市場供應鏈不穩定的消息沸沸揚揚,後來又傳出了 " 中國特供版 GPU" 價格貴、性能低的問題。這些現象愈發讓各界看到了 AI 算力走向自主可控的必然性。
在這輪大模型熱潮中,AI 算力的國產化與雲上獲取從趨勢變成了現實。其主要方式有兩種,一種是雲計算廠商兼容更多的國產芯片,提供多樣化的 AI 算力。比如騰訊雲、百度智能雲等廠商都在強化自身的國產軟硬體兼容性,并且構建 AI 計算的相關生态。
在這一點上,華為雲擁有天然的優勢。受到制裁後的幾年裡,華為逐漸将自主 AI 計算生态做大做強,已經成為國產 AI 計算中比較成熟的一支。伴随着盤古大模型的更新,華為雲同時宣布将提供自主化的 AI 雲服務,為大模型訓練提供算力底座,這意味着華為的自主化 AI 算力正式由線下走上雲端。
強調大模型、AI 框架的自主可控已經是大勢所趨。接下來,有理由相信公有雲 + 國產 AI 算力的模式,将在宏觀趨勢的推動下持續向上。最終成為左右 IaaS 市場的關鍵變量。
模型層:明線 MaaS 落地
暗線降低訂制化成本
從產業層面上看,大模型帶給雲計算的最大變化是什麼?就目前情況來看,MaaS 的新商業模式是雲廠商最為看重的一點。所謂 MaaS,是指雲廠商直接向用戶輸送 AI 大模型,從而實現模型即服務。
至少在目前的開局階段,各家雲廠商對 MaaS 這個全新模式寄予厚望,甚至有廠商直接用 MaaS 替換了此前的 SaaS,似乎經歷了久久為功之後,SaaS 模式終于要被雲產業放棄了。這也難怪。畢竟在中國市場 SaaS 的客單價較低,但需要進行的定制化工作卻很多,并且異常消耗後期服務。以大廠的綜合成本來看,SaaS 始終難以擺脫食之無味棄之可惜的雞肋定位。
既然如此,還不如轉頭擁抱更加火熱的大模型。于是可以看到各個雲廠商在 2023 年集體發力 MaaS 的新商業模式,并且為此做出了系列工作。
進軍 MaaS 的第一階段,雲廠商主要布局在三個方面:
1. 基礎模型要多且精,能夠滿足用戶在 NLP、CV、多模态等幾個大方向的多樣性需求。同時,基礎模型還是雲廠商的大模型門面。基礎模型的體驗,決定着用戶與開發者對雲廠商大模型能力的第一印象。比如文心一言的火爆,就給文心系列大模型與百度智能雲的 MaaS 服務帶來了明顯的品牌加持效應。
2. 重點領網域要重點覆蓋,在可能被高頻次調用的行業類别與應用類别上,廠商要盡量做出成熟的大模型,以及基于大模型開發的應用,盡量實現低門檻集成與開箱即用。比如騰訊雲的行業大模型精選商店,既提供混元大模型,還上架了金融、文旅、零售等 20 多個領網域的行業大模型。行業大模型,已經成為 MaaS 模式的中堅力量。
3. 要提供充沛的工具能力。除了基礎模型、高頻定制模型之外,還有海量的大模型需求。這要求用戶和開發者具備一定的開發能力,而雲廠商需要提供模型精調、應用開發方面的工具鏈。比如百度智能雲的千帆平台,就在模型之外還提供預制數據集、應用範式,以及其他幫助企業應用大模型的工具。
但看似如火如荼的 MaaS 模式,實則也隐藏了一個暗線問題:SaaS 不賺錢,于是轉頭擁抱 MaaS,但誰說 MaaS 就賺錢了呢?
雲廠商做 AI 也已經很多年了。但結果往往是效果很好,利潤很差。這其中的關節依舊在 SaaS 失速的那個關鍵原因上:定制化成本。
無論是企業應用 AI 還是現在應用大模型,本質上都難逃 AI 作為軟體的不确定性。不同企業之間的不同需求天差地别,加上 AI 在算力、數據與人才上都有極高的成本,任何定制行為都會產生一連串的連鎖反應。專家下工廠聽上去很美,但說一千道一萬,工廠最終是無法負擔專家薪資的。但如果不提供定制化,又會出現絕大多數 AI 需求無法被滿足的尴尬。
于是,怎麼從頂層設計階段就降低 MaaS 模式可能產生的定制化成本,已經成了大模型一戰最為核心的競争暗線。
在這個方面,各家廠商的探索幅度與實現方式各不相同。比如百度智能雲更傾向用預置模型、預置應用的方式來降低定制化。除了模型平台之外,百度智能雲還發布了 "AI 原生應用 Family",通過模型 + 大模型應用的模式讓企業滿足自身需求。
在這方面,目前探索幅度最大的是華為雲。華為雲的盤古大模型 3.0,從框架設計上搭建了一個 "5+N+X" 的三層架構。這個架構把大模型分為 L0、L1、L2 三層體系。其中 L0 層包括 NLP、CV、多模态、預測、科學計算五個基礎大模型;L1 則是 N 個行業大模型,比如政務、礦山、金融等;L2 是面向各行業的細化場景模型,比如先導藥物篩選、傳送帶異物檢測等。
這個框架的設計理念,是用戶和夥伴、開發者可以根據自身需要,調用不同等級的模型進行組合拼裝,既可以直接調用集成模型,也可以基于模型進行精調,還可以獲得由不同開發者訓練的具體場景模型。這一思路的設計形式,就有了工業革命中模塊化、零部件化的特征,而具體效果如何,還有待在產業中檢驗。
整體而言,雲廠商在 MaaS 上最讨厭的就是定制化高、復用度低、後續服務工作量大的需求。這會把原廠有限的資源過度分散,最終回報難以達标。這也就是雲計算行業經常讨論的 " 小作坊式 AI 開發 "。
在目前階段,雲廠是可以在 MaaS 上只投入,不產出的。但長遠來看,從小作坊到流水線的改變能否實現,是決定 MaaS 生死的背水一戰。
生态層:明線聚合眾力
暗線開源之争
我們需要接着說大模型那個問題,定制化成本太高。正因為定制成本高,單一服務商的綜合資源有限,因此雲廠商必須把大量工作分包出去。要由合作夥伴來完成咨詢、服務、分銷等工作。否則原廠會被漫長的流程與巨大的服務成本反復折磨。這也就導致,在走向 MaaS 模式的時候,雲計算公司比以往更加需要夥伴生态的搭建。
另一方面,雲廠商在目前不僅需要夥伴,開需要盡量聚攏應用開發者。AI 大模型是個新東西,其能誕生的新應用模式具有很大的想象力。就像 iPhone 時刻有賴于大量的 APP 開發者,大模型這個 " 新 iPhone 時刻 " 也有賴于大量具有突破能力的 AI 開發者。為此,互聯網大廠一方面在自己做應用,另一方面也需要聚攏更多應用開發者。因為任何應用火了,都會為提供基礎模型與算力的雲廠商帶來一系列連鎖效應。
這些因素綜合起來,讓雲 + 大模型之戰,在最開始就變成了一場生态争奪戰。各個廠商可以說是擺開陣勢,盡一切可能來吸引夥伴和開發者加入自身的生态體系。其中,基礎措施是提供開發者與夥伴所需的技術與能力,進階模式則是推動基于大模型的技能培訓、應用開發大賽、免費資源、聯合創業計劃,在商業層面賦能夥伴和開發者。也有雲廠商主張與夥伴進行全網域協同,聯合創新,在細分市場與細分場景中以夥伴為主進行大模型落地。
而在如何吸引開發者、夥伴的生态之争中,隐藏暗線是一個非常具有互聯網思維特征的命題:能不能幹脆把模型開源免費,用極端降低成本的方式來吸納夥伴加入?
這也是最近被熱烈讨論的 " 大模型開源閉源之争 " 其來源之一。
支持開源者認為,免費就是最好的生态聚合策略,且靠免費引流的策略在互聯網時代屢試不爽。加上 AI 大模型作為基礎軟體,走向開源恐怕是早晚之事。
而反對者認為,大模型還處在剛剛發展的階段。廠商需要持續投入大量研發成本進行更新,盲目的免費會導致大模型發展陷入停滞,攪亂科技進步秩序。并且大模型開源不僅能降低夥伴和開發者的成本,也會導致市場最終定價降低,攤薄夥伴的利潤,最終導致企業不願意投入研發創新。
不管怎麼說,大模型開源與閉源的對壘,已經從產業探讨變成了雲計算市場的現實。8 月 3 日,阿裡雲宣布通義千問開源,成為首個宣布大模型開源的中國互聯網雲廠商,并且阿裡雲打造的 AI 模型社區魔搭 ModelScope 還以開源、免費、可商用作為主要買點,提供國内外的各種開源大模型。
此後,究竟是越來越多的雲廠商在鲇魚效應下走向開源,還是依舊會保持高技術與低成本之間的對壘?讓我們拭目以待。
以我個人觀點來看,大模型的發展潛力還很大,可探索空間眾多。處于發展中的技術其實并不适合快步走向開源,因此相當部分的大模型保持閉源商業模式,是一個更大概率事件。
解決方案層:明線首批大客戶
暗線政企上雲新視窗
無論說的多麼熱鬧,其實企業直接通過 API 接口調用大模型,這種 MaaS 服務模式的利潤并不高。甚至可以說,在目前 " 百模大戰 " 的背景下,簡單調用大模型變成了一件頗為廉價的事情。
而持續投入的雲計算行業,顯然不能滿足于這種商業模式,因此必然要争取一些客單價高,利潤大的項目。而政企大客戶選用基于大模型的數字化解決方案,就成為了雲計算廠商眼中的新機會視窗。
在眾多類型的政企大客戶中,又有錢,又有數字化能力,且願意盡快探索大模型可能性的只有兩類:智慧城市與金融。其他更偏向實體的制造、能源、交通等行業,則相對來說更加謹慎,還處在對大模型的觀望了解之中。
因此,争奪政務與金融大客戶訂單,就成為了雲計算廠商進入大模型賽道後的一個标準動作。比如我們可以看到在 2023 百度雲智大會上,百度智能雲發布了基于大模型的數字政府解決方案九州。華為雲則在強化和推廣金融、智慧城市等領網域結合盤古大模型的解決方案。
在可見的未來,雲計算廠商除了在模型能力與模型平台的競争之外,還将在以城市、金融為代表的重點領網域進行争奪。而回答好這些領網域為什麼需要大模型,大模型能帶來哪些與以往不同的價值,是雲廠商必須回答的第一道考題。
在為大客戶構建解決方案層面,也隐藏着一條暗線。這條線索直接關乎于雲計算廠商的焦慮感:大型政企客戶,不那麼願意上雲了。
在幾年前,大型政企上雲是一種大勢所趨,可謂是能上盡上,多上快上,但在目前階段,政企客戶更加強調數據與數字化系統的安全可控,盲目上雲被認為并不可取。尤其是否能把大量關鍵數據放互聯網雲平台上,開始逐漸變成一種疑問。目前階段,國資雲、國家雲的提法不斷強化,即使上雲,大型政企也會優先考慮以我為主,多雲采購的策略,而這在無形中就分散了雲廠商的利潤空間。
在這樣的背景下,雲廠商對大模型的一個隐性期待,是能夠讓其成為推動大型政企繼續上雲的技術契機。畢竟在雲上獲取大模型,有天然的成本與可操作性優勢。
因此,能不能更好展現出大型政企、重點實體行業部署大模型解決方案的重要性,同時打消政企在數據安全、自主可控、持續服務、品牌信任等領網域的疑問,就成為了雲廠商鏖戰大模型的另一道必答題。
事實上,雲計算與大模型的結合,還有很多賽點可以讨論。比如大模型與 PaaS 的結合;雲廠商在辦公、網盤等 toB 應用結合大模型的情況等。整體而言,算力、MaaS、生态、大型政企解決方案,構成了雲計算廠商能否在大模型之戰中獲得競争力的四個層面。
無論對于哪家公有雲廠商來說,這場競賽的目标都是一致的:讓模型有用,讓成本下降,讓 AI 成為盈利的起點
大模型最終會變成又一個雞肋,還是新時代的大門?路漫漫其修遠兮,雲計算還需要上下求索。
>