今天小編分享的互聯網經驗:大模型競速2024:服務、應用、MaaS,歡迎閱讀。
圖片來源 @視覺中國
文|光子星球
年末的大模型賽道靜悄悄。
既沒有電商領網域的 drama 反轉,也沒有遊戲行業那般的連續地震,除了行業媒體的零星解讀外,相對突破賽道圈層而進入大眾視野的消息,還是字節跳動與百度兩家頭部與海外大模型相互套殼的新聞。
或因大模型在商業化天平的兩端都未曾誕生足夠引領潮流的產品,即使國内 " 百模大戰 " 熱鬧了一整年,但預想中的 "iPhone 時刻 " 仍未到來,以致于市場對相關消息出現了脫敏現象——大模型的推出與後續的刷榜難以再獲取市場關注。
在落地成果出現之前,市場進入了明顯的冷靜期。但不可否認的是,國内的創新仍在發生。過去一年,我們見證了國内大模型從無到有再到枝繁葉茂,其中文領網域能力持續爬坡,以及各玩家在商用落地道路上的諸多探索。
說白了,我們踏上這條道路也僅僅一年時間。得與失的讨論更應該集中在 " 得 " 而非 " 失 " 之上。
頭部公司帶領的三次轉向
亞裡士多德提出的第一性原理認為,萬事萬物都有一個根基性命題或假設,不能缺省,也不能被違背。以此來淺析當下的大模型行業,其數據、算力、能力等維度的攀升顯然是題中之義。
因此,領跑中國大模型速度的是頭部科技企業,數據與算力儲備為他們踏入新時代風口提供了不小的先發優勢。
據不完全統計,國内大模型數量已達 200 以上。共同締造 " 中國速度 " 的先行者是百度、阿裡、字節等頭部互聯網公司。先行者效應下,他們的一舉一動也一定程度上牽動行業的發展方向。
自百度三月發布文心一言起,直至年中時期如騰訊、京東、華為等大廠搭上大模型的班車,這段時間可以說是國内大模型賽道的混沌期。
所謂混沌,是初生的無序狀态。平台類大廠、互聯網大佬與高校科研團三股勢力在 ChatGPT3.5 的爆點後迅速達成 " 生成式 AI 代表未來 " 的共識,以搗鼓出自家的大模型為第一要務。彼時的業内語境中,訓練模型被戲稱為 " 煉丹 ",然而煉的什麼丹、給誰吃、有什麼用以及怎麼用,大多都還處于盲目的狀态。
有人向往 AGI 的星辰大海,有人希望重塑千行百業,有人僅僅只是炒作拉股價。
這段時期内,大模型的中文領網域能力大部分不及 GPT3.5,其價值停留在紙面上,有待發掘。自用戶層看," 松鼠鳜魚法 " 與不少開放測試的大模型一直重復初次回答的糟糕體驗亦是混沌期的小小注腳。
年中,距離開源 " 英雄 "LLaMA 為業界提供了模型結構、訓練方法等标準答案已有 4 個月,夠多個大廠復用其成果。這進一步縮小了國内模型能力代差,GPT3.5 的裡程碑被越來越多的玩家觸及,通用大模型發展進入相對平穩的瓶頸期
與此同時,GPU 供不應求下的算力緊張、大模型廠商的造血内需推動将大模型落在實處的清風逐漸吹起。
在商業化落地不明朗,成本、周期難把控等問題下,大幹快上通用模型被描繪為春秋筆法。此後兩個月是行業大模型的集中發布期。騰訊雲的 MaaS 解決方案、京東產業大模型與華為盤古大模型為賽道的垂直轉向定下基調。
一時間,金融、工業、教育等主要產業的垂直模型如雨後春筍般出現。
在 PMF(產品市場匹配)的第一性要求下,主流範式是只取基礎模型的理解能力與少量對話、推理能力 " 一瓢飲 ",調用大模型時代前的 AI 模型與數據庫獲取結果,最後再由大模型 " 組裝結果 "。
這一模式雖相較基礎模型的萬卡規格相去甚遠,亦一定程度上緩解幻覺問題,但精調、部署的基本流程下依舊剛需數百張 GPU 和不短的時間成本。因而其更像是廠商對大模型落地的迫切與客戶企業的降本需求 " 一拍即合 " 的權宜之計。
此外,一個值得思考的問題是 AI 生產力工具,為我們帶來的究竟是降本還是增效?
針對不同發展階段的企業,AI 工具的能力偏向将顯著影響接受度和滿意度。通過 SFT(精調)行業大模型的範式以快速落地看,企業購買大模型能力并未給業務帶來本質上的增效,而是為既有 AI 工具和模型配上一個大腦。
換言之,此前的行業大模型更偏向于降本而非增效,更适用于收縮期的企業,尤其是已建立起 AI 工具體系的大型企業。那麼行業大模型相對更易向上滲透,抓住大 B 而非小 B 的現狀也就不難理解了。
此後,垂直模型的技術底座持續演進,目前以調用向量數據庫和 RAG(檢索增強生成)兩個 " 外挂 " 為中心軸,不過這是後話了。
今年 9 月,大模型管理辦法實施,聚光燈漸漸有從產業向用戶轉移的趨勢。直至以 PC 為首的消費電子賽道抱上了大模型前進的大腿,既是載體也是入口的智能設備,為大模型在 C 端的商業落地找到全新場景。
自脫離混沌期起,國内大模型玩家就一同走上了產品化的道路。但總體來看,早在 3 月末便提出的主線任務—— MaaS 還處于未發力的狀态。就像早期的行業大模型一般,賽道向外兜售的只是模型能力,而非模型服務。
兩字之差,指向大模型未能從技術價值轉換為生态價值。做個不算恰當的比喻,在 AI 高速公路上,各廠商只能象征性地建幾所收費站。
目前基礎模型底座能力無人稱王,大家同台競技之下無人能站穩生态高位。整體情況導向了兩條 2024 年的大模型掘金之路——模型服務創新與應用。
大廠創企,機會均等
逐鹿九州,是大模型廠商試圖衝擊生态位置的現狀。
只是目前看來,追求模型能力已不是衝擊高位的最優解,就像 Sam · Altman 所言:" 擴大模型規模的收益在遞減 "。
首當其衝的是愈發緊張的 AI 算力,據 Omdia 統計數據,今年 Q3 也就是英偉達發布 GPU 禁令前,騰訊、百度、阿裡三家購入 100 系 GPU 的數量分别為 50K、40K 與 25K,三者相加也不及微軟和 OpenAI 其一。
另一方面,OpenAI 雖給出 Scaling Law(模型能力雖訓練計算量提升的擴展定律)來解釋大模型之 " 大 ",但包括算力、人力、電力等在内的成本側已無法容忍過多資源投入僅為百尺竿頭更進一步,這一點基本已是業内共識。
大力不能出奇迹,意味着大廠先發的算力、規模等優勢正在逐漸消弭。
從 AI infra 來看,規模效應遞減的根源在于算力緊張與數據敝帚自珍。但自技術層面,更多問題已經成為南牆:有毒内容與幻覺尚未有解法、AI 前沿為商業公司把持後,開源程度日益遞減等。
參數量的頂級規格已經停留在萬億量級許久,玩家們開始思考如何通過巧思而非大力來推動 AI 行業向前。
一條路徑是 " 小而美 ",曾有傳言稱 GPT4 是由十數個 MOE 小模型聚合而成,MOE 也成為當下微軟、谷歌等頭部企業競逐的新領網域。尤其是其和端側設備的結合,新時代 AI 硬體有着足夠的想象空間。
大模型的軟硬體生态從結合到協同的發展速度令人咂舌。今年初,大模型語境中的模型訓練還是萬卡集群,年末時候,高通骁龍 8 Gen3 便展現了百億參數模型的端側運行能力。國内已有 OPPO、vivo、小米等手機廠商推出端側模型,其服務與應用或将于 2024 年全面爆發。
另一條路徑是 Long Context,模型能力突破艱難的情況下,讓模型底座發揮作用的慣常範式是 SFT,然而訓練成本掣肘,長文本的 Prompt 有可能在向量數據庫與檢索增強生成的基礎上徹底消磨精調的存在。
回首創企,智譜 AI、月之暗面、百川智能等創業獨角獸也攜 AgentTuning(智能體增強)、Long Context、RAG 等獨特的模型服務創新嶄露頭角。
創業公司的 " 破壞性創新 " 能力早在此前的商業史上便屢有驗證。由 " 生成式 AI" 代表未來這一基本共識發散開來的不同技術路線昭示着更多樣化的 AI 未來圖景。
重塑開發生态
OpenAI 塑造了 2023 年 AI 賽道關于大模型的共識,追趕的旋律就此開始譜寫。此後的 GPT4 以及 GPT4V 的出現更讓人深感大山似乎不可逾越。
但近來發生的兩件事情,終歸給到國内玩家們希望。
先有《The Verge》報道字節跳動因使用 ChatGPT 的 API 以訓練自家大模型,因而遭 OpenAI 予以 " 封号 " 處理;後有谷歌最新發布的 Gemini-Pro 承認在中文領網域訓練中使用了百度文心一言的數據。
不出意外,重復造輪子的基礎模型之争于此踩了一下刹車,而數據集的價值再次被放大。随着推特、Reddit 等移動平台關閉免費的 API 接入點,在不遠的未來,或許通過數據采集器搜集平台數據用于 AI 訓練的 Pretrain 模式将徹底成為歷史。
進一步說,字節套殼 GPT 亦或是谷歌套殼文心一言,本質上是模型架構的趨同與數據價值的躍升。那麼中文高質量數據實際上也是國内大模型的護城河。
在此基礎上,我們更不需要擔心模型層會落後于海外過多。反而是在應用層面,百花齊放才是 AI 時代應有的面貌。如此來看,李彥宏一直反復唠叨," 我們不需要這麼多基礎大模型,我們需要更多應用 " 的說法有其合理性。
應用本身是商業化落地的終極載體之一,更重要的是應用的開發過程——率先構築完善 AI Native 應用開發生态的基礎模型廠商将搶占生态價值的高位,推動自家大模型的價值從技術價值轉為生态價值。
典型的案例便是蘋果稅,或是手遊行業眾所周知的安卓渠道商。只是移動生态早已固化,遠非當下 " 百模大戰 " 的混亂可比。
如果我們沿用上文的比喻,當下大模型廠商加碼模型能力,試圖做 AI 高速公路收費站,或許現在更需要的是收費站中間的服務站。完善的應用開發工具鏈所構築的開發生态能極快加速爆款應用的出現時間。
12 月 20 日,百度副總裁侯震宇将 AI 原生應用開發新範式定義為 AI Native 應用生态的關鍵組件之一,百度亦再次迭代應用開發工具鏈并推出了 AppBuilder,正如文心一言發布時一般搶先了一個身位。
可以預見的是,我們也将很快看到除百度外的玩家通過新場景、新系統共同打造新的開發生态。
即使 AI 應用開發生态的必然性前置會讓應用爆發的時間節點稍為後置,但考慮到今年大模型的 " 中國速度 ",2024 年基本可以确定是 AI 應用噴湧之年。
目前來看,國内 AI 社交、AI 遊戲的發展已初具規模,更多賽道正在接受 AI 的改造,重塑應用的生產力與生命力。AI 加入後是否會變更賽道既往的商業模式,是產品經理迫切需要解決的 Konw How 。
我們确定,2023 年的結束并非大模型周期的結束。或許我們仍會為 GPT 等海外大模型的能力提升而感到壓力,但我們也能還之以應用層的創新。而不再時刻盯着 OpenAI 的中國大模型,也将真正走出屬于自己的道路。