今天小編分享的互聯網經驗:AI大模型落地,為什麼是央國企先行?,歡迎閲讀。
文 | 產業家 ,作者 | 思杭,編輯 | 皮爺
從 2024 年 1-7 月,央國企采購大模型項目數量已超過 950 個,且均勻布局在智算中心、大模型預訓練、Agent 和行業應用等多個方向。而除了政策影響,央國企紛紛落地大模型的背後還有哪些推動因素?
最高 191 億元,最低不到 1 萬元。大模型狂飙兩年,國内 "AGI 陣隊 " 已然形成。同步進行着的,還有央國企的大模型項目建設。
8 月 6 日,神州數碼集團發布公告表示,子公司神州鲲泰得標《中國移動 2024 年至 2025 年新型智算中心采購(标包 1)》,投标報價約 191 億元,得標份額 10.53%。2024 年 7 月,湖南省委黨校湖南行政學院發布招标信息,采購數字機器人服務,報價 9000 元。
一個是智算中心采購,一個是數字機器人服務;可以看到的是,如今在央國企内部,大模型項目建設已行至中途。甚至毫不誇張地説,在大模型浪潮席卷而來的今天,央國企正在成為一股先行力量,推動着國内大部分的 AI 大模型落地項目。
據不完全統計,從 2024 年 1-7 月,央國企采購大模型項目數量已超過 950 個,且均勻布局在智算中心、大模型預訓練、Agent 和行業應用等多個方向。
大模型紛紛落地國央企,陣勢如此浩蕩的背後,政策推動成為決定性因素。據沙丘智庫,自 2023 年以來,國資委多次對中央企業發展人工智能提出要求。其中,在 2024 年 2 月的中央企業人工智能專題推進會上,提出中央企業要 " 開展 AI+ 專項行動 "。會上就有 10 家央企籤署倡議書,表示将主動向社會開放人工智能應用場景。
同年 7 月,國新辦舉行 " 推動高質量發展 " 系列主題新聞發布會,提出未來五年,中央企業預計安排大規模設備更新改造總投資超 3 萬億元,更新部署一批高技術、高效率、高可靠性的先進設備。
政策的推動,當然是其中不可忽視的因素。但除了政策影響,站在產業數字化和數智化的潮頭,央國企紛紛落地大模型的背後還有哪些推動因素?一個更值得思考的問題是,和雲計算時代金融行業成為先鋒官不同的是,在如今的 AI 大模型時代,為什麼央國企會成為先行力量?
運營商、政務、能源搶先建設智算中心
AI 大模型史上最大項目,當屬 " 智算中心 "。
預訓練成本的瘋狂上漲和推理需求的不斷攀升,都在讓智算中心成為必要。近日,OpenAI CEO Sam Altman 在接受采訪時表示,"OpenAI 在年内不會發布 ChatGPT-5,目前公司專注于 ChatGPT-o1 的研發和運營。"
GPT-5 為什麼不發了?原本預計推遲發布的 o1 又為什麼提前登場?這背後的原因不由得引人深思,而訓練成本就是這其中的關鍵因素之一。
言歸正傳,國内對大模型的預訓練需求也愈加迫切。在加速構建國内 AGI 梯隊的同時,性能不斷刷新的大模型需要大規模智算集群的支撐。如今,萬卡集群已然成為大模型軍備賽的标配。而除了國内 AI 企業和電信運營商,正在推動落地的央國企也在加速構建智算集群,以提高 AI 大模型的訓練及推理效率。
通常來講,智算中心是由地方政府或電信運營商主導建設。據中國信通院不完全統計,截止 2024 年 7 月底,納入監測的智算中心(含已建和在建)已達 87 個。
2023 年 10 月,沈陽智能計算中心新基建項目工程總承包(EPC)成交結果出爐,百度攜手中國建築第八工程局有限公司(中建八局)成功得標,得標金額為 9.1 億元。具體包括機房建設、機櫃設計、智算中心平台,以及百度為其提供的 AI 軟硬體能力的綜合性解決方案。
而像這樣的智算中心采購項目,央國企已經開始了鋪天蓋地的建設。對此,產業家根據金額大小,列舉了近兩年央國企采購智算中心項目金額最高的 10 個。
對比雲計算時代,傳統數據中心的得標方大多都是 IDC 廠商;而在如今的 AI 時代,則多了不少 AI 企業和互聯網廠商的身影。
另外,從行業分布來看,政務和運營商對智算中心的出資則更加大手筆。對此,產業家統計了運營商、能源和政務三大領網域中智算中心項目的占比:結果顯示,政務行業對智算中心的投入更大,其中包括 GPU 租賃、硬體以及算力調度平台的采購。
實際上,從智算中心投入比就可以看出央國企對 AI 大模型的需求。
可以看到的是,自 2023 年三季度,央國企就已經開始緊鑼密鼓地籌備智算中心建設。而智算中心只是央國企落地 AI 的一個起點。
一方面,這與上文提到的政策時間點正好吻合;另一方面,2023 年第三季度也恰好是以百度、阿裏、華為和電信運營商為首的 " 國内 AGI 梯隊 " 剛剛形成。
除了智算中心,央國企對 AI 大模型建設的另一個重點則是行業應用,即針對特定場景搭建大模型平台或應用。
以電信運營商為例,據不完全統計,從 2023 年至今,運營商對 AI 大模型的項目建設達到了 238 起,其中除了 75 起智算中心建設外,剩餘都圍繞特定的場景構建大模型,主要有智能客服、營銷和數字人方面的采購。
不同行業對于 AI 大模型的需求不同,項目重點自然也不一樣。對于政務和運營商行業而言,之所以智算中心占比更大,除了政策推動,更重要的原因是對于私有化部署、本地部署的需求極高,尤其是政務領網域;另一方面,相對于其他行業針對單點或各别環節的大模型應用開發,政務和運營商對大模型的需求則更為系統化,更需要從 GPU 資源到算力調度平台來發揮作用。
相比之下,在應用 AI 大模型最多的三個行業中,能源領網域對智算中心的投入較少,而更多圍繞大模型訓練和開發方面,尤其是針對特殊場景如何訓練并優化算法,如何微調模型等等。
另外,值得注意的是,對于這些對行業 know-how 要求更高的領網域而言,他們選擇得標方的時候也更為講究;比如在挑選算力調度平台和大模型預訓練、開發階段時,得標方則圍繞以百度、科大訊飛為首的 AI 企業;而在選擇在大模型開發過程中,需要特定技術研究時,則會選擇南方電網這類更懂 know-how 的企業。
最後,不同于雲計算時代,金融行業成為頭部落地試驗田;在如今的 AI 大模型時代,在央國企當中,有四大行業脱穎而出,分别是教育、能源、運營商、政務;而金融行業卻并沒有表現出像雲計算時代那麼強的意願。
AI 大模型:颠覆傳統 IT 架構背後
時代變遷。
在過去的雲計算時代,大型企業進行數字化轉型需要從購買或租賃伺服器,到選址建數據中心,再到選擇合适的雲架構,接下來到平台開發環節及上層應用的搭建。
通常來講,一家大型企業,如能源或工業企業來説,面對分布在各環節的數據,通常需要建底層的 PaaS 平台,從而實現靈活調用、互聯互通;但盡管如此,數據孤島、數據煙囱依然存在。
然而,這種從 IaaS 到 PaaS 再到 SaaS 的架構,在如今的 AI 大模型時代已經徹底被颠覆。企業往往需要一個行業大模型即可搞定,而不再會為了構建多個復雜應用,費時搭建 PaaS 平台。
誠然,企業在雲計算時代交得學費也并沒有浪費,在 AI 大模型時代,央國企在政策引導、需求迫使和環境因素等多方作用下已經開始先行落地 AI 大模型。
而在這其中,很大一部分都是基于過去雲計算時代一些無法解決的頑疾,希望在 AI 大模型這裏找到更好的解法。
可以觀察到一個現象,目前央國企在大模型落地方面,主要圍繞兩點,一個是智算中心,一個是行業應用。後者包括大模型預訓練,大模型開發,以及針對各别環節或特定場景構建大模型應用或解決方案。
通常來説,後者通過大模型基于特定場景的解決方案,都是在過去雲計算時代無法實現的。
以運營商為例,雖然智能客服已經存在很多年,準确地説,自雲計算時代以來,各類智能客服軟體和解決方案層出不窮,然而對于整個行業來講,轉人工率依舊居高不下,普遍都在 80% 以上。而當時代的列車剛剛駛入大模型時代,智能客服就成了大模型落地的第一塊試驗田。
再比如在能源行業,知識如何沉澱,再如何讓新人用起來,一直都是一大難題。即使在雲計算時代,工業互聯網平台林立,很多問題依舊沒有答案。而在如今的大模型時代,一個行業大模型便可以解決很多問題。這其中關鍵發揮作用的便是在行業大模型構建過程中的 RAG 搭建環節,它相當于一個企業知識庫,任何輸入的知識,都可以輕松調用。
像上述所展示的,對于某些行業來説,大模型并不是 " 雞肋 "。相反,它能夠扮演 " 超強大腦 " 的角色,将企業的全部智慧匯聚到一起,并有的放矢地發揮作用。
然而,對有些行業而言,大模型目前還并未找到用武之地。
比如在金融行業,目前落地較多的項目主要圍繞知識庫問答方面,很難深入到核心業務。一方面,是出于金融監管和數據隐私等顧慮;另一方面,也是更重要的,目前 AI 幻覺問題還很難徹底得到解決,任何 AI 算法可能為金融行業所帶來的錯誤預測和建議,都可能帶來重大經濟損失。
而無論是智能客服還是行業大模型,無論是政務領網域,還是運營商或能源、政務、教育等行業,在央國企先行落地大模型的背後,有三點核心原因。
首先,在大模型時代,央國企多年積累的數據得以發揮作用,他們不僅僅包括像财報報表、交易記錄等已經做好歸納整理的結構化數據,還包括一些重要的企業資產,如散落在各個系統内部的聊天記錄、檔案、圖片等等,如今這些非結構化數據都可以在 AI 大模型中,變成 " 企業知識庫 ",并發揮其價值;
其次,不同于過去雲計算時代從 IaaS 到 PaaS 再到 SaaS 的三層架構,大模型有着很強的協同性,只需在前期大模型開發階段做好訓練和微調,後期即可直接基于數據進行前端行為的加持。
最後,也是很重要的一點,央國企本身就有龐大的伺服器集群,其自身具備強大的算力基礎,基于這些基礎可以更好地推進大模型落地。
競争點:預訓練、安全及行業 know-how
從得標情況來看,可以毫不誇張地説,央國企撐起了國内大模型商業化的半壁江山。
然而,大模型落地進程行至中途,仍然有很多問題亟待解決。
據中信建設證券數據顯示,2024 年 -2027 年全球大模型推理的峰值算力需求量的年復合增長率為 113%,遠高于訓練的 78%。而預訓練成本和推理成本的疊加,也推升了整個 AI 基礎設施的市場份額。
據艾瑞咨詢推算,2023 年中國 AI 基礎數據服務市場規模為 45 億元,預計到 2028 年,其市場規模将達 170 億元,且未來五年的復合增長率為 30.4%。
這同時也解釋了近兩年央國企搶建智算中心的原因。然而,阻擋大模型落地進程的還不僅僅是算力資源短缺。
雖然大模型時代已經颠覆了過去從 IaaS 到 PaaS 再到 SaaS 的傳統三層架構,但在新時代下,新的架構也迎來了一些新的挑戰,比如從 AI Infra 到 MaaS,再到上層的 AI 應用,中間涉及很多模型搭建的環節,這些都需要大模型服務商與企業一同探索落地路徑。
對于央國企來説,用 AI 大模型賦能雖然已成為共識,但怎麼用大模型,具體把大模型加在哪個環節,大模型如何發揮作用,以及如何開發和訓練大模型,面對這些問題,企業并沒有太多頭緒。因此,這就給 AI 大模型供應商提出了更高的要求。
在這過程中,供應商是否掌握行業 know-how,在有些時候甚至可以成為能否拿下标的的關鍵因素。對此,以百度、華為、科大訊飛為首的 AI 大模型企業,都不約而同地在 2024 年扛起 " 行業大模型 " 的大旗。
據統計,在能源領網域,2024 年上半年就出現了不少預訓練過程中某項技術研究的投标項目。
另外,值得注意的是,随着 AI 應用走向深水區,數據安全、數據共享和數據溯源等問題則開始被一一搬到台面上。據悉,10 月 9 日,中辦、國辦正式發布《關于加快公共數據資源開發利用的意見》,提出到 2025 年,公共數據資源開發利用制度規則初步建立;到 2030 年,公共數據資源開發利用制度規則更加成熟,資源開發利用體系全面建成。
雖然如今的 AI 大模型已經可以讓數據溯源成為現實,但其中的責任劃分和數據安全等等問題,還需要 AI 服務商和企業一同探索。