重讀AI大模型元年：“百模趕考，文心奪魁”

今天小編分享的科學經驗：重讀AI大模型元年：“百模趕考，文心奪魁”，歡迎閱讀。

把時間倒回一年之前，那時很多媒體和網友讨論，中國能做出來類 ChatGPT 的大模型應用嗎？

當時我們就說，不用慌，不用忙，中國一定能做成大模型。轉瞬間，被稱為 " 大模型元年 " 的 2023 年即将在爆竹聲中結束。中國 AI 大模型，舉頭已覺千山綠。

根據相關數據，到 2023 年 10 月中國市場已經發布了超過 230 個大模型。" 百模趕考 " 實至名歸。但是，大模型數量并不是做成大模型的終點，甚至不是做大模型的目的。

在今天這個階段，我們必須回答新的問題：大模型有了，怎麼才能把大模型做好，用好？怎麼才能讓大模型為社會經濟做出巨大價值？

想回答這個問題，就必須知道大模型的 " 好 " 是什麼。

評價大模型的質量好壞，不是靠參數，靠規模，而是比效率，比技術，比應用，比生态，最終比誰最好用，誰最有用。

在探讨這些問題時，我們會發現國產大模型格局的另一面：大模型雖多，但普通人知道，用到的卻并不多。随便找個朋友問一問，會發現他大概率只知道一個國產大模型，那就是文心一言與其背後的文心大模型。

雖然有數量過百的大模型策馬奔騰，但卻是文心大模型一騎絕塵。為什麼會這樣？

理解這個問題，才能理解大模型的本質規律：只有厚積薄發，做深做強，才是國產大模型的未來之路。

歲末回首，重新審視 " 百模趕考，文心奪魁 " 的行業格局，能看到 AGI 的曙光正悄然來到這片土地上。

身位之先

大模型的效率競賽

在 AI 大模型剛剛興起之際，用戶對它有好奇，行業對它有渴望，社會經濟對它有廣泛多元的期待。這時，誰能夠率先将大模型帶給用戶與產業，誰就能夠立下先鋒之功，通過身位領先來确定自身的行業優勢。

回望過去一年大模型行業的發展，會發現文心大模型每次都在扮演先鋒的角色。最終将大模型技術最快交到用戶、開發者以及千行百業手中。文心大模型的高效率、快節奏，以及這背後的技術領先與產品自信，是其能夠保持 " 一騎絕塵 " 的首要關鍵。

2023 年 3 月，百度率先發布了文心一言大語言模型。這得益于百度十餘年布局和深耕深度學習技術，并進行了廣泛的 AI 業務實踐。從 2019 年開始，百度就深耕預模型研發，打造了文心大模型體系。厚積薄發，做足準備的文心，在開年之際就達成了一路領先。

2023 年 7 月，在 2023 世界人工智能大會期間，國家人工智能标準化總體組宣布了中國首個大模型标準化專題組組長部門名單，百度擔任聯合組長部門。至此，文心大模型正式進入 " 大模型國家隊 "，為國產大模型标準化事業探尋航道，确立方向。

接下來，在 8 月 31 日，文心一言正式面向全社會開放，成為中國公眾能夠最早體驗到的大語言模型，真正将大模型能力帶到千家萬戶，尋常巷陌。

2013 年 12 月，中國首個官方 " 大模型标準符合性評測 " 結果出爐。文心一言成為首批通過評測，符合《人工智能大規模預訓練模型第 2 部分：評測指标與方法》語言大模型的相關技術要求，通用性、智能性等維度全面達到國家相關标準。

最先推出，最新開放，最先符合國家标準，" 先 " 已經成為文心大模型的關鍵詞。深耕 AI 核心技術，打造 AI 生态，帶來的是厚積薄發下的高效率與快節奏。

文心之先，一騎絕塵，可以為整個 AI 行業所借鑑。

技術做厚

大模型的技術差異化積累

在我們讨論 AI 大模型數量過多，行業飽和的問題時，經常會注意到一個現象：數百個大模型問世，但我們卻很難找到這些大模型之間的技術差異化有哪些？更遑論體會到技術差異帶來了應用差異。

這個現象出現的原因，在于大模型盲目追求數據量與模型參數，忽視了核心技術的研發與積累。文心大模型之所以反響好，用戶認同高，就在于它選擇了最厚重，最扎實的技術研發之路。每一代文心大模型更新，都建立在新技術能力的研發與運用基礎上。這就導致文心越更新，與其他大模型的技術能力差距就越大。技術的滾雪球現象開始顯現，最終形成了文心大模型在技術方面 " 人無我有，人有我優 " 的戰略優勢。堆山百仞，起于壘土。

2023 年發布的文心一言背後，是文心大模型 3.0。當時文心已經憑借知識增強技術确立了大模型領網域的技術差異化，具備知識增強、檢索增強和對話增強的優勢。

随後到 5 月，文心大模型 3.5 版本發布。其在基礎模型、精調技術、知識點增強、邏輯推理、插件機制等方面進行了創新，取得了生成效果和效率的全面提升。

到了 10 月，文心大模型 4.0 版本正式推出。其在多個關鍵技術方向上實現了突破，在理解、生成、邏輯、記憶四大能力上都有顯著提升。尤其邏輯和記憶能力大幅提升，帶給用戶非常直觀的幫助。

文心大模型能夠實現如此高效率、大幅度的技術更新，離不開其背後高效算力、自研框架，以及數據處理機制的協同優化。尤其文心飛槳聯合調優，成為業界著名的大模型高速發展案例，在過去一年受到了 AI 行業的廣泛讨論。

文心大模型在萬卡算力上基于飛槳平台，通過集群基礎設施和調度系統、飛槳框架的軟硬協同優化，支持了大模型的穩定高效訓練。自 2023 年 3 月發布以來，文心大模型的訓練效率已提升數倍，周均訓練有效率已經超過 98%。

對核心技術的探索，對技術差異化的積累，讓文心大模型有了技術之厚。這是文心持續領先的底牌與底色。只要在技術上有更高追求，很多問題就自然會有答案。

應用需廣

如何将大模型帶到應用一線？

想要知道一棵樹是不是棟梁之材，不能僅僅坐而論道，把它誇得天花亂墜，而是要把它真正用起來，讓它去架梁持屋，發揮自己的價值。

對于 AI 大模型來說也是如此。大模型是否有用，不是在發布會和測試數據裡說出來的，而是在億萬用戶，在千行百業手裡用出來的。

審視過往一年的大模型行業發展，我們會發現在應用的廣度上，文心是其他大模型難以望其項背的。在 C 端用戶，只有文心一言實現了億級用戶規模；在 B 端應用，文心大模型的調用量超過了其他 200 家大模型的總和。

跨越數量級的應用領先，讓文心大模型在行業用戶、開發者、普通用戶手中探索出了無數種價值可能。在百度業務當中，文心大模型已大規模應用于搜索、信息流、智能音箱等互聯網產品；在對外開放過程中，文心大模型通過飛槳開源開放平台、百度智能雲賦能制造、能源、金融、通信、媒體、城市、教育等各行各業。文心大模型已與各行業頭部企業、機構共建了超過 10 個行業大模型，加速行業智能化更新。

在國家跳水隊，文心大模型對 AI 輔助訓練系統進行了全面更新，不僅能夠理解和執行教練與運動員的復雜指令，還可以對動作實時打分、精準量化分析。2023 年，中國遊泳協會授予百度 " 中國國家跳水隊人工智能合作夥伴 " 稱号。

在與國家圖書館的合作中，文心大模型通過大量學習古代方志和家譜數據，并進行文字識别和理解，打造了 " 古文今問 " 服務。用戶只需輸入尋根信息，就能得到相應的線索反饋，幫助全球華人尋根訪祖。

在聲橋 AI 語訓團隊手中，基于飛槳和文心大模型打造的 AI 口語康復應用，可以提供文字形式的反饋指導，幫助聽障人士進行語言訓練。

桃李不言，下自成蹊。文心的應用之廣，是其價值最好的證明。同時也證明了中國的 AI 大模型并不只有數量，更有應用的質量，有真材實料的智能化探索。

生态需盛

大模型生态建設刻不容緩

我們都知道，做軟體最難的就是做生态。生态決定了基礎軟體技術的探索上限，也決定了其未來長期發展的可能性。在 AI 技術剛剛發展起來時，做 AI 必須做生态就成為產業共識。

但在目前階段，我們可以看到中國有數量過百的大模型，卻很少有廠商關注生态建設。長此以往，容易導致大模型變成沒人會用，也沒人想用的 " 孤品 "。

文心大模型之所以能保持領先，很大一部分原因來自生态的支持與推動。只有千萬人共建、共創的大模型，才是有生命力和持久力的大模型。

為此，百度推進飛槳與文心生态共同創新、相互促進。截止 2023 年 12 月，飛槳已凝聚 1070 萬開發者，服務 23.5 萬家企事業部門，基于飛槳創建了 86 萬個模型。飛槳生态與文心生态互為助力，推動彼此高速發展。

開發者社區是生态發展的關鍵支撐，百度打造了中國最大 AI 社區 " 星河社區 "，伴随大模型的發展，百度正式推出星河大模型社區，為開發者提供一體化大模型開發體驗，以及豐富的產品功能。截至 2023 年 12 月，星河大模型社區已經推出了超過 4000 個基于文心大模型的創新 AI 應用。

在生态共創方面，百度發布了文心大模型星河共創計劃，希望與開發者和生态夥伴合作，實現 AI 應用的廣泛創新。

與開發者生态的相輔相成的，是人才生态的建設。2020 年，百度提出 "5 年為全社會培養 500 萬人工智能人才 " 的目标。截至 2023 年 10 月，百度已經培養了 420 萬 AI 人才。面對大模型技術巨大的人才需求，2023 年百度發布了全新的人才培養星河計劃，将與產學研各界合作，為社會再培養 500 萬大模型人才。

無論從開發者聚合、應用創新、人才培養等任何維度來看，文心大模型的生态建設都已經展現出了繁盛的一面。生态起步快，活力高，閱聽人廣，真正實現文心大模型的土壤上 " 千樹萬樹梨花開 "。

可以說，文心生态的興起，為國產大模型生态的整體建設奠定了典範，拓寬了邊界。

從大模型元年

到 AGI 曙光

經過風起雲湧的一年，大模型領網域的問題，從 " 有沒有大模型 "，變成了 " 能不能做好大模型 "" 能不能用好大模型 "。

面對新問題，新考驗，文心大模型在身位、技術、應用、生态四個方面的領先就是答案。

根據 IDC《AI 大模型技術能力評估報告，2023》顯示，文心大模型在 14 個參評模型中拿下 12 項指标的 7 個滿分，綜合評分位列國内主流大模型第一，并在算法模型、行業覆蓋兩大關鍵指标上拿下唯一滿分。

在人民數據發布的《AI 大模型綜合能力測評報告》中顯示，文心一言不僅綜合評分超越 ChatGPT，位居全球第一，更在内容生态、數據認知、知識問答三大維度評分超越 ChatGPT。并且六大維度評分均位列國内大模型榜首。

如果說，在大模型元年，我們看到的是大模型的數量。

那麼在更遠的未來，在我們所期待的大模型之春，需要看到的是大模型的應用質量和普惠價值。

如何才能實現這個進化？文心大模型已經在過去一年，用 " 先 "" 厚 "" 廣 "" 盛 " 這四個字做出了回答。只有整個行業都以這樣的路徑發展，去蕪存菁，避虛務實，國產大模型才能持續向好，打開行業之春，走向 AGI 之夏。

2023 年 8 月 16 日，WAVE SUMMIT 深度學習開發者大會 2023 在北京舉行。期間，百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰表示，人工智能具有多種典型能力，理解、生成、邏輯、記憶是其中的基礎能力，這四項能力越強，越接近通用人工智能，而大語言模型具備了這四項能力，為通用人工智能帶來曙光。

在這場人類科技面向星辰大海的航行中，我們已經見到了曙光，只有找到正确的方向，選擇技術長跑，選擇生态共赢，才能讓漫長的征程一步步落地，讓 AGI 的曙光點點化為現實。

" 百模趕考，文心奪魁 " 的行業格局，本質上是對技術主義與務實精神的肯定。

理解了這一點，也就找到了 AI 技術發展的前路。