李彥宏不寒碜：不賺錢，做大模型幹嗎？

今天小編分享的财經經驗：李彥宏不寒碜：不賺錢，做大模型幹嗎？，歡迎閱讀。

文 | 極點商業，作者 | Cindy，編輯 | 劉珊珊

一位行業領袖對技術路線的斷言甚至是 " 拉踩 "，其影響，或許将遠超公眾預判。

" 開源模型會越來越落後。"Create 2024 百度 AI 開發者大會上，一襲白衣的百度創始人、董事長兼首席執行官李彥宏，斷言稱，" 大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的。"

這是數天内，Robin 對開源大模型潑下的第二瓶冷水——此前 4 月 11 日，李彥宏在内部信中也稱，大模型開源意義不大。

作為國内大模型較早入局者，百度在去年 3 月發布文心一言大模型，選擇走閉源路線。一年間，文心大模型已迭代至目前的 4.0。

李彥宏觀點在行業内引發不小争議，認為以他國内 AI 布道者地位，不應如此武斷。畢竟，開源創新力量幾乎被每一位開發者公認，整個互聯網都建立在開源基礎上，才有了如今信息世界的暢通無阻。

因此也有多位現場媒體人猜測，李彥宏是否在暗指或 diss 行業其他閉源模型。

" 百模大戰 " 如火如荼，行業大佬下場對壘成為常态。如百川智能創始人兼首席執行官王小川，今年 3 月因李彥宏 " 文心一言 4.0 在中文處理上已經超越了 ChatGPT 4.0" 的表态，與百度高管多次互嗆。

自稱 " 開源信徒 " 的 360 創始人周鴻祎，截至目前已連續兩次（4 月 13 日、4 月 18 日）在公開場合炮轟李彥宏言論，他表示沒有開源，就沒有 Linux、沒有互聯網，" 開源不如閉源好是胡說八道，是忽悠，連說這話支持閉源的公司都是靠開源才發展起來。"

值得一提的是，百川智能、360 都是開源大模型。而大模型開閉源之争，也早是業界兩大陣營争論話題，從去年 7 月 Llama 2 宣布開源可直接商用就已開始，并在最近馬斯克起訴 OpenAI，要求 OpenAI 恢復開源并給予賠償後，掀起廣泛争論。

一切技術路線争議終點，是需要商業化掙錢。大模型加速商業化下半場，對 "all in" 人工智能的百度來說，作為國内最早利用通用大模型會員付費模式，向 C 端用戶收費企業，依靠大模型搞錢想法之迫切顯而易見——此前内部信中，李彥宏說得很直接：閉源才有真正的商業模式。才能夠真正賺到錢的，能夠賺到錢才能聚集算力、聚集人才。

從這個角度看，不賺錢，還做大模型幹嗎？這并不寒碜。但問題是，僅選擇開閉源任一道路，是否在通向極端？開源是否真的落後于閉源？閉源是否能真正代表大模型 " 商業化 " 破局之道？

開源一直領先閉源？

在李彥宏看來，無論是技術還是商業模式上，閉源模型都會持續地領先，而不是一時領先。

開源和閉源區别上，TechTarget 在一篇文章中解釋，開源意味着公開 AI 模型、訓練數據和底層代碼，閉源則隐藏或保護其中一項或多項。

可以簡單理解為，開源模型注重開放、共享和協作，推動大模型創新；閉源意味着源代碼僅供擁有它的公司修改和開發，但能更好保護商業利益和技術優勢。

從陣營來看，開源陣營遠比閉源龐大。目前國内外大模型行業，閉源主要以 OpenAI GPT、百度文心一言為代表，開源則是 Meta 旗下 Llama（羊駝）、馬斯克旗下 xAI 公司的 Grok-1，以及國内阿裡通義千問、百川智能、360、昆侖萬維、智譜 AI 等。其中，有不少企業選擇 " 兩條腿走路 "，既做開源又做閉源。

從普通用戶應用 / 產品化影響力來看，閉源目前領先開源毫無疑問。李彥宏核心論斷之一也是，無論中美，當前最強基礎模型都是閉源。

當前 " 登上神壇 "，讓很多大模型有絕望感覺的 OpenAI，2019 年發布 GPT-2 時還是開源，此後從 GPT-3 開始轉變為閉源，推出 " 核爆 " 聊天機器人 ChatGPT 後，才震驚世界。

最初，OpenAI 還公布論文，但到 GPT-3.5、GPT-4，連算法、路線、論文都 " 諱莫如深 "。今年初推出 Sora 時，更是明确表示不分享技術實現細節，只提供模型設計理念及其 " 炫酷 " 效果展示。

毫無疑問，大模型賽道近兩年繁榮，很大程度上得益于 OpenAI 帶動——倘若沒有 ChatGPT，不會有如此多科技企業加入大模型賽道，更不會有百花齊放、百家争鳴的行業形态。

在國内，文心一言是閉源代表。根據李彥宏最新公布的數據，文心一言用戶數、API 日均調用量均突破 2 億。百度在大模型賽道初步建立起自己 AI 生态。

今年格外火爆，引發大模型巨頭 " 圍剿 " 的初創公司月之暗面旗下產品 Kimi，也是閉源大模型。

大模型爆炒背景下，以上簡單易用、面向 To c 的閉源大模型可謂盡人皆知，在當下成功占據市場主導地位——但未來是否能保持當下優勢，尚未定論。

大獲好評的 Llama 2 後，開源逐漸成為大模型主流趨勢，其進化速度越來越快，迅速成為大模型競争重要一極。

3 月底，也就是 Grok-1 公開後幾天後，初創公司 Databricks 公布旗下開源大模型 DBRX，基于混合專家（MoE）架構，在語言理解、編程、數學和邏輯等标準行業上，戰勝了 Llama2-7B、Mixtral 以及 Grok-1。整體性能超越 GPT-3.5，編程方面更是輕松擊敗 GPT-3.5。

根據最新消息，Meta 将在下個月發布 Llama 3，支持多模态處理。屆時，Llama 3 或又将超越 DBRX，直接對标 GPT-4，復現後者大部分能力。

多位業内人士認為，如無意外，Meta 将遵循 Llama 2 路線，将 Llama 3 訓練數據、訓練方法、數據标注等大量細節都公布，成為 " 任何人都可以拿到模型權重的最強大語言模型 "。同樣，DBRX 為開放社區和企業提供了僅限于封閉模型的 API 功能。

過去，閉源大模型有 " 遙遙領先 " 的參數。如今開源模型參數正越來越大，DBRX 參數規模達 1320 億，Grok 有 3140 億，Llama 3 預計其大規模版本參數量可能超過 1400 億。國内昆侖萬維也在 4 月 17 日宣布開源 4000 億參數的大模型天工 3.0，一躍成為全球參數最大開源大模型，号稱超越 GPT-4V。盡管相比閉源大模型萬億參數有距離，但追趕速度越來越快。所以谷歌工程師說，谷歌沒有護城河，OpenAI 也沒有。

對諸多開源大模型——特别是中國大模型賽道創業者而言，拉平認知的 Llama，事實上遠比 GPT 更為重要。不少行業、垂直大模型多是通過對 Llama 等開源大模型進行微調或修改實現。" 如果沒有 Llama，國内大模型整體水平會被國外甩下不少身位。"

" 無需閉門造車，重復發明輪子。" 周鴻祎和金沙江創投主管合夥人朱嘯虎等均認為，開源社區聚集的工程師和科學家的數量是閉源的數百倍，借助全球技術力量，實現迭代、體驗改進和生态擴張。" 開源會很快超過閉源。"

但李彥宏并不認可這種說法，他表示大模型開源跟 Linux、安卓不同，實際上最主要開發者就是 Meta，" 不是一個真正大家一起來協同開發的產品。"

開源成本真比閉源貴 ?

兩大陣營最激烈交鋒，目前發生在馬斯克與 OpenAI 之間—— 2016 年，馬斯克還是 OpenAI 聯合創始人、投資人、聯席 CEO，如今早已徹底走向決裂。

自 ChatGPT 發布後，馬斯克多次暗諷 OpenAI，斷掉 OpenAI 對推特的數據訪問權限，并在今年 2 月克起訴 OpenAI 跟山姆 · 奧特曼，理由是 OpenAI 違背了造福人類非營利的宗旨。

整體來看，伴随兩大陣營的交鋒态度日益強硬，誰也說服不了誰。開源陣營認為，開源更容易創新，更容易被大眾理解和監督，閉源是奉行保守主義，容易權力集中，壟斷市場和數據，AI 技術發展也會滞後。

閉源陣營則認為，開源模型是套殼，存在濫用風險，無法基于此自行演進，影響某些企業商業化策略，特别是注重安全、隐私的企業。

但從李彥宏論斷來看，開源模型會一直越來越落後，核心論點是因為成本更昂貴——這是行業最新争議點，畢竟印象中，開源使用成本更低甚至免費，而且開源成本的高低，從邏輯而言并不等于技術路線的高低。

李彥宏的依據是，基于文心大模型 4.0，降維裁剪出來的 " 小模型 "，要比直接拿開源模型調出來的模型，同等尺寸下效果明顯更好；同等效果下，成本明顯更低。

這話有一定道理，此前有業内人士就在 X 平台表示，Grok-1 沒有對特定任務進行微調，普通用戶使用它的基礎門檻并不低。如何開源、什麼可以開源、開源到何種程度仍有待實踐回應。

但也有中小開發者表示，盡管 Llama2 的開發和使用并沒有完全面向全體公眾開放，但對中小開發者也非常友好，只需一台 PC 就可以零代碼微調大模型，花不了多少錢，且性能并不差。

事實上，業内公認的是，當前大模型技術路線都未成熟，包括 ChatGPT 也出現過将三星機密資料外洩嚴重事件。開源閉源各有利弊，" 兩條腿走路 " 才是目前大部分公司的選擇，即構建一系列 AI 模型，既有閉源也要開源。

比如微軟 130 億元投資了 OpenAI，但也擴大了開源 ONNX Runtime 投資力度，以及下場推出開源 Phi 大模型；谷歌也是從過去押注堅持閉源，在今年 2 月突然推出 " 開源 " 大模型 Gemma，雙線作戰去對抗 OpenAI 和 Llama。

在國内，兼顧開源閉源的大模型更多。比如阿裡通義千問，雖然以開源為主，但也有閉源模型，去年 12 月進階至 2.1 版。包括百度也是如此，去年發布的文心千帆大模型平台 2.0，就接入了 30 多個主流大模型，包括 Llama2 等諸多開源大模型。

可以說，沒有開源大模型，就沒有如今百度智能雲生态的成熟，在千行百業的落地——根據最新數據，文心千帆大模型生态夥伴數量過去半年增長 5 倍，API 調用量指數級增長，超 8.5 萬客戶，300 多款進入千帆應用市場。對這些用戶和開發者而言，表面是在文心一言上，實際用到的也很可能是 Llama2 等開源模型。

既然如此，李彥宏為何還會多次斷言，開源大模型會一直落後？

有業内人士就認為，這或許與百度當下大模型的戰略定位，以及需要為產品工具宣傳背書直接相關。

" 以後人人都是開發者。"Create 大會上，李彥宏給出 AI 時代答案的同時，也發布了被廣泛宣傳的三大 AI" 開發神器 " —— AgentBuilder、AppBuilder、ModelBuilder，将個人、企業、開發者統統囊括在百度體系内，加速搶占應用入口，甚至是基礎模型通吃 AI，構建國内最強大大模型生态的 " 野心 "。

" 如果說開源大模型開放且正逐漸強大，那麼有多少人還願意給閉源大模型送錢，甚至是加入受控制的生态體系？" 一位網友評論說，長期以來，全球開發者對蘋果 iOS 封閉生态系統的 " 霸道 " 行為，深感不滿卻又無可奈何。

利用大模型賺錢，百度跑在前面

實際上，在大模型下半場，探索商業化路徑成為所有玩家亟待選擇的問題。

在這方面，李彥宏相當坦誠，表示百度之所以堅持閉源，是因為市場有足夠多的開源，百度要開源還得自己去維護一套開源版本，從成本來說非常不劃算。更重要的是，閉源有着真正的商業模式，能夠賺到錢。

大模型當前如何商業化，或者說賺錢？盡管各大模型還在探索 ToB 還是 ToC 的不同路徑，但重點布局方向都是 " 脫虛向實 "，向 " 應用為王 " 傾斜。

這一點，從李彥宏、周鴻祎或者其他行業大佬、專家表态來看，已成共識。

大模型商業化如何變現答案上，"all in" 姿态的百度堪稱行業樣本，在國内跑在最前面。

B 端，構建 " 文心千帆 " 一系列商業化矩陣，為客戶產品嫁接文心大模型能力，通過調用 API 調取實現營收。

這種收費方式可以簡單理解為，模型租賃。360、阿裡通義千問、騰訊混元、科大訊飛星火等通用大模型，以及更多行業大模型也有類似嘗試，但當前大模型工具推動千行百業生產力進步還需要過程，且門檻更高（如針對各行各業的定制化服務），基于 tokens（" 字 " 或 " 詞 "）計價方式的 ROI（投入產出比）各家并不算高，更多是通過 API 的綁定，向客戶出售雲、廣告等其他服務。

李彥宏曾在 2023 年财報會中披露，去年 Q4 百度智能雲總營收 84 億元，其中大模型為雲業務帶來約 6.6 億元增量收入，同時文心大模型重構後的廣告系統，為百度帶來數億元增量收入。根據李彥宏的預計，上述兩項增量收入，将在 2024 年增加到數十億。或許，這會成為百度智能雲加快追趕阿裡雲、華為雲等的希望。

更值得一提的是 C 端。在國外，ChatGPT 率先推出收費 Plus 服務；在國内，百度緊随其後，率先在 C 端推出了 " 文心一言 " 會員訂閱模式。

目前，文心一言 3.5 基礎版仍可免費使用，只是體驗并不完美。能力更強的 4.0 則需要更新成會員，會員服務有兩種，分别是單獨的會員服務和聯合會員服務。

單獨會員服務價格上，連續包月優惠價為 49.9 元，單月購買價格為 59.9 元，連續包年 588.8 元，12 個月 658.8 元。選擇這種會員服務，用戶将能夠體驗文心大模型 4.0 的高級服務，比如更強的模型能力和圖片生成能力。

此外，百度還推出了文心一言 4.0 與文心一格白銀的聯合會員服務，限時特惠價為 99 元 / 月。除文心大模型 4.0 服務外，用戶還可以獲得文心一格白銀會員的權益，包括極速生成多尺寸高清影像、創作海報和藝術字，以及 AI 編輯改圖修圖等功能。

不過，這也引起了部分用戶的争議。雖然會員付費是互聯網行業常見盈利模式，但像大模型會員這麼貴價格的比較少見，比如鬧得沸沸揚揚的愛奇藝，多次漲價後會員包月價目前為每月 25 元。

如此貴的會員費，業内人士認為大部分是 AI 知識工作者、開發者等買單，從普通用戶角度看，如果一年用不上幾次，購買并不合适。

但客觀來看，如今生成式 AI 產品收費是大勢所趨，且大模型會員價格貴，和伺服器、芯片、訓練、電費等高額成本有關，如果不收費，以百度的彈藥儲備，恐怕也難以支撐燒錢多久。

從财報來看，大模型 C 端會員收費并未在百度最新财報中有所體現，有多少用戶付費難以得知。但無論是 B 端還是 C 端的 AI 故事，想真正體現更大提振效應，還需要很長的路要走。2023 年百度總營收 1345.98 億元，在線營銷貢獻 751 億元的收入。

這不只是百度的問題。目前能從 AI 身上賺到錢的公司并不多，百度已經算是其中佼佼者，一是迅速推動旗下大部分產品和大模型的融合，二是文心一言、百度廣告、智能雲、自動駕駛等領網域，都開始有了來自 AI 的落地收入，AI 商業化布局呈多元化态勢。

OpenAI 成功，首先是商業模式的成功。2022 年全年，OpenAI 收入僅為 2800 萬美元。今年 2 月有外媒稱，OpenAI 的年化收入已超過 20 億美元，其估值達驚人的 1000 億美元。一些 OpenAI 的領導認為，到 2024 年年底，該公司年化收入可以達到 50 億美元。

在商言商，只要未被利益蒙蔽雙眼，因商業利益而為自家產品、技術路線強硬站台，無可厚非。

對李彥宏和他的百度來說顯然也是如此，其既不是發布會上鼓吹的 " 讓人人都是開發者 " 的那樣高尚，也不是周鴻祎反駁中的 " 胡說八道和忽悠 "。區别，在于企業路線，在于未來策略。包括馬斯克和 OpenAI 的決裂，本質同樣如此。

當然周鴻祎有一點沒有說錯，那就是 OpenAI、文心一言也是自開源成長起來——如今所有主流大模型的核心機制（包括開源、閉源），都是基于 Transformer 架構，熱潮起點則源自 2017 年的谷歌，其發表了《Attention is all you need》的經典論文，對 Transformer 模型做出了具有歷史意義的重大改進，有了 Transformer 框架下的 " 不可能三角 "（并行訓練能力、性能和低成本推理），才有了後來的 GPT。

從這個角度看，AI 和大模型注定引領一場新工業革命的當下，斷言某一種技術路線會一直落後，也是一種極端。