今天小編分享的科技經驗:承認百度仍在 AI 第一梯隊沒那麼難,歡迎閲讀。
引語:
2025 年,百度的 " 天 " 變了。
" 前 Deepseek 時代 ",圈裏不少人還悲觀地認為,中國沒有模型能跟上 GPT 的腳步,對百度來説,模型不掉隊,應用生态做起來,就能夠留在牌桌上;
而 Deepseek 一出,風雲變幻、誰與争鋒——原本,文心 4.0 在國内也算數得上号的大模型,在 Deepseek 面前,也不得不甘拜下風。
于是,巨大的壓力給到了百度:
發新模型,必然面臨質疑,要被拿去在顯微鏡下和 Deepseek 作比較,在冷眼下遭遇批判;
不發新模型,百度的技術實力更沒了展現的機會,無端的猜測又會甚嚣塵上,客户的信心也會被損傷。
進退維谷,百度的選擇,是亮出寶劍,非要試一試自己的成色——即使面臨批評和貶損,百度也決心放下面子,把自己最新的模型成果展示出來。
放下面子,拼了老命,也死活不下牌桌,百度是怎麼想的?
一、文心 4.5 和 X1,百度 " 死磕 "
談戰略之前,先聊點實着的——百度新發的文心 4.5 和 X1 好用嗎?
作為百度新一代的原生多模态大模型,文心 4.5 首先是在多模态的能力上進一步更新。今天的文心 4.5,不僅可以理解照片、工作圖表、視頻内容,準确摘取靜态、動态影像中的細節信息;甚至還能理解網絡笑話、梗圖中的幽默和諷刺,并連貫地完成推理。
當大模型能力越來越卷、用户标準越來越高,模型之間最細微的差距,就決定了實際生成結果在體驗上的天差地别——原生和非原生的區别,也由此顯現。
預訓練階段更深層次的模态融合、專為跨模态互動和理解設計的模型機制,都是原生多模态模型的優勢。
3 月,李彥宏在人民網上發表了一篇署名文章,其中就提到了原生與非原生多模态大模型的區别——原先,所謂的 " 多模态模型 ",只是幾個單模态模型訓練後再進行拼接;而原生多模态大模型,勝在以統一的架構,去實現對復雜世界的統一理解。
本次發布的文心 4.5,在原生多模态的角度,思路與谷歌的 Gemini,Meta 的 Llama 4,OpenAI 的 GPT-4o 一致。
而文心 4.5,則是在多模态異構專家擴展技術上更進一步,就如同根據影像、視頻、文字等不同領網域,給智囊團請來了一群術業有專攻的 " 專家 ",并且通過一套自适應模态感知損失函數,讓 " 專家 " 們可以實力相當,也就更能完成協作,執行復雜跨模态任務的處理。
多模态能力之外,針對大模型不少老生常談的技術難關,百度在文心 4.5 也交上了這一期的 " 答卷 ":
面對長文本處理問題和多輪互動,百度優化了 FlashMask 動态注意力掩碼,提高了長序列建模能力和訓練效率;
針對大模型的學習效率和幻覺問題,文心 4.5 則繼續在預訓練數據下了苦功夫,通過知識分級采樣、數據壓縮與融合、稀缺知識點定向合成等技術,百度将數據質量大幅提升,模型的質量和成本也都得到了保障;
而對強化學習效率至關重要的後訓練(Post-training)技術,文心 4.5 一樣沒落下,通過融合多種評價方式,百度将一套自反饋迭代式的後訓練技術用到了大模型的後訓練當中,将強化學習的穩定性和魯棒性全面提升,讓模型理解人類意圖的能力更上一層樓。
對标 GPT-4.5,文心 4.5 已經有了相對亮眼的成績;而對标 GPT-o1 和 Deepseek R1 的文心 X1,也交出了一份不錯的答卷。
據了解,百度文心 X1 采取了遞進式的強化學習訓練方法,并且基于思維鏈和行動鏈根據結果反饋進行了端到端的模型訓練,給訓練效果增色不少;而 Deepseek 最引人注目的評估系統,百度在文心 X1 上也做了革新,他們建立了一套同意的評估系統,并将多種類型的獎勵機制融合,讓模型的訓練獲得了更魯棒的反饋。
一系列的努力之下,相比文心 4.0,X1 的文本創作能力顯然更強,也更擅長梳理邏輯、分析復雜問題、生成觀點、提供情緒價值——能和用户聊 " 思考深的 ",也能聊 " 感情真的 ";
而到了多模态的範疇,文心 X1 也沒丢了系列由來已久的跨模态能力,在圖片理解的精準度更上一層樓,還能細節識别圖片是否有 P 圖痕迹,兼具一副火眼金睛。
相比 Deepseek,剛剛面世的文心 X1 測試下來,在文本的創意和個性化上稍遜一籌。但除了前者所不具備的多模态能力之外,文心 X1 更大的優勢在于 " 家底厚 " ——文心大家族支持的 " 高級搜索 "" 文檔問答 ""AI 繪圖 ""TreeMind 樹圖 "" 百度學術檢索 " 等等工具,都能在文心 X1 上用到,讓用户獲得沉浸的一站式 AI 體驗。
在能力上來説,兩款模型在文心 4.0 的基礎上又實現了一次 " 飛升 ";而在成本上,文心 4.5 和 X1 卻再次 " 跳水 ",依靠芯片、模型、框架等層面的聯合優化,文心 4.5 的推理成本只有 GPT-4.5 的 1%,而 X1 的推理成本也只是 Deepseek R1 的一半左右。
成本優勢建立了起來,如何讓用户更便宜地把大模型用起來,百度就有了底氣:
今天,文心 4.5 和 X1 都已在文心一言官網上線,免費向用户開放;
面對企業用户和開發者,文心 4.5 已在百度智能雲千帆大模型平台上,輸入價格為 0.004 元 / 千 tokens,輸出 0.016 元 / 千 tokens,約為 GPT4.5 價格的 1%;文心 X1 定價為輸入 0.002 元 / 千 tokens,輸出 0.008 元 / 千 tokens,也即将上線千帆。
百度搜索、文小言等百度的當家產品,也正在逐步接入文心 4.5 和 X1,把最強大的 AI 能力讓社會普惠。
近十年,百度的累計研發投入,已經超過 1800 億,李彥宏在今年 1 月的 25 周年全員信中寫道,很多年裏,百度收入的 20% 以上,都被投入到了研發當中——這麼看,文心 4.5 和 X1 的迭代速度雖然在 " 意料之外 ",但也算是高投入之下的 " 情理之中 "。
然而,這次文心的雙料發布,卻遠不止是新技術迭代這麼簡單——百度鮮有地放下面子,用誠實的姿态,把自己的優點和缺點暴露在用户的眼皮底下,究竟圖點什麼?
二、百度變了
像開頭説的一樣,當下這個時點,在 Deepseek 占領了無數圈内外用户心智的當口,從市場角度看,百度發布文心 4.5 和 X1 是一個正确的選擇嗎?
一樣的困境,整整兩年前,在面對 OpenAI 和 ChatGPT 時,百度就已經經歷過了一次。
當時,是李彥宏許久之後首次出席線下會議演講,還是熟悉的白襯衣、熟悉的不緊不慢的語調。甫一開場,他并沒盯着提詞器裏的講稿,比起 " 早有預謀 " 的台詞,更像有感而發的感嘆,犀利地抛出了一個問題:
" 最近一段時間,很多朋友問我:‘為什麼是今天,你們真的 ready 了嗎?’ "
與其説這個問題問的是别人,不如説,這個問題李彥宏或許也問了自己很多遍。但思前想後,百度不怕被與 OpenAI 比較,也不怕丢面子,有好東西,必須得讓客户和用户先用上。
兩年後,文心 4.5 和 X1 發布,百度更是必須保證更新頻率,缺乏旗艦模型的公司,留在 AI 的第一梯隊也難以服眾。
今天,百度變了,變得不再愛面子:
先前站隊閉源,而 Deepseek 通過開源嘗到了甜頭,那就聞過則喜、從善如流;
Deepseek、Llama 等模型确實各有千秋,那就踐行 " 拿來主義 "、在搜索、地圖、文庫、智能雲等 ToC、To B 產品體系裏海納百川,讓用户自主選擇;
在未來,智能體和 AI 應用,沒法被一家公司大包大攬,那百度就甘當綠葉,不做 " 超級應用 ",而要幫助人們打造更多 " 超級有用 " 的應用;
過去做事慢條斯理、贻誤軍機,今天在内部,文心 4.5 全面免費,PC、移動雙端直接上現貨,等等決策都在半天之内完成,絕不拖泥帶水;
而體現在迭代速度上,百度模型迭代的速度仍在加快,文心 4.5 全部開放之後,最晚 6 月底就将公布開源版本,下半年則有望見到文心 5.0 的面世。
百度變得不愛面子,也變得越來越開放、越來越務實——不躺平,也不苟着。
在今年的 " 世界政府峰會 "WGS 訪談時,李彥宏提到:" 我認為創新不能被計劃,你不知道創新何時到來,你所能做的就是營造一個有利于創新的環境。"
枕戈待旦,百度還在謙卑地等着一個機會。但在今天,即使面臨着諸多強敵的挑戰,百度還在大模型的第一梯隊嗎?
三、百度,沒下牌桌
今天,評價所謂 " 第一梯隊 " 的 AI 公司,或許還并不能存在一個共識性的标準。
幾個頂流 AI 玩家,更像八仙過海,有些以技術見長,有些重視產品,還有些則幹脆專注市場營銷,各有各的優勢,也各有各的活法。
如果把百度算進第一梯隊的 AI 公司當中,或許有人基于一貫的刻板印象,并不會同意;
然而,數據是直接、有力的,百度在中國的 AI 商業化實踐,的确可以名列前茅——2024 年,文心大模型的日均調用量已經達到了 16.5 億次,相比一年前的同期數據,狂增 33 倍;飛槳平台上,1808 萬個開發者和 43 萬家企業,已經創建了 101 萬個模型;而文心千帆已經幫助客户完成了 3.3 萬個模型的精調、開發了 77 萬個企業應用。
巨大的 B、C 端使用量,已經幫助百度建立起了一個初具動能的用户飛輪。同時,每天不停運轉的百度搜索、近億 AI 用户的百度文庫,以及地圖、網盤等多款億級用户產品,都是百度内部試驗 AI 效能提升的試驗田,肩負的不僅是百度這家科技公司的技術未來,更是這家上市公司的商業未來。
過去 24 個月裏,AI 行業中大的變化,李彥宏説,是 " 大模型基本消除了幻覺 ",這也讓用户們可以更放心地使用 AI,而不擔心遭到幻覺的反噬——這也是大模型推向商業化的必要條件。
而到了 2025,不同公司的生存策略正逐漸趨同:獨角獸們為了滿足資本的期待,而必須展現自己的盈利能力;而大廠更是如此,要依靠持續不斷的現金業務支撐營收和财報,這樣股價才能有所保障。
而 Deepseek 面世後,看似通過先進的技術力 " 殺死了比賽 ",其實整個 AI 大行業反而有了向好的趨勢。
一方面,Deepseek 的确通過開源,救活了一些基礎模型能力較差的公司和產品,讓他們也能通過接入 Deepseek 的方式,獲得一些流量;
另一方面,Deepseek 在國内突然爆炸式的營銷,讓不少企業部門——尤其是國央企、事業部門——一改之前對 AI 的謹慎态度,紛紛加速擁抱 AI,讓本地部署的一體機生意在近期反而增色不少。
于是,李彥宏在今年的首次内部講話中,他提到,加大 AI 應用商業化實踐同樣相當重要。AI 應用在全行業的爆發,只會加速玩家的淘汰,而那些缺乏商業化能力的公司和產品,恐怕更要遭殃。
早在别人大談 AGI 時,百度就很早提出要在商業化落地上取得成績,要通過 AI 業務給自己造血,絲毫沒有行業 " 前輩 " 的 " 偶像包袱 " ——翻譯過來就是:" 賺錢,不寒摻。"
百度的商業化保證,是其作為一個 25 年大廠日積月累的龐大矩陣。百度底層有芯片,有智算中心、萬卡集群;中間有模型,有模型精調、APP 開發工具鏈、有大模型商店;頂層有自己的原生 AI 產品,有亟待重構的老牌大 DAU 產品,有豐富的渠道和頗具深度的用户池子——中間不少要素,即使是同等量級的大廠也難望項背。
今天,百度還帶着兩款技術更先進,免費的文心大模型前來挑戰,而還很少有人知道,百度文心 5.0 的底牌究竟長什麼樣子。
能留在牌桌上,百度的底牌,是它獨特的生态位,是它巨大的體量和它平台型、生态型公司的特點,讓它可以與整個大賽道與有榮焉。
結語
相比兩年前,AI 大模型的賽道,變化其實沒有那麼大。
誠然,技術在日新月異地進步,玩家們來了又走,七百多天裏,賽道經歷了百端待舉,也經歷了 " 群模亂舞 "。今天市場重回理性,Deepseek 又強勢入局,頗有一掃六合之勢;Manus 又以智能體作為切口,讓人們對 AI 產生了新的遐想。
但未曾改變的是,AI 的方向仍然被一群人引領着。他們兼具浪漫主義與實幹家精神,技術頭腦與商業眼光,讓他們能夠一直目光如炬,照亮自己,也同樣照亮他人的前路。
今天的百度亦屬于這個行伍,他們是天生的挑戰者,挑戰更強的對手,挑戰更復雜的技術,挑戰昨天的自己。
當心中有夢的時候,面子又算得了什麼呢?
雷峰網 雷峰網