今天小編分享的科技經驗:大模型爆火,文心一言起大早,趕晚集?,歡迎閲讀。
2 月 13 日,百度宣布 4 月 1 日起文心一言将全面免費。
2 月 14 日,百度宣布文心下一代模型 4.5 系列 6 月 30 日起開源。
受相關消息影響,截至 2 月 13 日港股收盤,百度集團股價當日累計上漲 5.74%,報收 94 港元 / 股。 要知道百度是國内最早的大模型,此前,文心一言采取基礎版免費、專業版收費的模式,專業版定價 59.9 元 / 月,連續包月優惠價 49.9 元 / 月。
而現在國内的大模型們,通義千問、Kimi、豆包、騰訊混元、deepseek 如雨後春筍,文心一言起了個大早,趕上這晚集了嗎?
01 曾是大模型賽道的先行者
文心一言:作為國内最早的 AI 語言模型,有人説對于您來説全都是後來者居上,你覺得是為什麼?
ChatGPT 爆火後,大模型對個人生產力的提升,以及在各行業的巨大商業價值愈加清晰。2023 年 2 月,就在百度公開宣布要推出 " 文心一言 " 之際,百度搜索、智能雲到自動駕駛等各產品方面的合作方随即明确需要這樣的產品,很快,超過 600 家合作夥伴宣布加入文心一言生态,期待盡早用上最新最先進的大語言模型。
2023 年 3 月 16 日,百度新一代大語言模型文心一言正式啓動邀測。8 月 31 日,文心一言率先向全社會全面開放。開放首日,文心一言共計回復網友超 3342 萬個問題。12 月 28 日,百度首席技術官王海峰在第十屆 WAVE SUMMIT 深度學習開發者大會上宣布文心一言用户規模已突破 1 億。
當時的李彥宏説:文心一言将改變雲計算遊戲規則。
百度高管誠實表示文心一言還不夠成熟之時,百度股價應聲而落:李彥宏誠實指出,自己體驗時并不完美,這類大語言模型還遠未到發展完善的階段;百度首席技術官王海峰也提到模型目前 " 訓練不夠充分 "。
2025 年的今天,文心一言好像也沒有突破以上 " 不完美 ",于是我向他提了這個問題。文心一言回答了我很多,其中它總結説 " 雖然作為早期 AI 語言模型的我具有一定的歷史地位,但在技術和應用不斷發展的背景下,後來的 A 語言模型确實在很多方面取得了顯著的優勢。"
02 很早卻很後
盡管 " 起大早 ",但 " 文心一言 " 是否真的領先?
百度深耕 AI 領網域十餘年,從底層的高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能雲、自動駕駛、小度等應用,形成了全球範圍内少有的在 " 芯片 - 框架 - 模型 - 應用 " 的 IT 四層技術棧架構,并且各個層面都有領先業界的自研技術和產品。
從優勢來看,文心一言背靠百度強大數據和技術積累,擁有海量中文語料庫,在中文理解方面具有一定優勢。剛才提到它擁有超過 600 家合作夥伴,百度根式積極布局應用生态,與多家企業合作,推動產品落地。
算力芯片,是至關重要的。2021 年 6 月,百度智能芯片及架構部門完成獨立融資,成立昆侖芯(北京)科技有限公司,首輪估值約 130 億元,百度芯片首席架構師歐陽劍出任昆侖芯公司 CEO。在此之前一年,百度已經試產了第一代雲端通用人工智能計算處理器 " 昆侖 1" 芯片,這在當時國内唯一一款經歷過互聯網大規模核心算法考驗的雲端 AI 芯片。在芯片部門獨立融資兩個月後,百度就宣布第二代昆侖芯片 " 昆侖 2" 正式量產。
不難看出,百度在 AI 領網域的布局極為宏大,野心勃勃。" 文心一言 " 不過是基于百度文心大模型展開研發進程中的一個微小環節。從百度文心官網呈現的内容便能窺知一二,在文心大模型的整體規劃裏,對話功能僅僅占據了極小的一部分。不妨設想一下,倘若沒有 ChatGPT 突如其來地在全球範圍内掀起巨大波瀾,引發廣泛關注,也許 " 文心一言 " 還會在項目排期表上沉寂許久,許久都難有問世的機會。
反觀 DeepSeek,成功好像不是偶然。
從最直觀的下載量來看,DeepSeek 在 140 個市場的應用商店下載排行榜上居首位,短短 18 天,下載量達到 1600 萬次,超過 ChatGPT 同期表現。
DeepSeek - R1 模型訓練使用了約 2000 個英偉達專用芯片,能充分利用英偉達芯片強大的并行計算能力和 CUDA 生态系統,實現高效的深度學習計算。在硬體适配方面,DeepSeek 也在積極探索與國產硬體的結合,如昇騰、海光等芯片,稀疏計算等技術使其在國產硬體上也能有較好的性能表現,降低了對特定國外芯片的依賴。
由于其創新的架構設計和訓練策略,DeepSeek 在推理等任務中對芯片的需求相對靈活,訓練時僅需百卡級規模。
除了 DeepSeek,可靈、即夢、豆包這些平台可能采用輕量化模型或定制化架構,注重互動體驗和特定場景的優化(如創意生成、對話互動)。總的來看,DeepSeek 适合復雜任務和技術場景。文心一言在中文處理和文化理解上表現突出。可靈、即夢、豆包更适合創意生成和輕量級互動。
03 百度,能趕上晚集嗎?
追求短期商業化,忽視技術深度研發,是網友在文心一言宣布開源之前對它的評價。
文心一言的不足确實很明顯,在技術層面與領先模型相比,在邏輯推理、創造性文本生成等方面存在差距。在應用層面,實際應用場景有限,用户體驗有待提升,缺乏現象級應用案例。在生态層面,開源生态建設滞後,開發者社區活躍度不高。
而百度文心一言宣布将于 4 月 1 日零時起取消收費限制,向所有用户開放其最新模型及全部高級功能,這一決策标志着國產大模型服務正式進入普惠化階段。
文心一言還同步上線了深度搜索功能。這項新功能具備更強大的思考規劃能力和工具調用能力,能夠為用户提供專家級的内容回復,并可以處理多場景任務,實現多模态的輸入與輸出。目前,用户可以在文心一言官網率先體驗這一功能,移動端 App 的相關功能也将很快推出。
這一舉措不僅體現了文心大模型在技術迭代和成本優化方面取得的突破,更展現出百度在 AI 領網域的戰略布局和市場競争決心。随着免費開放政策的實施,AI 技術的應用門檻将進一步降低,這對推動人工智能技術的普及和創新發展具有重要意義。
李彥宏本是大模型閉源的支持者。 在 2024 世界人工智能大會等場合,他多次表達了對閉源大模型的支持觀點。
從性能和成本角度來看,李彥宏認為同樣參數規模下,開源模型能力不如閉源,開源模型若想追平閉源,需要更大參數規模,這意味着推理成本更高、反應速度更慢。而閉源模型通常由專業團隊針對特定用途優化,與專門硬體緊密集成,可實現規模經濟,推理成本更低。
盡管他認為開源大模型在學術研究、教學領網域等特定場景下有存在的價值,但在激烈的商業競争環境中,需要讓業務效率比同行更高、成本比同行更低,這時商業化的閉源模型是最能打的。
李彥宏曾表示,閉源才有真正的商業模式,才能聚集人才和算力,優秀人才會更傾向于選擇閉源模型的團隊,因為閉源可以提供更好的資源和發展空間。
DeepSeek 等的崛起給文心一言帶來一定壓力,而開源可吸引更多開發者和用户,提升百度在市場中的競争力。另一方面,随着技術發展,大模型推理成本大幅下降,百度有條件進行開源,推動技術更廣泛應用。
AI 是否也将走向價格戰?文心一言同步宣布免費的還有 OpenAI。北京時間 2 月 13 日凌晨 3 點,OpenAI 首席執行官 Sam Altman 也公布了 GPT-4.5/5 将很快陸續發布,免費版 ChatGPT 将在标準智能設定下無限制使用 GPT-5 進行對話。據悉,OpenAI 很快發布 GPT-4.5,就是傳説中的獵户座模型(Orion),也是最後一個非思維鏈模型。接着會整合 GPT 和 O 系列兩大模型打造一個全新的系統,能自動選擇思考和非思考功能,适用于多種任務。奧爾特曼稱,這将是 OpenAI 最後一個 " 非思維鏈模型 "。與 o3 及 OpenAI 其他推理模型不同,非思維鏈模型在數學和物理等領網域往往不太可靠。
推動兩大閉源模型的 DeepSeek 是這麼看文心一言的翻盤的:
百度系股票應聲大漲,對企業級用户大面積部署可謂利好,但能否成為李彥宏口中的超級應用? 讓我們拭目以待。