今天小編分享的科技經驗:面壁打響“端側智能體”第一槍,國產大模型五虎各走各路了,歡迎閱讀。
如果你最近關注 AI 圈,幾乎很難繞開「智能體(Agent)」這個詞。在能夠獨立建站、做股票分析、安排旅行日程的 Manus AI 智能體大火之後,國内外更多公司開始公開押注「AI 智能體」。
甲骨文 AI 集團副總裁 Miranda Nash 在接受采訪時表示,AI Agent(智能體)将成為今年科技公司的關注焦點。智譜 CEO 張鵬在最近舉行的 2025 中關村論壇年會上發布了全新智能體 AutoGLM 沉思,并表示 2025 年會是 AI Agent(智能體)的爆發之年。
不只是智譜和 AutoGLM 沉思,2025 中關村論壇年會上,這股智能體浪潮還有一個标志性落點——面壁智能正式發布「小鋼炮超級助手 cpmGO」,号稱是全球首個落地車端的純端側智能助手,也是面壁智能「模型即 Agent」願景的一次技術實踐。
圖 / 面壁智能
特别在于,這個小體積的智能助手并不跑在雲上,而是完全部署在汽車設備上,能在斷網、弱網環境下自主完成感知、理解、決策與執行的全過程。不同于我們熟悉的語音助手,面壁智能宣稱「小鋼炮」能看、能聽、能說,也能動手幫你控車、看屏、識人、識艙、甚至值班守車。
而作為 2022 年成立的國產大模型初創企業,面壁智能一直是将「高效大模型」「端側部署」作為自身的技術主線,旗下 MiniCPM 系列模型目前已經應用于 AI 手機、AI PC、智能座艙等多個終端形态。
在這次中關村論壇上,面壁智能聯合創始人兼 CEO 李大海還引用了知名 AI 工程師、Pleias 聯合創始人 Alexander Doria 的話表示,模型本身而非工作流,才是未來 AI 智能體的發展方向——模型即智能體,模型即產品,模型即互動:
「把小鋼炮這個端側模型送去上班,就是 Agent。」
面壁智能聯合創始人兼 CEO 李大海,圖 / 中關村論壇
李大海還透露,小鋼炮助手将于今年 Q3 正式随車上市,一些整車廠和 Tier1 廠商已經在開展測試。在這場智能體競賽中,面壁用一個能「上車」的 AI 智能體,率先打響了國產端側智能體的第一槍。
比起只會聽你說「打開空調」的傳統車載語音助手,小鋼炮超級助手 cpmGO 顯然要復雜得多。
作為一款部署在車端的純端側模型和超級助手,「小鋼炮」不依賴雲端推理,而是由面壁智能自研的 MiniCPM-o 全模态模型本地運行完成,從「感知 → 理解 → 推理 → 調用工具 → 實際執行」形成完整的智能體閉環。
首先能「看」。基于艙内外攝像頭,「小鋼炮」能識别乘客手勢、面部、車外動态等視覺信息,結合麥克風陣列進行語音感知,構建起強大的多模态感知系統。你抬個手、回個頭,它就能做出響應。
「小鋼炮」還能「理解」和「決策」,不僅能識别指令意圖,還能理解上下文。比如當你對着中控屏問「這個怎麼調亮一點」,它能理解「這個」指的是螢幕亮度,并跳轉到對應界面,執行調整操作。
這裡值得一提的是,面壁在去年 12 月就打造出了首個純端側部署、Always On 的「GUI Agent 螢幕助手」,所以不僅能看、能說,還能幹,在螢幕上實現「可見即可說」。在此基礎上,「小鋼炮」具備一定程度上的「工具調用能力」,不僅可以實現泛化語音車控、智能哨兵、兒童與寵物監控,也能直接在車機或者手機螢幕上自動完成一連串的操作任務。
尤其是在車端場景,可以避免手指觸屏,直接通過語音指揮導航,甚至讓小鋼炮拍照并分享給朋友。更重要的是,這一切在弱網、甚至無網的環境下都可運行,真正滿足端側智能體對低延遲、強隐私的剛性要求。
但「小鋼炮」更大的意義,在于它已經具備「智能體」的核心三要素:自主感知、意圖判斷、工具調用。它不是預設任務的腳本執行器,而是一個能夠理解用戶語境、做出合理判斷并完成任務的智能體和 AI 助手——當然,目前這個「助手」可能仍偏向執行型,而非規劃型。
至少從目前流出的信息和演示來看,面壁的「小鋼炮」能幹活,但還不太會「主動安排工作」,也缺少作為「虛拟駕駛助理」的人格化設定與情緒表達,同時大量場景還未廣泛上市驗證。另外,李大海雖然也在演進中提到了當前 Agent 智能體的一大通病是「長期上下文記憶差」,但「小鋼炮」目前也并未展現出解決這個挑戰的表現和能力。
也就是說,面壁用「小鋼炮」解決了智能體能不能「本地跑」、能不能「穩定幹活」的問題,但智能體夠不夠「聰明」、能不能「持續成長」的問題,可能還有待驗證和探索。
如果說 Manus 掀起了新一輪「智能體」的讨論熱潮,那麼在國内大模型初創公司中,誰在真正推動智能體落地?誰又在各走各的路?
目前來看,面壁智能、智譜、百川智能、月之暗面(Kimi)和深度求索(DeepSeek)這五家國產代表性的大模型初創公司,已經逐步顯露出各自明确而獨特的路線分野。
面壁智能:All in 端側,一步到崗
面壁的戰略關鍵詞可以總結為三點:「輕量模型、純端部署、場景落地」。MiniCPM 系列的定位從一開始就不是對标雲端大模型,而是追求能在 AI 手機、汽車、AI PC 等終端本地跑起來、幹活不掉鏈子的小模型。
相比多數同行還在「智能體是什麼」階段做演示、發論文,面壁已經算是把「智能體」落地走得比較快的廠商,至少已經部署到了汽車上,支持 real-time、多模态、無網絡運行,真正進入了真實的使用場景之中。
但這也意味着它必須面對工程難題、芯片适配、商業驗證等「重活」,路徑并不輕松。
智譜 AI:技術中台派,B 端 + 模型生态
圖 / 智譜
作為成立最早的大模型公司之一,智譜走的是大模型中台 + 企業服務路線,強調從預訓練模型、到行業數據集、再到垂直應用的全鏈條能力。智能體方面,智譜目前也更強調「從大模型能力中長出智能體」,更注重通用性與生态的建設。
與此同時,智譜還是國内最早一批走到「智能體」這一步的廠商,陸續推出了 GLM- PC 智能體、AutoGLM (手機)智能體以及最新的 AutoGLM 沉思智能體。其中 AutoGLM 沉思的使用場景與此前大火的 Manus 類似,可以進行行業研究、購物推薦、教案 / 教程制作、旅行攻略等。
不同的是,AutoGLM 沉思的背後,是智譜自研的全棧大模型技術,融合了 GLM-4 的通用能力、GLM-Z1 的反思能力、GLM-Z1-Rumination 的沉思能力,以及 AutoGLM 的自動執行能力。
百川智能:商業應用導向,All in 醫療大模型
圖 / 百川智能
搜狗創始人王小川創立的百川智能動作迅速,但方向選擇更為聚焦。從早期通用 Baichuan 系列大模型切入,再快速向垂類商業化場景推進,甚至對外表示 All in 醫療,打造醫療大模型和智能體。
與面壁不同的是,百川走的是「模型 + 知識圖譜 + 行業專家系統」的組合路線,更注重服務能力的定制性。簡單來說,智能體對它來說更像是「垂直領網域的執行引擎」,而不是通用平台。
月之暗面(Kimi):模型即服務,做好 C 端助手
圖 / 月之暗面
相比另外幾家,月之暗面走了一條完全不同的路線,幾乎将全部精力集中在「模型即服務」上,專注從大模型到 C 端產品—— Kimi 的垂直整合和用戶體驗的打磨。
盡管目前月之暗面還沒有推出真正意義上的智能體,但相信這件事已經在路上了。從根本上,月之暗面想做的 AI 智能助手很難只靠優秀的對話能力支撐,能夠學習和代替人類完成任務的智能體,應該說是題中應有之義。
另一方面,打造智能體的難點在于推理能力、記憶能力以及工具調用能力,推理是當下包括月之暗面在内所有大模型廠商的大勢所趨,而記憶(長上下文)則是 Kimi 主打的優勢之一。可以說,Kimi 唯一比較欠缺的就是工具調用能力,但這也是業界共同面對的挑戰。
DeepSeek:用開源大模型,驅動智能體爆發
圖 / DeepSeek
嚴格來說,DeepSeek 并沒有推出自己的智能體,但并不妨礙今天 DeepSeek 在智能體領網域舉足輕重的地位。尤其是開源的 DeepSeek R1 憑借相對較低的成本和相對較高的推理思考能力,幾乎是目前打造智能體最受歡迎的「底座模型」。
從戰略上看,DeepSeek 其實也不急于推出自己的智能體產品。從 DeepSeek 目前的動作來看,他們現階段還是更專注在大模型的效率與推理能力上持續優化,打造「可負擔、可定制、可擴展」的底層能力平台。
最好的例子就是大模型初創公司零一萬物在戰略轉型後,決定基于 DeepSeek(内核)打造 AI 時代的 Windows(系統)。事實上,包括 Manus 在内不少智能體就是基于 DeepSeek 或者 Claude 等基座大模型進行打造。
從橫向對比來看,面壁是五家中唯一一個将純端側智能體部署到端側實體設備、并形成閉環互動的公司。
但對面壁來說,「All in 端側」可能并非一個短期營銷标籤,而是一條被選定之後就幾乎沒有回頭路的技術路徑。這條路徑的好處很清楚:更強的隐私保護、更低的延遲、更高的部署靈活性,也更貼近智能手機、汽車等終端設備的算力現實。
不過它的難點也同樣清楚——模型必須更輕、更穩、更準,還得更懂「幹活」,最關鍵的是要面對端側算力受限的問題,通過智能體來完成復雜任務。所以我們看到,面壁智能在強調自己的工程能力:
MiniCPM 輕量高效、GUI Agent 螢幕助手落地、cpmGO 可在車内無網運行、執行全鏈條任務。
可部署不是終點。智能體能不能處理任務鏈條中的變量?能不能随着用戶習慣變化而成長?這些都是智能體要獨立完成的挑戰,更不要說是純端側的智能體。更現實的問題在于——體驗如何?這是需要面壁來回答的。
>