今天小编分享的科技经验:面壁打响“端侧智能体”第一枪,国产大模型五虎各走各路了,欢迎阅读。
如果你最近关注 AI 圈,几乎很难绕开「智能体(Agent)」这个词。在能够独立建站、做股票分析、安排旅行日程的 Manus AI 智能体大火之后,国内外更多公司开始公开押注「AI 智能体」。
甲骨文 AI 集团副总裁 Miranda Nash 在接受采访时表示,AI Agent(智能体)将成为今年科技公司的关注焦点。智谱 CEO 张鹏在最近举行的 2025 中关村论坛年会上发布了全新智能体 AutoGLM 沉思,并表示 2025 年会是 AI Agent(智能体)的爆发之年。
不只是智谱和 AutoGLM 沉思,2025 中关村论坛年会上,这股智能体浪潮还有一个标志性落点——面壁智能正式发布「小钢炮超级助手 cpmGO」,号称是全球首个落地车端的纯端侧智能助手,也是面壁智能「模型即 Agent」愿景的一次技术实践。
图 / 面壁智能
特别在于,这个小体积的智能助手并不跑在云上,而是完全部署在汽车设备上,能在断网、弱网环境下自主完成感知、理解、决策与执行的全过程。不同于我们熟悉的语音助手,面壁智能宣称「小钢炮」能看、能听、能说,也能动手帮你控车、看屏、识人、识舱、甚至值班守车。
而作为 2022 年成立的国产大模型初创企业,面壁智能一直是将「高效大模型」「端侧部署」作为自身的技术主线,旗下 MiniCPM 系列模型目前已经应用于 AI 手机、AI PC、智能座舱等多个终端形态。
在这次中关村论坛上,面壁智能联合创始人兼 CEO 李大海还引用了知名 AI 工程师、Pleias 联合创始人 Alexander Doria 的话表示,模型本身而非工作流,才是未来 AI 智能体的发展方向——模型即智能体,模型即产品,模型即互動:
「把小钢炮这个端侧模型送去上班,就是 Agent。」
面壁智能联合创始人兼 CEO 李大海,图 / 中关村论坛
李大海还透露,小钢炮助手将于今年 Q3 正式随车上市,一些整车厂和 Tier1 厂商已经在开展测试。在这场智能体竞赛中,面壁用一个能「上车」的 AI 智能体,率先打响了国产端侧智能体的第一枪。
比起只会听你说「打开空调」的传统车载语音助手,小钢炮超级助手 cpmGO 显然要复杂得多。
作为一款部署在车端的纯端侧模型和超级助手,「小钢炮」不依赖云端推理,而是由面壁智能自研的 MiniCPM-o 全模态模型本地运行完成,从「感知 → 理解 → 推理 → 调用工具 → 实际执行」形成完整的智能体闭环。
首先能「看」。基于舱内外摄像头,「小钢炮」能识别乘客手势、面部、车外动态等视觉信息,结合麦克风阵列进行语音感知,构建起强大的多模态感知系统。你抬个手、回个头,它就能做出响应。
「小钢炮」还能「理解」和「决策」,不仅能识别指令意图,还能理解上下文。比如当你对着中控屏问「这个怎么调亮一点」,它能理解「这个」指的是螢幕亮度,并跳转到对应界面,执行调整操作。
这里值得一提的是,面壁在去年 12 月就打造出了首个纯端侧部署、Always On 的「GUI Agent 螢幕助手」,所以不仅能看、能说,还能干,在螢幕上实现「可见即可说」。在此基础上,「小钢炮」具备一定程度上的「工具调用能力」,不仅可以实现泛化语音车控、智能哨兵、儿童与宠物监控,也能直接在车机或者手机螢幕上自动完成一连串的操作任务。
尤其是在车端场景,可以避免手指触屏,直接通过语音指挥导航,甚至让小钢炮拍照并分享给朋友。更重要的是,这一切在弱网、甚至无网的环境下都可运行,真正满足端侧智能体对低延迟、强隐私的刚性要求。
但「小钢炮」更大的意义,在于它已经具备「智能体」的核心三要素:自主感知、意图判断、工具调用。它不是预设任务的脚本执行器,而是一个能够理解用户语境、做出合理判断并完成任务的智能体和 AI 助手——当然,目前这个「助手」可能仍偏向执行型,而非规划型。
至少从目前流出的信息和演示来看,面壁的「小钢炮」能干活,但还不太会「主动安排工作」,也缺少作为「虚拟驾驶助理」的人格化设定与情绪表达,同时大量场景还未广泛上市验证。另外,李大海虽然也在演进中提到了当前 Agent 智能体的一大通病是「长期上下文记忆差」,但「小钢炮」目前也并未展现出解决这个挑战的表现和能力。
也就是说,面壁用「小钢炮」解决了智能体能不能「本地跑」、能不能「稳定干活」的问题,但智能体够不够「聪明」、能不能「持续成长」的问题,可能还有待验证和探索。
如果说 Manus 掀起了新一轮「智能体」的讨论热潮,那么在国内大模型初创公司中,谁在真正推动智能体落地?谁又在各走各的路?
目前来看,面壁智能、智谱、百川智能、月之暗面(Kimi)和深度求索(DeepSeek)这五家国产代表性的大模型初创公司,已经逐步显露出各自明确而独特的路线分野。
面壁智能:All in 端侧,一步到岗
面壁的战略关键词可以总结为三点:「轻量模型、纯端部署、场景落地」。MiniCPM 系列的定位从一开始就不是对标云端大模型,而是追求能在 AI 手机、汽车、AI PC 等终端本地跑起来、干活不掉链子的小模型。
相比多数同行还在「智能体是什么」阶段做演示、发论文,面壁已经算是把「智能体」落地走得比较快的厂商,至少已经部署到了汽车上,支持 real-time、多模态、无网络运行,真正进入了真实的使用场景之中。
但这也意味着它必须面对工程难题、芯片适配、商业验证等「重活」,路径并不轻松。
智谱 AI:技术中台派,B 端 + 模型生态
图 / 智谱
作为成立最早的大模型公司之一,智谱走的是大模型中台 + 企业服务路线,强调从预训练模型、到行业数据集、再到垂直应用的全链条能力。智能体方面,智谱目前也更强调「从大模型能力中长出智能体」,更注重通用性与生态的建设。
与此同时,智谱还是国内最早一批走到「智能体」这一步的厂商,陆续推出了 GLM- PC 智能体、AutoGLM (手机)智能体以及最新的 AutoGLM 沉思智能体。其中 AutoGLM 沉思的使用场景与此前大火的 Manus 类似,可以进行行业研究、购物推荐、教案 / 教程制作、旅行攻略等。
不同的是,AutoGLM 沉思的背后,是智谱自研的全栈大模型技术,融合了 GLM-4 的通用能力、GLM-Z1 的反思能力、GLM-Z1-Rumination 的沉思能力,以及 AutoGLM 的自动执行能力。
百川智能:商业应用导向,All in 医疗大模型
图 / 百川智能
搜狗创始人王小川创立的百川智能动作迅速,但方向选择更为聚焦。从早期通用 Baichuan 系列大模型切入,再快速向垂类商业化场景推进,甚至对外表示 All in 医疗,打造医疗大模型和智能体。
与面壁不同的是,百川走的是「模型 + 知识图谱 + 行业专家系统」的组合路线,更注重服务能力的定制性。简单来说,智能体对它来说更像是「垂直领網域的执行引擎」,而不是通用平台。
月之暗面(Kimi):模型即服务,做好 C 端助手
图 / 月之暗面
相比另外几家,月之暗面走了一条完全不同的路线,几乎将全部精力集中在「模型即服务」上,专注从大模型到 C 端产品—— Kimi 的垂直整合和用户体验的打磨。
尽管目前月之暗面还没有推出真正意义上的智能体,但相信这件事已经在路上了。从根本上,月之暗面想做的 AI 智能助手很难只靠优秀的对话能力支撑,能够学习和代替人类完成任务的智能体,应该说是题中应有之义。
另一方面,打造智能体的难点在于推理能力、记忆能力以及工具调用能力,推理是当下包括月之暗面在内所有大模型厂商的大势所趋,而记忆(长上下文)则是 Kimi 主打的优势之一。可以说,Kimi 唯一比较欠缺的就是工具调用能力,但这也是业界共同面对的挑战。
DeepSeek:用开源大模型,驱动智能体爆发
图 / DeepSeek
严格来说,DeepSeek 并没有推出自己的智能体,但并不妨碍今天 DeepSeek 在智能体领網域举足轻重的地位。尤其是开源的 DeepSeek R1 凭借相对较低的成本和相对较高的推理思考能力,几乎是目前打造智能体最受欢迎的「底座模型」。
从战略上看,DeepSeek 其实也不急于推出自己的智能体产品。从 DeepSeek 目前的动作来看,他们现阶段还是更专注在大模型的效率与推理能力上持续优化,打造「可负担、可定制、可扩展」的底层能力平台。
最好的例子就是大模型初创公司零一万物在战略转型后,决定基于 DeepSeek(内核)打造 AI 时代的 Windows(系统)。事实上,包括 Manus 在内不少智能体就是基于 DeepSeek 或者 Claude 等基座大模型进行打造。
从横向对比来看,面壁是五家中唯一一个将纯端侧智能体部署到端侧实体设备、并形成闭环互動的公司。
但对面壁来说,「All in 端侧」可能并非一个短期营销标签,而是一条被选定之后就几乎没有回头路的技术路径。这条路径的好处很清楚:更强的隐私保护、更低的延迟、更高的部署灵活性,也更贴近智能手机、汽车等终端设备的算力现实。
不过它的难点也同样清楚——模型必须更轻、更稳、更准,还得更懂「干活」,最关键的是要面对端侧算力受限的问题,通过智能体来完成复杂任务。所以我们看到,面壁智能在强调自己的工程能力:
MiniCPM 轻量高效、GUI Agent 螢幕助手落地、cpmGO 可在车内无网运行、执行全链条任务。
可部署不是终点。智能体能不能处理任务链条中的变量?能不能随着用户习惯变化而成长?这些都是智能体要独立完成的挑战,更不要说是纯端侧的智能体。更现实的问题在于——体验如何?这是需要面壁来回答的。
>