摸DeepSeek过河也得自身硬! 想开后的文小言，真香！ - 大酷樂

今天小编分享的科学经验：摸DeepSeek过河也得自身硬! 想开后的文小言，真香！，欢迎阅读。

刚刚，百度文小言全面更新了。

基于多模型的能力，文小言更新了包括全新大语音模型、图片问答等在内的一系列有趣儿又实用的新玩法。

比如图片问答，拍四只不同鹦鹉的大头照，问它鹦鹉性别（doge）。

你还真别说，这都能回答对，分析得头头是道：

而且现在图片问答还可以这样玩，基于原图元素一键二创，小雏菊杯子摇身幻化出小雏菊手机壳、抽纸盒：

内外兼收，支持多模型融合调度

本次更新，文小言直接把自家刚上线不久的新模型，包括文心大模型 X1 和 4.5，和 " 隔壁学霸 "DeepSeek-R1 满血版摆一块儿了，进行了多模型融合调度。

现在，文小言的用户在一个页面可随意切换使用 DeepSeek 或是文心 X1/4.5 特定模型，爱翻谁的牌子就翻谁的。

文心 X1 是百度半个月前刚发布的号称是 " 首个自主运用工具的深度思考模型 "。

文心大模型 4.5 是百度自主研发的新一代原生多模态基础大模型，在多模态互動、理解方面更强，原生模型联合预训练能实现更深层次的模态融合。

另外，文小言上线了「自动模式」，它能够根据用户提出的问题识别用户需求，自动选择最合适的模型。

现在，两款新模型直接和 DeepSeek 融合调度，让文小言拥有了更强的 " 大腦 "。据介绍，他们对 DeepSeek 还进行了多种功能维度的融合，打通了图片问答、生图等链路。

我们先来考验一下这个更强 " 大腦 " 的逻辑思维能力。

抛给它一个腦筋急转弯：

在一个封闭房间里有三盏灯，门外有三个开关，每个开关分别控制一盏灯。你只能进房间一次。如何判断出每个开关对应哪盏灯 ?

只见文小言三下五除二，轻轻松松一步步推理给出了标准答案。判断依据中也会解释打开一个开关等待 5-10 分钟是为了让灯发热等诸如此类的细节。

和一般推理模型不一样的是，在给出答案之后，它还会自动推荐视频，有详解这道题目的视频，也有和此题类似的更多题目。

如此一来，就方便了大家对题目的延伸理解。

接下来再来一道著名概率难题—— " 二孩悖论 "。

这道题初始表述至少可追溯至 1959 年，由著名数学家马丁 · 加德纳在《科学美国人》杂志的 " 数学游戏 " 专栏中提出，曾引发数学家们的广泛争论，直到现在大家对这道题目的讨论似乎也还没有停止。

问题是酱婶儿的：

史密斯先生有两个孩子。其中至少有一个是男孩。问：两个孩子都是男孩的概率是多少？

加德纳最初给出的答案是 1/3，但他后来承认第二个问题的表述存在歧义，若 " 至少有一个是男孩 " 这一信息的获取方式不同，答案也可能是 1/2。

那么文小言是怎么回答的？它是 1/3 派，还是 1/2？

文小言在分析中成功发现歧义，认为：

根据传统概率问题，概率应该是 1/3，但问题的答案可能取决于信息的获取方式……另一个孩子是男孩的概率也能是 1/2。

最终文小言通过基础概率空间、条件筛选、目标概率计算分布解析，并用条件概率公式进行验证得出答案 1/3，同时明确给出了歧义辨析。

当然，末尾同样附带有推荐视频。

妙就妙在，你还可以让文小言帮你绘制图表，这样分析过程就更一目了然了。

它还挺 " 懂事儿 " 自己做了补充，连常见混淆点对比表也一并绘制出来了。

也可以再让它生成配图，「自动模式」无需切换模型：

而若切换模型特意指定文心 X1 来解决问题，它的优势在于，能够更灵活地调用各种工具。

据百度介绍，文心 X1 利用递进式强化学习训练方法、基于思维链和行动链的端到端训练、多元统一的奖励系统等技术，文心 X1 的推理输出是直接可以图文混合连续完成任务。

比如告诉它：

家里的客厅朝向是南偏东，35 平米，有一整扇落地窗，请根据要求画出浅色奶油风、暗黑轻奢风、跳脱童趣风三种不同风格的装修效果，三个户型必须一致。

对于这样的问题，文心 X1 能多次连续调用 AI 绘图等工具，一口气搞定：

基于文心 X1 多模态自主运用工具深度思考、文心 4.5 原生多模态能力以及 DeepSeek 的推理能力，文小言图片问答能力更强了，还上新了不少多模态新功能。

多模态功能再更新

现在上新的图片问答功能可以这样玩：

能一次性上传或拍摄多张图联合分析问答；也可在拍摄的过程中直接用语音问，说完话它会自动拍摄并识别语音进行作答。

基于文心 4.5 图片理解力，它的识别更强，能进行多图比较；基于文心 X1、DeepSeek，它的推理 / 输出更强。就像是红蓝 buff 都加上了。

所以，仅凭借一个山头的一张照片，它就能分析出这是哪座山：

更复杂一些的任务，比如天气变暖想出国旅游，人生地不熟定哪个酒店拿捏不准？也可以让它帮忙参谋参谋。

直接上传几张酒店信息截图，提出需求：

从里面推荐 2 个酒店，适合女生旅游住，有早餐，交通方便，性价比高，给 RMB 报价和推荐理由。

轻轻松松就能 get 一份综合的推荐指南：

诸如此类，比如上传几张外文菜单，告诉它想吃什么口味的、预算是多少，它也可以帮你分析总结。

另外，百度把拍照搜题功能也整合过来了，文小言会自动调出百度多年积累的教育资源，很多题目都有视频版讲解：

值得一提的是，新增的 " 图个冷知识 " 功能更富趣味性，用户可预设 " 历史学者 "、" 科技达人 " 等人设视角，为同一图片赋予多维解读。

例如，当用户询问 " 猫窗探秘，为何猫爱窗边的科学真相？"，文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。

再来看多模态另一个方面，语音通话功能，由百度的全新语音大模型加持。

据了解，该模型是百度在业界首个推出基于全新互相关注意力（cross attention）的端到端语音语言大模型，调用成本较行业平均降低 5-10 倍，推理响应速度极快，将语音互動等待时间压缩至 1 秒左右，极大提升了互動流畅性。

用下来，整体对话流畅自然、延迟度低，belike：

特别要指出的是其中的百变大咖功能，支持角色模仿和方言，能用各种有趣的腔调陪你聊天；还有知识问答功能更专注于常识知识科普。

有了百变大咖，所以，你还可以听到广西版的睡前故事：

除了这些功能，文小言还融合了 AI 修图、AI 视频生成、写作帮手、翻译、手抄报、听听音乐等诸多功能，感兴趣的童鞋可以亲自上手试试。

下面是 AI 视频生成，让图片动起来的效果：

AI 落地趋势变了

总结文小言这一次的大翻新，不难发现它正朝着两个关键方向转变：生态更开放、用户价值第一。

这次直接将 DeepSeek 接入文小言，不怕跟自家新模型做竞争，足以见其开放的决心。

当大家还在争论 " 文心 X1 与 DeepSeek 孰强孰弱 "，文小言早已跳出了单一模型竞争的维度，携手更多伙伴，究其本质，是为了带给用户更好的体验。

为什么会有这种转变？

背后是 AI 落地趋势正在发生的变化。

自 DeepSeek 从开源圈杀出重围，大模型竞赛逐渐呈现出一种戏剧性转折，行业意识到模型本身正逐渐成为一种可替换的 " 标准件 "。以前比模型，就像比谁家的菜刀钢材硬，现在更比谁切菜顺手，甚至能帮你把土豆丝炒好了。

当技术红利逐步释放后，如何让 AI 解决真实场景问题成为关键，技术优势必须转化为可感知的用户价值。

百度在 2025 开年后，不论是文小言免费，还是文心大模型开源，种种系列革新举措，就是盯准了 AI 落地的新趋势。

在这种背景下，文小言选择的路径颇具启示性——生态层选择开放，另外在场景层深耕，同时在价值层进行重构。

作为国产自研大模型出发最早、积累最厚的玩家，文小言的新进展，不容小觑，或将有望成为新一轮被模仿的对象。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

点亮星标

科技前沿进展每日见