摸DeepSeek過河也得自身硬! 想開後的文小言，真香！

今天小編分享的科學經驗：摸DeepSeek過河也得自身硬! 想開後的文小言，真香！，歡迎閱讀。

剛剛，百度文小言全面更新了。

基于多模型的能力，文小言更新了包括全新大語音模型、圖片問答等在内的一系列有趣兒又實用的新玩法。

比如圖片問答，拍四只不同鹦鹉的大頭照，問它鹦鹉性别（doge）。

你還真别說，這都能回答對，分析得頭頭是道：

而且現在圖片問答還可以這樣玩，基于原圖元素一鍵二創，小雛菊杯子搖身幻化出小雛菊手機殼、抽紙盒：

内外兼收，支持多模型融合調度

本次更新，文小言直接把自家剛上線不久的新模型，包括文心大模型 X1 和 4.5，和 " 隔壁學霸 "DeepSeek-R1 滿血版擺一塊兒了，進行了多模型融合調度。

現在，文小言的用戶在一個頁面可随意切換使用 DeepSeek 或是文心 X1/4.5 特定模型，愛翻誰的牌子就翻誰的。

文心 X1 是百度半個月前剛發布的号稱是 " 首個自主運用工具的深度思考模型 "。

文心大模型 4.5 是百度自主研發的新一代原生多模态基礎大模型，在多模态互動、理解方面更強，原生模型聯合預訓練能實現更深層次的模态融合。

另外，文小言上線了「自動模式」，它能夠根據用戶提出的問題識别用戶需求，自動選擇最合适的模型。

現在，兩款新模型直接和 DeepSeek 融合調度，讓文小言擁有了更強的 " 大腦 "。據介紹，他們對 DeepSeek 還進行了多種功能維度的融合，打通了圖片問答、生圖等鏈路。

我們先來考驗一下這個更強 " 大腦 " 的邏輯思維能力。

抛給它一個腦筋急轉彎：

在一個封閉房間裡有三盞燈，門外有三個開關，每個開關分别控制一盞燈。你只能進房間一次。如何判斷出每個開關對應哪盞燈 ?

只見文小言三下五除二，輕輕松松一步步推理給出了标準答案。判斷依據中也會解釋打開一個開關等待 5-10 分鍾是為了讓燈發熱等諸如此類的細節。

和一般推理模型不一樣的是，在給出答案之後，它還會自動推薦視頻，有詳解這道題目的視頻，也有和此題類似的更多題目。

如此一來，就方便了大家對題目的延伸理解。

接下來再來一道著名概率難題—— " 二孩悖論 "。

這道題初始表述至少可追溯至 1959 年，由著名數學家馬丁 · 加德納在《科學美國人》雜志的 " 數學遊戲 " 專欄中提出，曾引發數學家們的廣泛争論，直到現在大家對這道題目的讨論似乎也還沒有停止。

問題是醬嬸兒的：

史密斯先生有兩個孩子。其中至少有一個是男孩。問：兩個孩子都是男孩的概率是多少？

加德納最初給出的答案是 1/3，但他後來承認第二個問題的表述存在歧義，若 " 至少有一個是男孩 " 這一信息的獲取方式不同，答案也可能是 1/2。

那麼文小言是怎麼回答的？它是 1/3 派，還是 1/2？

文小言在分析中成功發現歧義，認為：

根據傳統概率問題，概率應該是 1/3，但問題的答案可能取決于信息的獲取方式……另一個孩子是男孩的概率也能是 1/2。

最終文小言通過基礎概率空間、條件篩選、目标概率計算分布解析，并用條件概率公式進行驗證得出答案 1/3，同時明确給出了歧義辨析。

當然，末尾同樣附帶有推薦視頻。

妙就妙在，你還可以讓文小言幫你繪制圖表，這樣分析過程就更一目了然了。

它還挺 " 懂事兒 " 自己做了補充，連常見混淆點對比表也一并繪制出來了。

也可以再讓它生成配圖，「自動模式」無需切換模型：

而若切換模型特意指定文心 X1 來解決問題，它的優勢在于，能夠更靈活地調用各種工具。

據百度介紹，文心 X1 利用遞進式強化學習訓練方法、基于思維鏈和行動鏈的端到端訓練、多元統一的獎勵系統等技術，文心 X1 的推理輸出是直接可以圖文混合連續完成任務。

比如告訴它：

家裡的客廳朝向是南偏東，35 平米，有一整扇落地窗，請根據要求畫出淺色奶油風、暗黑輕奢風、跳脫童趣風三種不同風格的裝修效果，三個戶型必須一致。

對于這樣的問題，文心 X1 能多次連續調用 AI 繪圖等工具，一口氣搞定：

基于文心 X1 多模态自主運用工具深度思考、文心 4.5 原生多模态能力以及 DeepSeek 的推理能力，文小言圖片問答能力更強了，還上新了不少多模态新功能。

多模态功能再更新

現在上新的圖片問答功能可以這樣玩：

能一次性上傳或拍攝多張圖聯合分析問答；也可在拍攝的過程中直接用語音問，說完話它會自動拍攝并識别語音進行作答。

基于文心 4.5 圖片理解力，它的識别更強，能進行多圖比較；基于文心 X1、DeepSeek，它的推理 / 輸出更強。就像是紅藍 buff 都加上了。

所以，僅憑借一個山頭的一張照片，它就能分析出這是哪座山：

更復雜一些的任務，比如天氣變暖想出國旅遊，人生地不熟定哪個酒店拿捏不準？也可以讓它幫忙參謀參謀。

直接上傳幾張酒店信息截圖，提出需求：

從裡面推薦 2 個酒店，适合女生旅遊住，有早餐，交通方便，性價比高，給 RMB 報價和推薦理由。

輕輕松松就能 get 一份綜合的推薦指南：

諸如此類，比如上傳幾張外文菜單，告訴它想吃什麼口味的、預算是多少，它也可以幫你分析總結。

另外，百度把拍照搜題功能也整合過來了，文小言會自動調出百度多年積累的教育資源，很多題目都有視頻版講解：

值得一提的是，新增的 " 圖個冷知識 " 功能更富趣味性，用戶可預設 " 歷史學者 "、" 科技達人 " 等人設視角，為同一圖片賦予多維解讀。

例如，當用戶詢問 " 貓窗探秘，為何貓愛窗邊的科學真相？"，文小言能從狩獵本能、能量獲取、領地意識等角度給出獨特解讀。

再來看多模态另一個方面，語音通話功能，由百度的全新語音大模型加持。

據了解，該模型是百度在業界首個推出基于全新互相關注意力（cross attention）的端到端語音語言大模型，調用成本較行業平均降低 5-10 倍，推理響應速度極快，将語音互動等待時間壓縮至 1 秒左右，極大提升了互動流暢性。

用下來，整體對話流暢自然、延遲度低，belike：

特别要指出的是其中的百變大咖功能，支持角色模仿和方言，能用各種有趣的腔調陪你聊天；還有知識問答功能更專注于常識知識科普。

有了百變大咖，所以，你還可以聽到廣西版的睡前故事：

除了這些功能，文小言還融合了 AI 修圖、AI 視頻生成、寫作幫手、翻譯、手抄報、聽聽音樂等諸多功能，感興趣的童鞋可以親自上手試試。

下面是 AI 視頻生成，讓圖片動起來的效果：

AI 落地趨勢變了

總結文小言這一次的大翻新，不難發現它正朝着兩個關鍵方向轉變：生态更開放、用戶價值第一。

這次直接将 DeepSeek 接入文小言，不怕跟自家新模型做競争，足以見其開放的決心。

當大家還在争論 " 文心 X1 與 DeepSeek 孰強孰弱 "，文小言早已跳出了單一模型競争的維度，攜手更多夥伴，究其本質，是為了帶給用戶更好的體驗。

為什麼會有這種轉變？

背後是 AI 落地趨勢正在發生的變化。

自 DeepSeek 從開源圈殺出重圍，大模型競賽逐漸呈現出一種戲劇性轉折，行業意識到模型本身正逐漸成為一種可替換的 " 标準件 "。以前比模型，就像比誰家的菜刀鋼材硬，現在更比誰切菜順手，甚至能幫你把土豆絲炒好了。

當技術紅利逐步釋放後，如何讓 AI 解決真實場景問題成為關鍵，技術優勢必須轉化為可感知的用戶價值。

百度在 2025 開年後，不論是文小言免費，還是文心大模型開源，種種系列革新舉措，就是盯準了 AI 落地的新趨勢。

在這種背景下，文小言選擇的路徑頗具啟示性——生态層選擇開放，另外在場景層深耕，同時在價值層進行重構。

作為國產自研大模型出發最早、積累最厚的玩家，文小言的新進展，不容小觑，或将有望成為新一輪被模仿的對象。

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法！

— 完 —

點亮星标

科技前沿進展每日見