今天小編分享的科學經驗:摸DeepSeek過河也得自身硬! 想開後的文小言,真香!,歡迎閱讀。
剛剛,百度文小言全面更新了。
基于多模型的能力,文小言更新了包括全新大語音模型、圖片問答等在内的一系列有趣兒又實用的新玩法。
比如圖片問答,拍四只不同鹦鹉的大頭照,問它鹦鹉性别(doge)。
你還真别說,這都能回答對,分析得頭頭是道:
而且現在圖片問答還可以這樣玩,基于原圖元素一鍵二創,小雛菊杯子搖身幻化出小雛菊手機殼、抽紙盒:
内外兼收,支持多模型融合調度
本次更新,文小言直接把自家剛上線不久的新模型,包括文心大模型 X1 和 4.5,和 " 隔壁學霸 "DeepSeek-R1 滿血版擺一塊兒了,進行了多模型融合調度。
現在,文小言的用戶在一個頁面可随意切換使用 DeepSeek 或是文心 X1/4.5 特定模型,愛翻誰的牌子就翻誰的。
文心 X1 是百度半個月前剛發布的号稱是 " 首個自主運用工具的深度思考模型 "。
文心大模型 4.5 是百度自主研發的新一代原生多模态基礎大模型,在多模态互動、理解方面更強,原生模型聯合預訓練能實現更深層次的模态融合。
另外,文小言上線了「自動模式」,它能夠根據用戶提出的問題識别用戶需求,自動選擇最合适的模型。
現在,兩款新模型直接和 DeepSeek 融合調度,讓文小言擁有了更強的 " 大腦 "。據介紹,他們對 DeepSeek 還進行了多種功能維度的融合,打通了圖片問答、生圖等鏈路。
我們先來考驗一下這個更強 " 大腦 " 的邏輯思維能力。
抛給它一個腦筋急轉彎:
在一個封閉房間裡有三盞燈,門外有三個開關,每個開關分别控制一盞燈。你只能進房間一次。如何判斷出每個開關對應哪盞燈 ?
只見文小言三下五除二,輕輕松松一步步推理給出了标準答案。判斷依據中也會解釋打開一個開關等待 5-10 分鍾是為了讓燈發熱等諸如此類的細節。
和一般推理模型不一樣的是,在給出答案之後,它還會自動推薦視頻,有詳解這道題目的視頻,也有和此題類似的更多題目。
如此一來,就方便了大家對題目的延伸理解。
接下來再來一道著名概率難題—— " 二孩悖論 "。
這道題初始表述至少可追溯至 1959 年,由著名數學家馬丁 · 加德納在《科學美國人》雜志的 " 數學遊戲 " 專欄中提出,曾引發數學家們的廣泛争論,直到現在大家對這道題目的讨論似乎也還沒有停止。
問題是醬嬸兒的:
史密斯先生有兩個孩子。其中至少有一個是男孩。問:兩個孩子都是男孩的概率是多少?
加德納最初給出的答案是 1/3,但他後來承認第二個問題的表述存在歧義,若 " 至少有一個是男孩 " 這一信息的獲取方式不同,答案也可能是 1/2。
那麼文小言是怎麼回答的?它是 1/3 派,還是 1/2?
文小言在分析中成功發現歧義,認為:
根據傳統概率問題,概率應該是 1/3,但問題的答案可能取決于信息的獲取方式……另一個孩子是男孩的概率也能是 1/2。
最終文小言通過基礎概率空間、條件篩選、目标概率計算分布解析,并用條件概率公式進行驗證得出答案 1/3,同時明确給出了歧義辨析。
當然,末尾同樣附帶有推薦視頻。
妙就妙在,你還可以讓文小言幫你繪制圖表,這樣分析過程就更一目了然了。
它還挺 " 懂事兒 " 自己做了補充,連常見混淆點對比表也一并繪制出來了。
也可以再讓它生成配圖,「自動模式」無需切換模型:
而若切換模型特意指定文心 X1 來解決問題,它的優勢在于,能夠更靈活地調用各種工具。
據百度介紹,文心 X1 利用遞進式強化學習訓練方法、基于思維鏈和行動鏈的端到端訓練、多元統一的獎勵系統等技術,文心 X1 的推理輸出是直接可以圖文混合連續完成任務。
比如告訴它:
家裡的客廳朝向是南偏東,35 平米,有一整扇落地窗,請根據要求畫出淺色奶油風、暗黑輕奢風、跳脫童趣風三種不同風格的裝修效果,三個戶型必須一致。
對于這樣的問題,文心 X1 能多次連續調用 AI 繪圖等工具,一口氣搞定:
基于文心 X1 多模态自主運用工具深度思考、文心 4.5 原生多模态能力以及 DeepSeek 的推理能力,文小言圖片問答能力更強了,還上新了不少多模态新功能。
多模态功能再更新
現在上新的圖片問答功能可以這樣玩:
能一次性上傳或拍攝多張圖聯合分析問答;也可在拍攝的過程中直接用語音問,說完話它會自動拍攝并識别語音進行作答。
基于文心 4.5 圖片理解力,它的識别更強,能進行多圖比較;基于文心 X1、DeepSeek,它的推理 / 輸出更強。就像是紅藍 buff 都加上了。
所以,僅憑借一個山頭的一張照片,它就能分析出這是哪座山:
更復雜一些的任務,比如天氣變暖想出國旅遊,人生地不熟定哪個酒店拿捏不準?也可以讓它幫忙參謀參謀。
直接上傳幾張酒店信息截圖,提出需求:
從裡面推薦 2 個酒店,适合女生旅遊住,有早餐,交通方便,性價比高,給 RMB 報價和推薦理由。
輕輕松松就能 get 一份綜合的推薦指南:
諸如此類,比如上傳幾張外文菜單,告訴它想吃什麼口味的、預算是多少,它也可以幫你分析總結。
另外,百度把拍照搜題功能也整合過來了,文小言會自動調出百度多年積累的教育資源,很多題目都有視頻版講解:
值得一提的是,新增的 " 圖個冷知識 " 功能更富趣味性,用戶可預設 " 歷史學者 "、" 科技達人 " 等人設視角,為同一圖片賦予多維解讀。
例如,當用戶詢問 " 貓窗探秘,為何貓愛窗邊的科學真相?",文小言能從狩獵本能、能量獲取、領地意識等角度給出獨特解讀。
再來看多模态另一個方面,語音通話功能,由百度的全新語音大模型加持。
據了解,該模型是百度在業界首個推出基于全新互相關注意力(cross attention)的端到端語音語言大模型,調用成本較行業平均降低 5-10 倍,推理響應速度極快,将語音互動等待時間壓縮至 1 秒左右,極大提升了互動流暢性。
用下來,整體對話流暢自然、延遲度低,belike:
特别要指出的是其中的百變大咖功能,支持角色模仿和方言,能用各種有趣的腔調陪你聊天;還有知識問答功能更專注于常識知識科普。
有了百變大咖,所以,你還可以聽到廣西版的睡前故事:
除了這些功能,文小言還融合了 AI 修圖、AI 視頻生成、寫作幫手、翻譯、手抄報、聽聽音樂等諸多功能,感興趣的童鞋可以親自上手試試。
下面是 AI 視頻生成,讓圖片動起來的效果:
AI 落地趨勢變了
總結文小言這一次的大翻新,不難發現它正朝着兩個關鍵方向轉變:生态更開放、用戶價值第一。
這次直接将 DeepSeek 接入文小言,不怕跟自家新模型做競争,足以見其開放的決心。
當大家還在争論 " 文心 X1 與 DeepSeek 孰強孰弱 ",文小言早已跳出了單一模型競争的維度,攜手更多夥伴,究其本質,是為了帶給用戶更好的體驗。
為什麼會有這種轉變?
背後是 AI 落地趨勢正在發生的變化。
自 DeepSeek 從開源圈殺出重圍,大模型競賽逐漸呈現出一種戲劇性轉折,行業意識到模型本身正逐漸成為一種可替換的 " 标準件 "。以前比模型,就像比誰家的菜刀鋼材硬,現在更比誰切菜順手,甚至能幫你把土豆絲炒好了。
當技術紅利逐步釋放後,如何讓 AI 解決真實場景問題成為關鍵,技術優勢必須轉化為可感知的用戶價值。
百度在 2025 開年後,不論是文小言免費,還是文心大模型開源,種種系列革新舉措,就是盯準了 AI 落地的新趨勢。
在這種背景下,文小言選擇的路徑頗具啟示性——生态層選擇開放,另外在場景層深耕,同時在價值層進行重構。
作為國產自研大模型出發最早、積累最厚的玩家,文小言的新進展,不容小觑,或将有望成為新一輪被模仿的對象。
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
點亮星标
科技前沿進展每日見