今天小編分享的科學經驗:百度版深度思考模型免費上線!API定價比DeepSeek R1再砍一半,歡迎閱讀。
百度文心大模型重磅更新,剛剛如期而至。
并且一來就是倆:文心大模型 4.5和文心大模型 X1同步官網上線,免費向用戶開放。
其中,文心大模型 4.5 主打原生多模态。
而文心大模型 X1 是百度版深度思考模型,具備更強的理解、規劃、反思、進化能力,同樣支持多模态。
百度表示,這是 " 首個自主運用工具的深度思考模型 "。
目前,文心大模型 4.5 已經同步上線百度智能雲千帆大模型平台,企業用戶和開發者現在就能調用 API。文心大模型 X1 也即将上線——API 調用價格約為 DeepSeek R1 的一半。
文心大模型 4.5:原生多模态基礎大模型
文心大模型 4.5 是百度自主研發的新一代原生多模态基礎大模型,通過多個模态聯合建模實現協同優化,語言能力、理解、生成、邏輯、記憶能力得到全面提升。
梗圖什麼的,主打一個穩穩拿捏:
從具體測評結果來看,多模态能力方面,文心大模型 4.5 跟 GPT-4o 的對比如下:
文本能力方面,也追趕上了 DeepSeek-V3 和 GPT-4.5,平均分 79.6,高于 GPT-4.5 的 79.14。
百度也透露了文心大模型 4.5 背後的關鍵技術:
FlashMask 動态注意力掩碼:加速大模型靈活注意力掩碼計算,有效提升長序列建模能力和訓練效率,優化長文處理能力和多輪互動表現;
多模态異構專家擴展技術:根據模态特點構建模态異構專家,結合自适應模态感知損失函數,解決不同模态梯度不均衡問題,提升多模态融合能力;
時空維度表征壓縮技術:在時空維度對圖片和視頻的語義表征進行高效壓縮,大幅提升多模态數據訓練效率,增強了從長視頻中吸取世界知識的能力;
基于知識點的大規模數據構建技術:基于知識分級采樣、數據壓縮與融合、稀缺知識點定向合成技術,構建高知識密度預訓練數據,提升模型學習效率,大幅降低模型幻覺;
基于自反饋的 Post-training 技術:融合多種評價方式的自反饋迭代式後訓練技術,全面提升強化學習穩定性和魯棒性,大幅提升預訓練模型對齊人類意圖能力。
文心大模型 X1:百度版深度思考模型
作為能力更全面的深度思考模型,文心大模型 X1 強化了在中文知識問答、文學創作、文稿寫作、日常對話、邏輯推理、復雜計算及工具調用等方面的能力。
值得關注的是,文心大模型 X1 能 "自主運用工具",已支持高級搜索、文檔問答、圖片理解、AI 繪圖、代碼解釋器、網頁鏈接讀取、TreeMind 樹圖、百度學術檢索、商業信息查詢、加盟信息查詢等多款工具。
例如,讓文心大模型 X1 使用中國各朝代歷史人物典故,替換《寒窯賦》原文中的事例,它能展現出清晰的思維鏈:
找到和原文相似的人物典故→注意文風和句式→檢查人物典故的适配度→行文保持結構流暢,最後生成了和原文立意、文風句式都基本一致的文本。
文心大模型 X1 背後的關鍵技術包括:
遞進式強化學習訓練方法:創新性地應用遞進式強化學習方法,在創作、搜索、工具調用、推理等場景全面提升模型的綜合應用能力;
基于思維鏈和行動鏈的端到端訓練:針對深度搜索、工具調用等場景,根據結果反饋進行端到端的模型訓練,顯著提升訓練效果;
多元統一的獎勵系統:建立了統一的獎勵系統,融合多種類型的獎勵機制,為模型訓練提供更加魯棒的反饋。
價格比 DeepSeek R1 砍一半
兩款全新文心大模型,API 調用價格也已出爐:
文心大模型 4.5 API,輸入價格 0.004 元 / 千 tokens,輸出價格 0.016 元 / 千 tokens;
文心大模型 X1 API,輸入價格 0.002 元 / 千 tokens,輸出價格 0.008 元 / 千 tokens。
X1 與 DeepSeek R1 标準時段價格(緩存未命中)相比,價格便宜了一半。
屬于是又給推力模型價格砍了一大刀(doge)。
以及,開源方面,依據此前預告,百度将在 6 月 30 日正式開源文心大模型,并預計在下半年發布文心大模型 5.0。
One More Thing,量子位已經第一時間開啟了深度評測,歡迎來蹲後續稿件 ~
文心一言官網:https://yiyan.baidu.com
參考鏈接: