今天小編分享的财經經驗:一天之内,阿裡、騰訊大動作,歡迎閱讀。
4 月 29 日凌晨,阿裡巴巴開源新一代通義千問模型 Qwen3(簡稱千問 3),參數量僅為 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球頂尖模型,登頂全球最強開源模型。
千問 3 是國内首個 " 混合推理模型 "," 快思考 " 與 " 慢思考 " 集成進同一個模型,對簡單需求可低算力 " 秒回 " 答案,對復雜問題可多步驟 " 深度思考 ",大大節省算力消耗。
千問 3 采用混合專家(MoE)架構,總參數量 235B,激活僅需 22B。千問 3 預訓練數據量達 36T ,并在後訓練階段多輪強化學習,将非思考模式無縫整合到思考模型中。千問 3 在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,即創下所有國產模型及全球開源模型的性能新高:在奧數水平的 AIME25 測評中,千問 3 斬獲 81.5 分,刷新開源紀錄;在考察代碼能力的 LiveCodeBench 評測中,千問 3 突破 70 分大關,表現甚至超過 Grok3;在評估模型人類偏好對齊的 ArenaHard 測評中,千問 3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。
性能大幅提升的同時,千問 3 的部署成本還大幅下降,僅需 4 張 H20 即可部署千問 3 滿血版,顯存占用僅為性能相近模型的三分之一。
值得一提的是,記者獲悉,就在同一天,騰訊對其混元大模型研發體系進行了全面重構,圍繞算力、算法和數據三大核心板塊,刷新團隊部署,加碼研發投入。
調整後,騰訊成立兩個新的部門:大語言模型部和多模态模型部,分别負責探索大語言模型和多模态大模型的前沿技術,持續迭代基礎模型,提升模型能力。
同時,進一步加強大模型數據能力和平台底座建設,其中數據平台部專注大模型數據全流程管理與建設,機器學習平台部則聚焦機器學習與大數據融合平台建設,為 AI 模型訓練推理、大數據業務提供全面高效的 PaaS 平台底座,共同支撐騰訊混元大模型技術研發。
騰訊相關人士表示,這意味着騰訊在快速調整組織架構以應對日新月異的大模型行業發展,這次調整有利于整合資源,優化研發流程,進一步提升騰訊在 AI 領網域的長期技術作戰能力。
混元是騰訊自研的通用大模型,支持文本、影像、視頻和 3D 等多種模态内容的理解與生成。今年以來,混元大模型技術迭代速度顯著加快,相繼推出快思考模型 Turbo S 和深度思考模型 T1,均在公開基準測試中達到業界領先水平,在視頻生成和 3D 生成領網域也推出多個新版本模型。混元 3D 生成、視頻生成、DiT 文生圖及千億參數 MoE 語言模型等模型均已對外開源,GitHub 總 Star 數超過 2.9 萬。
近期,國產大模型發展按下提速鍵 , 生成式人工智能正帶來產業變革。據央視網報道,目前,我國已形成覆蓋基礎層、框架層、模型層、應用層的完整人工智能產業體系。最新數據顯示,截至 2025 年 4 月 9 日,我國人工智能專利申請量達 1576379 件,占全球申請量的 38.58%,位居全球首位。目前,我國已累計培育 400 餘家人工智能領網域國家級專精特新 " 小巨人 " 企業,占據全球 1/10 的人工智能產業規模。