大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

清晨重磅!阿裡發布并開源Qwen3,無縫集成思考模式、多語言、便于Agent調用

2025-04-29 简体 HK SG TW

今天小編分享的互聯網經驗:清晨重磅!阿裡發布并開源Qwen3,無縫集成思考模式、多語言、便于Agent調用,歡迎閱讀。

阿裡巴巴周一發布并開源通義千問 3.0(Qwen3)系列模型,并稱其在數學和編程等多個方面均可與 DeepSeek 的性能相媲美。與其他主流模型相比,Qwen3 還顯著降低了部署成本。阿裡表示,Qwen3 無縫集成兩種思考模式,支持 119 種語言,便于 Agent 調用。

性能媲美 DeepSeek R1、OpenAI o1,全部開源

Qwen3 系列包括兩個專家混合 ( MoE ) 模型和另外六個模型。阿裡巴巴表示,最新發型的旗艦模型 Qwen3-235B-A22B 在代碼、數學、通用能力等基準測試中,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級模型相比,表現出極具競争力。

此外,被稱為 " 專家混合 "(MoE,Mixture-of-Experts)模型的 Qwen3-30B-A3B 的激活參數數量是 QwQ-32B 的 10%,表現更勝一籌,甚至像 Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能。這類系統模拟人類解決問題的思維方式,将任務劃分為更小的數據集,類似于讓一組各有所長的專家分别負責不同部分,從而提升整體效率。

同時,阿裡巴巴還開源了兩個 MoE 模型的權重:擁有 2350 多億總參數和 220 多億激活參數的 Qwen3-235B-A22B,以及擁有約 300 億總參數和 30 億激活參數的小型 MoE 模型 Qwen3-30B-A3B。此外,六個 Dense 模型也已開源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 許可下開源。

" 混合型 " 模型,兩種思考模式

阿裡巴巴表示,Qwen 3 系列是 " 混合型 " 模型,既可以花時間 " 推理 " 以解決復雜問題,也可以快速回答簡單請求,分别叫做 " 思考模式 " 和 " 非思考模式 "。" 思考模式 " 中的推理能力使得模型能夠有效地進行自我事實核查,類似于 OpenAI 的 o3 模型,但代價是推理過程中的延遲時間較高。

Qwen 團隊在博客文章中寫道:

這種靈活性使用戶能夠根據具體任務控制模型進行 " 思考 " 的程度。例如,復雜的問題可以通過擴展推理步驟來解決,而簡單的問題則可以直接快速作答,無需延遲。

至關重要的是,這兩種模式的結合大大增強了模型實現穩定且高效的 " 思考預算 " 控制能力。如上文所述,Qwen3 展現出可擴展且平滑的性能提升,這與分配的計算推理預算直接相關。

這樣的設計讓用戶能夠更輕松地為不同任務配置特定的預算,在成本效益和推理質量之間實現更優的平衡。

訓練數據量是 Qwen2.5 的兩倍,便于 Agent 調用

阿裡巴巴表示,Qwen3 系列支持 119 種語言,并基于近 36 萬億個 token(标記)進行訓練,使用的數據量是 Qwen2.5 的兩倍。Token 是模型處理的基本數據單元,約 100 萬個 token 相當于 75 萬英文單詞。阿裡巴巴稱,Qwen3 的訓練數據包括教材、問答對、代碼片段等多種内容。

據介紹,Qwen3 預訓練過程分為三個階段。在第一階段(S1),模型在超過 30 萬億個 token 上進行了預訓練,上下文長度為 4K token。這一階段為模型提供了基本的語言技能和通用知識。

在第二階段(S2),訓練則通過增加知識密集型數據(如 STEM、編程和推理任務)的比例來改進數據集,随後模型又在額外的 5 萬億個 token 上進行了預訓練。在最後階段則使用高質量的長上下文數據将上下文長度擴展到 32K token,确保模型能夠有效地處理更長的輸入。

阿裡巴巴表示,由于模型架構的改進、訓練數據的增加以及更有效的訓練方法,Qwen3 Dense 基礎模型的整體性能與參數更多的 Qwen2.5 基礎模型相當。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 分别與 Qwen2.5-3B/7B/14B/32B/72B-Base 表現相當。特别是在 STEM、編碼和推理等領網域,Qwen3 Dense 基礎模型的表現甚至超過了更大規模的 Qwen2.5 模型。對于 Qwen3 MoE 基礎模型,它們在僅使用 10% 激活參數的情況下達到了與 Qwen2.5 Dense 基礎模型相似的性能,顯著節省了訓練和推理成本。

而在後訓練階段,阿裡使用多樣的的長思維鏈數據對模型進行了微調,涵蓋了數學、代碼、邏輯推理和 STEM 問題等多種任務和領網域,為模型配備基本的推理能力。然後通過大規模強化學習,利用基于規則的獎勵來增強模型的探索和鑽研能力。

阿裡巴巴表示,Qwen3 在調用工具(tool-calling)、執行指令以及復制特定數據格式等能力方面表現出色,推薦用戶使用 Qwen-Agent 來充分發揮 Qwen3 的 Agent 能力。Qwen-Agent 内部封裝了工具調用模板和工具調用解析器,大大降低了代碼復雜性。

除了提供下載版本外,Qwen3 還可以通過 Fireworks AI、Hyperbolic 等雲服務提供商使用。

目标仍對準 AGI

OpenAI、谷歌和 Anthropic 近期也陸續推出了多款新模型。OpenAI 近日表示,也計劃在未來幾個月發布一款更加 " 開放 " 的模型,模仿人類推理方式,這标志着其策略出現轉變,此前 DeepSeek 和阿裡巴巴已經率先推出了開源 AI 系統。

目前,阿裡巴巴正以 Qwen 為核心,構建其 AI 版圖。今年 2 月,首席執行官吳泳銘表示,公司目前的 " 首要目标 " 是實現通用人工智能(AGI)——即打造具備人類智力水平的 AI 系統。

阿裡表示,Qwen3 代表了該公司在通往通用人工智能(AGI)和超級人工智能(ASI)旅程中的一個重要裡程碑。展望未來,阿裡計劃從多個維度提升模型,包括優化模型架構和訓練方法,以實現幾個關鍵目标:擴展數據規模、增加模型大小、延長上下文長度、拓寬模态範圍,并利用環境反饋推進強化學習以進行長周期推理。

開源社區振奮

阿裡 Qwen3 的發布讓 AI 社區感到激動,有網友獻上經典 Meme:

有網友說,

在我的測試中,235B 在高維張量運算方面的表現相當于 Sonnet。

這是一個非常出色的模型,

感謝你們。

有網友對 Qwen3 贊不絕口:

如果不是親眼看到螢幕上實時生成的 tokens,我根本不會相信那些基準測試結果。???? 簡直像魔法一樣 ????

而開源 AI 的支持者則更加興奮。有網友說:

" 有了一個開源 32B 大模型,性能跟 Gemini 2.5 Pro 不相上下。"

" 我們徹底殺回來了!"

網友感謝阿裡積極推動開源:

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們