大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

Qwen 3發布,阿裡又點燃了AI開源的篝火

2025-04-29 简体 HK SG TW

今天小編分享的互聯網經驗:Qwen 3發布,阿裡又點燃了AI開源的篝火,歡迎閱讀。

文|鄧詠儀

編輯|蘇建勳

4 月 28 日,AI 圈子内的從業者們都在等待一件事:Qwen 3。

從中午開始,Qwen 3 即将發布的小道消息,已經滿天飛舞。Qwen 團隊負責人林俊旸也在 X 上暗示:" 看看我們今晚能否完成 Qwen 3 的工作 "。

來源:X(Twitter)

《智能湧現》所在的多個業内讨論群,充斥着不知真假的 Qwen 3 模型上傳截圖。AI 從業者瘋狂刷新 GitHub、HuggingFace 中的 Qwen 主頁,用 AI 生成 Qwen 3 上線海報、現場的模拟圖,刷屏各種表情包,狂歡直至深夜還未停歇。

Qwen 3 最終在凌晨 5 點上線。新一代的 Qwen 3 參數量僅為 DeepSeek-R1 的 1/3,首先是成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球頂尖模型。

更重要的是,Qwen 3 搭載了 Claude 3.7 等頂尖模型的混合推理機制,将 " 快思考 " 與 " 慢思考 " 集成進同一個模型,大大減少了算力消耗。

Qwen 3 的開源一共涉及 8 款不同架構和尺寸的模型,從 0.6B 開始,大到 235B,适用于更多類型的移動端設備。除了模型之外,Qwen 還順帶推出了 Agents 的原生框架,支持 MCP 協定,有着一股 " 讓所有人都要用上 Agents" 的勁頭。

DeepSeek 爆火後的 1 月份,大年初一前夜,阿裡急速上線了新模型 Qwen2.5-VL 和 Qwen2.5-Max,迅速秀了一把肌肉的同時,也賦予了阿裡集團更濃郁的 "AI 味兒 "。受此情緒的烘托,阿裡股價在春節前後階段大漲超 30%。

但比起這次的旗艦級模型 Qwen 3,上述模型都只是前奏。

對 Qwen 3 的萬眾期待,來自阿裡在 AI 開源社區的盛譽——如今 Qwen 已經是全球領先的開源模型系列,根據最新數據,阿裡通義已開源 200 餘個模型,全球下載量超 3 億次,千問衍生模型數超 10 萬個,已超越此前的開源霸主 Llama。

如果說 DeepSeek 是一支精銳的小分隊,快速在技術上衝鋒;那麼 Qwen 就是一個軍團,對大模型布局更早,也更積極做生态,展現了更廣的覆蓋度和社區活力。

某種程度上,Qwen 也是大模型落地的產業風向标。

一個典型的例子是,在 DeepSeek R1 發布後,很多企業和個人想私有化部署 " 滿血版 "DeepSeek(671B),單單硬體成本就要上百萬元,落地成本很高。

阿裡 Qwen 家族提供了更多的模型尺寸和類别,能幫助產業界更快驗證落地價值。用大白話來講,開發者不用自己裁剪模型,而是拿來即用,繼而快速落地。Qwen 13B 及以下的模型,可控性強,的确是如今 AI 應用領網域最受歡迎的模型之一。

DeepSeek R1 成為開源歷史上的錨點,也深深影響了大模型競争的走向。不同于此前模型廠商沉迷于刷 Benchmark、刷題,中國大廠們迎來必須要證明自己真正技術實力的周期。

Qwen 3 的發布,就是這樣一個時點。

滿血版成本為 1/3 個 DeepSeek R1,性能更強大

2024 年 9 月,阿裡雲在雲栖大會上發布了上一代模型 Qwen 2.5。Qwen2.5 一次性開源了從 0.5B 至 72B 共 6 個尺寸的全系列模型,覆蓋從端側到雲端的全場景需求,在代碼等多個類别中,都能達到 SOTA。

所有模型均允許商業使用與二次開發,這也被開發者稱為 " 真正開放的 AI"。

市場風傳新一代的 Qwen 3 會推出基于 MoE 架構,開源更多尺寸,成本能做到比 DeepSeek 更低——這些猜測都被一一證實。

Qwen 3 一共開源了 8 個尺寸的模型,分别為:

兩款 MoE(混合專家)模型的權重(指模型的決策偏好):30B(300 億)、235B(2350 億)參數

六款 Dense(密集)模型:包括包括 0.6B(6 億)、1.7B(17 億)、4B(40 億)、8B(80 億)、14B(140 億)、32B(320 億)

每款模型均達到了同尺寸開源模型中的 SOTA(最佳性能)。

Qwen 3 延續了阿裡開源的慷慨風格,依舊采用寬松的 Apache2.0 協定開源,首次支持 119 多種語言,全球開發者、研究機構和企業,都免費下載模型并商用。

Qwen 3 的最大看點,一是成本大幅下降,同時性能還有大幅提高。

在 Qwen 3 的訓練中,阿裡投入了令人驚訝的成本。Qwen 3 基于 36 萬億 token 進行預訓練,這是上一代模型 Qwen 2.5 的兩倍,在全球同等體量的頂尖模型中也能排到前列。

據 Qwen 團隊公開的數據,僅需 4 張 H20 即可部署 Qwen 3 滿血版,顯存占用僅為性能相近模型的三分之一。

成本降低,但性能反而更高了。

Qwen 的推理能力有非常顯著的提升。在數學、代碼生成和常識邏輯推理方面,Qwen 3 均超越先前的推理模型 QwQ(思考模式)和 Qwen2.5 模型(非思考模式)。

而在代碼、數學、通用能力等基準測試中,Qwen 3 也能與目前的頂尖模型 o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂尖模型。

△ Qwen 3 性能圖 來源:Qwen 3  

另外一個核心亮點,是 Qwen 模型對智能體(Agents)的全面适配。

如果說,OpenAI 的 o1 模型一腳踢開了推理模型的大門,DeepSeek R1 的發布,讓所有用戶見識到了推理模型的魔力:模型有像人類一樣的 " 思考鏈 ",有思考順序,不斷驗證是否正确,推演出認為合适的答案。

但只有深度思考模式的話,弊端也很明顯。哪怕詢問簡單的天氣、今天穿什麼,DeepSeek 會來回地糾結,自我設問,不斷驗證,經歷少則數十秒的過度思考——如果 DeepSeek 沒有将模型的思考鏈展示給用戶,幾乎沒有用戶能夠忍受延遲成這樣的對話體驗。

阿裡 CEO 吳泳銘曾在 2024 年 9 月的雲栖大會表示:"AI 最大想象力不在手機螢幕,而是接管數字世界,改變物理世界 "。

智能體是通往這種願景的重要路徑。所以,Qwen3 做成混合推理模型是相當關鍵的:在單一模型内,能無縫切換思考模式(用于復雜邏輯推理、數學和編碼)和非思考模式(用于高效的通用對話,比如詢問天氣、歷史知識等簡單信息搜索)。

推理與非推理任務的融合能力,實際上是讓模型:

能夠理解數字世界,更多強調的是非推理能力,如識别、檢索、分類,

能夠操作數字世界,更多強調的是推理能力,模型能自主規劃、決策、編程,典型應用如 Manus。

Qwen 3 的 API 可按需設定 " 思考預算 "(即預期最大深度思考的 tokens 數量),進行不同程度的思考,确保在各種場景下都能達到最佳性能。

在以前的機制中,用戶需要手動開關 " 深度思考 " 模式,一次對話中可能只能專注一種模式;但 Qwen 3 的新機制将這個選擇交給模型——模型能自動識别任務場景、選擇思考模式,減少了用戶對模型模式的幹預成本,也會帶來更絲滑的產品體驗。

混合推理是目前比較難的技術方向,需要極其精細、創新的設計及訓練,難度遠超訓練純推理模型。模型要學習兩種不同的輸出分布,要做到兩個模式融合,且基本不影響任何一種模式下的效果。

熱門模型中,現在只有 Qwen 3、Claude3.7 以及 Gemini 2.5 Flash 可以做到較好的混合推理。

混合推理會整體提高模型使用的性價比,既提升了智能水平,又整體降低了算力資源消耗。比如,Gemini-2.5-Flash,推理和非推理模式下的價格相差約 6 倍。

而為了讓所有人都能馬上開發 Agents,Qwen 團隊幾乎是提供了保姆式的工具箱:

Qwen 3 最近火爆的 MCP 協定,具備工具調用(Function Calling)能力,兩者都是 Agents 的主要框架

原生的 Qwen-Agent 框架,封裝了工具調用模板和工具調用解析器

API 服務也同步上線,企業可以直接通過通過阿裡雲百煉調用。

如果用裝修來舉例,這就像 Qwen 團隊把房子建好、完成硬裝,還給你提供了部分軟裝,開發者可以直接用上很多服務。這将大大降低編碼復雜性,開發門檻進一步下降,比如很多手機及電腦 Agent 操作等任務,就可以高效實現。

開源模型進入新一輪競争周期

在 DeepSeek R1 獲得爆炸性聲量,成為全球開源模型的标杆之後,模型發布不再是單純的產品更新,而是代表公司戰略的關鍵走向。

Qwen 3 的發布正值 DeepSeek R1 後,開源社區的新一輪競争已經開始:2025 年 4 月,Meta 旗下的 Llama 4 在 4 月初正式發布,但因為效果不佳而遭諸多批評;而此前屢屢受挫的 AI 巨頭 Google,也借着 Gemini 2.5 pro,在開源領網域扳回一城。

通用大模型層的能力仍在快速變遷中,很難有廠商能夠一直保持領先。在這個時點上,大模型團隊如何确定自己的發展主線,不只是個技術問題,更是對不同產品路線和商業判斷的策略問題。

在 Qwen 3 的發布上,可以看出一種更務實的開源策略。

比如,Qwen3 本次提出的模型尺寸,就比 Qwen 2.5 時的尺寸劃分就更細致。在資源受限的設備(如移動端、邊緣計算設備)上實現高效運行,Qwen 3 能同時保證一定的性能,滿足輕量級推理、對話等需求。

阿裡仔細解釋了各個模型的适用場景:

最小參數模型(如 0.6B 及 1.7B):支持開發者用于 speculative decoding(推測性解碼) 作實驗模型用,對科研很友好;

4B 模型:推薦在手機端側應用

8B 模型:推薦在電腦或者汽車端側應用

14B 模型:适合作落地應用,普通開發者有幾張卡也都能玩轉起來

32B 模型:開發者和企業最喜歡的模型尺寸,支持企業大規模部署商用

而在旗艦模型上,Qwen 3 的模型規模和架構,也是一個更精煉,更容易落地應用的設計。

以 Qwen 旗艦版模型 235B(235 億參數)和 DeepSeek R1 滿血版做直接對比:

Qwen 3 235B 采用中等規模 ( 235B ) 與高效激活設計 ( 22B 激活,約 9.4% ) ,只需 4 張 H20 GPU 即可部署;

DeepSeek-R1 追求超大規模 ( 671B ) 與稀疏激活 ( 37B 激活,約 5.5% ) ,推薦 16 卡 H20 配置,約 200 萬元。

從部署成本看,Qwen 3 是滿血版 R1 的 25%-35%,模型部署成本大降六到七成。

DeepSeek R1 之後,如果說大模型領網域達成了什麼共識,那便是——重新将資源、人力投入到模型層的技術突破,讓模型能力突破應用能力的上限。

如今大模型領網域,重新将目光轉向模型能力的突破。

從 Qwen 發布主題的變化,也能看出如今技術主線的變遷:Qwen 2.5 發布時,主題還是《擴展大型語言模型的邊界》,而到了 Qwen 3,則是《思深,行速》,專注提高模型能力的應用性能,拉低落地門檻,而非單純擴大參數規模。

現在,通義千問 Qwen 在全球下載量超過 3 億,在 HuggingFace 社區 2024 年全球模型下載量中,Qwen 占比已經超 30%。阿裡雲的模型開源策略,已經走出另一條更清晰的道路:真正成為應用的土壤。

歡迎交流

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們