大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科技

发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕

2025-05-01 简体 HK SG TW

今天小编分享的科技经验:发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕,欢迎阅读。

2025 年已经过去 1/3,如果用关键词来概括 AI 领網域的发展你会想到什么?这是我想到的:开源、创新加速加速加速。

2 月是「DeepSeek」的,R1 以所有人意想不到的方式,让全球执牛耳的 AI 开发者、创业者、投资人把目光锁定在「DeepSeek」「中国」「开源」上。

4 月是「开源模型」的,发令枪是 Meta 喊的。被 DeepSeek 盖过风头后,2025 年 2 月 19 日,坐不住的 Meta 率先官宣——首个生成式 AI 开发者大会 LlamaCon 将于当地 4 月 29 日(北京时间 4 月 30 日)举行,颇有重新夺回「AI 开源界老大」江湖地位的意欲。

但 AI 领網域的产品发布节奏就是很微妙,什么时候发布似乎取决于对手的动作,作为一种心照不宣的默契,Meta 一声枪响让 4 月底成为开源模型的主场。

整个 4 月甚至更早,AI 开发者们都在各大社交平台「蹲」开源领網域「三大头牌」的新发布:DeepSeek-R2、Qwen3 以及 Llama4。Llama4 由于本月初的发布低于预期,似乎少了一些热度。

目前看起来,4 月底最受关注的还是中国队,R2 呼之欲出,Qwen3 终于来了。

4 月 29 日凌晨 5 点,阿里巴巴开源新一代通义千问模型 Qwen3,参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。X 平台的开发者网友甚至把今天定义为「Happy Qwen3 Day」,不仅因为 Qwen3 全面超越 R1,更因为 Qwen3 家族的多尺寸、内置 MCP 支持、支持混合推理等实用性的功能点。

官方技术报告进一步给出了 Qwen3 的几大亮点:

「探索智能上限」再突破:通过扩大预训练和强化学习的规模,实现了更高层次的智能;

国内首个「混合推理模型」:无缝集成了思考模式与非思考模式,为用户提供了灵活控制思考预算的能力;

增强了 Agent 能力:正从专注于训练模型的时代过渡到以训练 Agent 为中心的时代。

对于 Qwen3,个人用户现在就可以在「通义」APP 或 chat.qwen.ai 网页直接体验,夸克也即将全线接入 Qwen3。开发者和企业则可以免费在魔搭社区、HuggingFace 等平台下载模型并商用,或通过阿里云百炼调用 Qwen3 的 API 服务。

憋了这么久的 Qwen3 到底怎么样?又代表哪些模型发展的趋势?

01 Qwen3,登顶全球最强开源模型

Qwen3 包含 2 个 MoE 和 6 个密集模型,阿里云开源了两个 MoE 模型的权重,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。

其中,旗舰型号 Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。

此外,据阿里云官方介绍,Qwen3 是国内首个「混合推理模型」。「快思考」与「慢思考」集成进同一个模型,对简单需求可低算力「秒回」答案,对复杂问题可多步骤「深度思考」,大大节省算力消耗。

Qwen3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下所有国产模型及全球开源模型的性能新高:在奥数水平的 AIME25 测评中,Qwen3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,Qwen3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,Qwen3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。

性能大幅提升的同时,Qwen3 的部署成本还大幅下降,仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。

Qwen3 性能|图片来源:阿里云

此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

据介绍,Qwen3-235B-A22B 是一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型;Qwen3-30B-A3B 则是一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

得益于在预训练、大规模强化学习和推理模式整合方面取得的显著进展,Qwen3 主打「思考更深、行动更快」,更好地构建 AI 应用。Qwen3 预训练数据量达 36T,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。

值得注意的是,这次 Qwen3 的发布,主打混合推理,但是需要思考的长度最短也是 1024tokens,否则如果问题所需要的推理预算用不满 1024tokens,根本感受不到可以调节精度的混合推理模型的好。也就无法发挥用 Qwen3 不同程度的思考,灵活满足 AI 应用和不同场景对性能和成本的多样需求。

截图来源:X

02 大模型全面转向「混合推理模型」和「Agent」

在 Qwen3 发布的前一天,X 平台已有「行业人士」——日本的大模型厂商 SakanaAI 的一位工程师敏锐地捕捉到了 Qwen3 的重点。当天,在 AI 领網域最重要的学术会议之一 ICLR 2025 的一个工作坊上,阿里云通义实验室通义千问负责人林俊旸透露了 Qwen 的下一步方向:推理模型和非推理模型的统一,以及面向 agent 的大模型。

这正是今天发布的 Qwen3 最大的两个特点,同时也是大模型厂商们正在集体发生的转向。

2025 年 2 月 25 日,Anthropic 发布了最新的旗舰模型 Claude 3.7 Sonnet,同时也称作是市场上首个混合推理模型。这意味着 Claude 3.7 Sonnet 能够生成即时的响应(快思考),也可以进行延展的、逐步的思考(慢思考)。API 用户还可以细粒度地控制模型的思考时长;当给定更长的思考时间,理论上会有更高质量的答案。

Anthropic 表示,混合推理模型的架构代表下一代前沿模型,可以让模型像人类用同一个大腦一样,既能快速反应又能深度思考,这既能为用户创造更无缝的体验,也能让用户通过 API 使用 Claude 3.7 Sonnet 时,可以控制思考的预算。比如:可以告诉 Claude 最多思考 N 个 token,N 的取值可以达到其输出限制的 128K token,从而在回答质量与速度(及成本)之间进行权衡。

「混合推理架构」也得到了 OpenAI 的青睐。Sam Altman 在更早的时间看到,当前的模型和产品供应已经变得非常复杂,希望 AI 能「开箱即用」、简化产品供应,「我们和你一样讨厌模型选择器,想要回归神奇的统一智能,之后,我们的一个重要目标是通过创建能够使用我们所有工具、知道何时需要长时间思考或不需要的系统,统一 o 系列模型和 GPT 系列模型,整体上能广泛适用于各种任务。」

就像在 DeepSeek-R1 里一样,点选「深度思考」背后调用的是推理模型 R1 做的长推理,不选则调用的是基座模型 V3 即时生成的答案。现在,模型厂商把「思考的颗粒度」这个选择权更灵活、广泛地交给用户来控制推理预算。

在 Qwen3 中,可以滑动「思考预算」的按钮,来控制思考的最大长度,从而匹配合适的推理质量和成本。

在思考模式下,Qwen3 模型会逐步推理,经过深思熟虑后给出最终答案,适合需要深入思考的复杂问题。在非思考模式下,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。这种灵活性使用户能够根据具体任务控制模型进行「思考」的程度。这两种模式的结合大大增强了模型实现稳定且高效的「思考预算」控制能力,在成本效益和推理质量之间实现更优的平衡。

另一个模型厂商的转向则是 Agent。随着 Manus 验证了 Claude 3.5 Sonnet 达到了通用 agent 的一些能力,加上模型调用工具、实现 agent 能力的统一協定—— MCP 在越来越大的范围内被拥抱,下一代模型要面向 agent、面向实际场景来优化。

就 Qwen3 来说,正在迈向以训练 Agent 为中心的阶段,当前 Qwen3 优化了 Agent 和 代码能力,同时也加强了对 MCP 的支持。据称,Qwen3 原生支持 MCP 協定,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的 Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电腦 Agent 操作等任务。

在该示例中,Qwen3 思考并自主调用工具到 Github 数开源模型获得的 star,继续思考并调用绘图工具制作图片,并调用工具保存。|视频来源:阿里云

03 开源模型新一轮竞赛开启

Qwen3 的发布,意味着开源模型领網域新一轮「三国杀」已然开始。

事实上,随着 DeepSeek 的横空出世,加上 OpenAI、字节等大厂调整对开源的态度,开源已然成为大模型赛道的大势所趋。而 Llama、Qwen 和 DeepSeek,正是目前开源领網域最有竞争力的玩家。

Hugging Face 联合创始人、CEO Clement Delangue 发推暗示 DeepSeek 即将带来新发布。|截图来源:X

而此前 OpenAI 和 DeepSeek 的成功已经证明,互联网时代的生态、用户和产品壁垒,今天在 AI 时代并没有互联网时代那样牢不可摧,模型能力才是基础大模型公司的核心竞争力。而 Llama、Qwen 和 DeepSeek 的胜者,有可能在下一个发布周期到来前(至少在 OpenAI 的开源模型发布前),成为整个 AI 行业的引领者。

虽然新一代模型能力的强弱,还要等待 Llama 和 DeepSeek 的发布,但值得关注的是,这三家开源模型厂商的生态策略亦有差异,这点从模型的侧重点就能看出端倪。

DeepSeek 和 Meta 的侧重点也有不同,但一个共同点都是不太重视 ToB,至少是在服务生态的建设上并不成功。而这点也是 Qwen 和其背后的阿里云最重视的部分。

极客公园曾在此前的文章里写过,脱胎于阿里云 Qwen,是最有以开源模型技术领先性、广泛全面开源的策略,追求生态建设的架势。阿里的 AI 战略里除了追求 AGI,也同样重视 AI 基础设施建设,以及更上层的与阿里的电商、钉钉、夸克等 AI 应用的结合。

此前,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,「阿里云是全世界唯一一家积极研发基础大模型并全方位开源、全方位贡献的云计算厂商。」

而 Qwen 模型下载量和衍生模型数量这两个衡量的生态的指标也同样领先。根据阿里云官方的最新数据,阿里通义已开源 200 余个模型,全球下载量超 3 亿次,千问衍生模型数超 10 万个,已经超越 Llama 位居全球开源模型的第一。

而新模型选择在进一步优化推理成本、混合推理和 Agent 上发力,显然 Qwen 瞄准的是开发者和 B 端用户的部署需求。这也将成为 Qwen 与 DeepSeek、Llama、OpenAI 等竞争对手最大的不同,也是阿里能否赢得 AI 时代的一张船票的关键所在。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們