大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

抢先DeepSeek R2,阿里通义正式发布国内首个通用推理模型

2025-05-01 简体 HK SG TW

今天小编分享的互联网经验:抢先DeepSeek R2,阿里通义正式发布国内首个通用推理模型,欢迎阅读。

文 | 电厂,作者 | 董温淑,编辑 | 高宇雷

Qwen 3 模型即将发布的消息,已经流传了一个月的时间;特别是最近一周内,坊间对 Qwen 3 的猜测不断在 " 憋个大的 " 与 " 最终难产 " 之间反复横跳。

直到 4 月 29 日凌晨,这款备受关注的模型终于亮相,号称全面超越 DeepSeek R1。

杭州一家中厂的算法从业者告诉「电厂」:" 近几个月网上不少 DeepSeek R2 的泄露信息,有人说 R2 要在 5 月份发。Qwen 3(这个时间发布)肯定是想抢个先机。"

在一家国产大模型开放平台工作的刘露则透露,其所在的团队提前不到 12 小时获知 Qwen3 的发布消息,团队成员连夜完成了 Qwen 3 系列模型在该平台的部署上线。

无论如何,Qwen 3 的亮相都意味着开源 AI 大模型的技术能力再次被刷新;与之相继的,将是产业链下游应用者迎来一次新的生态选择。

「电厂」注意到,Qwen 3 发布仅 10 小时,已经有开发者发布了套壳 Qwen 3 系列模型的 ChatBot 类产品。

基于 Qwen 3 的第三方 ChatBot 类产品,图源 / 网络‍

国内首个混合推理模型,成本 / 性能超越 DeepSeek R1

根据阿里云通义千问团队官宣,Qwen3 系列开源了 8 个模型,其中包含 2 个 MoE(混合专家)大模型和 6 个 Dense(稠密)大模型。

本次 Qwen3 系列模型尤为值得关注的创新是该模型支持思考模式、非思考模式两种运行方式。

在思考模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法适合需要深入思考的复杂问题;在非思考模式中,模型会提供快速、近乎即时的响应,适用于对速度要求高于深度的简单问题。

换句话说,Qwen3 打破了 DeepSeek R1 等思维链模型慢思考的单一模式,而是为用户赋予灵活选择的权利。这也是如今全球大模型市场发展的重要方向之一。

不同 Benchmark 下 Qwen3 两种思考模式对比,图源 / 阿里云通义‍

今年 2 月份,由部分 OpenAI 前员工创办的 Anthropic 在全球范围内率先发布了名为 Claude 3.7 Sonnet 的混合推理模型,被视为融合了 DeepSeek V3(适于通用任务)与 R1(适于推理任务)模型的各自优势。

这种混合模式引起了业界的广泛关注。OpenAI 创始人 Sam Altman 就曾表示,OpenAI 接下来将研发 " 它能够知道什么时候应该长时间思考,并且通常适用于广泛任务 " 的模型。而 Qwen3 是国内首个混合推理模型。

性能及成本优化方面,Qwen3 系列也表现惊人。

比如本次开源的两个 MoE 模型,权重分别为 Qwen3-235B-A22B,是一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型;另一个为 Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。

MoE(混合专家模型)混合包含多个专家网络,每个专家通常是一个子模型、也可以是神经网络的一个子模块,拥有不同的能力或专长,能够处理不同类型的输入数据。在运行时,不同任务会被进行分类、输送到相应的 " 专家 " 处进行解决。

DeepSeek V3 与 R1 都属于 MoE 模型。这种架构的优势是其能够,并且在解决任务时仅调动与之相应的模块、节省计算成本。这也是 "AI 界拼多多 "DeepSeek 提升性价比的杀手锏之一。作为与 Qwen3 的对比,DeepSeek V3 与 R1 总参数规模为 6710 亿参数,激活参数为 370 亿。

性能方面,官方信息显示,Qwen 旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,均展现出优势。

小型 MoE 模型 Qwen3-30B-A3B ,相比 DeepSeek V3、GPT 4o、谷歌 Gemma3-27B-1T 等模型同样表现优异。

六个开源的 Dense 模型均适用于通用任务解决,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

值得一提的是参数量极低的 Qwen3-4B 模型,也在不少任务中展现出来相比 GPT 4o 更为优异的成绩。

上述模型均在 Apache 2.0 许可下开源。这是一种较为宽松的许可证,允许代码修改和再发布(作为开源或商业軟體)。

Qwen3 模型还支持 119 种语言和方言,并优化了 Agent 和代码能力、加强了对 MCP 的支持。

开源大模型 " 城头变换大王旗 "

Qwen3 的发布,距离 DeepSeek R1 的亮相已过去了 3 个多月。

1 月 20 日,凭借比肩 OpenAI o1 的性能、低廉的成本,以及对大模型研发范式的改变,R1 一经发布就荣膺开源大模型世界的 " 无冕之王 " 至今。

在此期间,包含科大讯飞(星火 X1)、百度(文心 X1)、OpenAI(o3 mini)、阿里(Qwen-QwQ-32B)、字节(豆包 1.5 深度思考)在内的玩家纷纷下场推理模型,但至多是接近 R1 性能或实现部分超越,未能真正挑动后者的位置。

在大模型的世界里,数月的时间已足够一代新王换旧王。正是这样的背景下,关注的目光落到了 Qwen3 身上。

与许多国内玩家不同的是,早在 2024 年 8 月,阿里就公开站到了开源自研模型的大厂阵营之中。在这条最终被 DeepSeek 验证可行的市场之路上,Qwen 可以说已经提前拿到了不少牌。

至今 Qwen 系列产品已在不少开源榜单中排名靠前。如据全球最大 AI 开源社区 Huggingface 4 月 29 日显示,在 audio-text-to-text 任务类目下,Qwen 的两款模型热度居前。

Huggingface 于 2 月 10 日发布的开源大模型榜单 "Open LLM Leaderboard" 也显示,排名前十的开源大模型全部是基于 Qwen 开源模型二次训练的衍生模型。

图源 /Huggingface ‍

在生态活跃度方面,Qwen 也处于全球前列。据官方数据显示,从 2024 年下半年开始至 2025 年 1 月底,基于 Qwen 系列的衍生模型数量超过了美国 Llama 系列,超过 9 万个,已是全球最大的 AI 模型家族,超过了 Meta 旗下的 Llama 家族。

不过对比 Llama 系列,Qwen 系列开源模型在下载量方面与前者仍有差距。据 Meta 首席执行官 Zuck Burg 在今年 3 月份宣布,Llama 的下载量已达到 10 亿次;而 Qwen 系列的下载量还在千万级别。

在 Qwen3 发布这一天,周靖人接受了 " 晚点 " 的采访,他讲道,判断 " 开源生态跑出来了 " 的指标主要有两点 " 一是看开发者的选择,二是看性能指标 "。

本次随着 Qwen3 的发布,这款新模型通过在性能指标和成本方面超越 DeepSeek R1,以及创新的混合推理模式,登顶为全球最强大的开源大模型,又为 Qwen 增添了一张好牌。

但在这之后,还有更多的挑战等待着它。接下来 DeepSeek R2 的亮相,也将为整个市场增添新的变数。

在贯彻 " 第一通吃(winner-takes-all)" 定律的开源市场,竞争远未到达终局、谁能成为最终的 "winner" 还充满未知,无论是 DeepSeek,还是 Qwen 和 Llama,都仍需要为不下牌桌而持续努力。

不过值得欣慰的是,虽然战程未半,至少当下的开源大模型 " 桂冠 " 仍归属于国产玩家。

(注:文中刘露为化名)

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們