不用等R2了！第三方给新版DeepSeek V3添加深度思考，推理101秒破解7米甘蔗过2米门 - 大酷樂

今天小编分享的科学经验：不用等R2了！第三方给新版DeepSeek V3添加深度思考，推理101秒破解7米甘蔗过2米门，欢迎阅读。

DeepSeek 即将发布 R2？？坊间传闻越来越多了，且难辨真假。

1.2T 万亿参数，5.2PB 训练数据，高效利用华为芯片……只能说如果有一半是真的都很牛了。

HuggingFace 创始人此时推荐 " 以不变应万变 "，打开官方认证账号的更新提醒，就能第一时间获取通知。

抛开具体泄露数据是否准确，大家似乎有一个共识：如果真的有 R2，它的基础模型会是新版 DeepSeek V3-0324。

之所以有很多人相信 R2 会在 4 月底发布，有一部分原因也是出于 R1 与 V3 之间相隔了一个月左右。

现在，等不及 DeepSeek 官方，开源社区已经开始自己动手给 V3-0324 加入深度思考了。

新模型 DeepSeek-R1T-Chimera，能力与原版 R1 相当，但速度更快，输出 token 减少 40%，也是基于 MIT 協定开放权重。

相当于拥有接近 R1 的能力和接近 V3-0324 的速度，结合了两者的优点。

而且做到这一点，不是靠微调或蒸馏，而是 DeepSeek V3-0324 和 R1 两个模型融合而成。

新模型 R1T-Chimera 并非 DeepSeek 官方出品，而是来自德国团队 TNG Technology Consulting。

该团队此前也探索过可调专家混合（MoTE）方法，让 DeepSeek-R1 在推理部署时可以改变行为。

目前已知是选用了 V3-0324 的共享专家 +R1 与 V3-0324 的路由专家的混合体融合而来。

TNG 团队表示最终结果令人惊讶，不仅没有表现出融合模型的缺陷，相反，思考过程还比原版 R1 更紧凑有序。

暂没有技术报告或更详细的模型融合方法公布，要验证它是否符合描述，就只能拉出来试一试了。

我们选用最新折磨 AI 的难题 "7 米长的甘蔗如何通过 2 米高 1 米宽的门？"。

原版 R1 思考了 13 秒就下了结论；R1T Chimera 在这里却足足思考了 101 秒，最终计算出可以通过。

虽然还是无法像人类一样直观的理解三维空间，让甘蔗与门的平面垂直就可通过，但依然通过计算夹角与投影得出了结论。

在这 100 秒时间里 R1T-Chimera 如何一步步思考出答案呢？

展开推理 token 可以发现，在简单计算二维方案不可行后，它就已经想到了三维方案。

后面依然陷入了各种误区，在旋转甘蔗、弯曲甘蔗、计算 " 门的厚度 " 上走了弯路。

最终通过 " 揣摩出题人心理 " 走进正确的路线。

最终给出的答案非常严谨了。

虽然人类直觉上就能想出把甘蔗垂直起来通过这个方法，但仔细一想，题目中确实没有给出 " 门后有多少空间这个条件 "。

细还是 AI 细。

关于 R1T-Chimera 的更多细节，大家还在等 TNG 团队消息和更多第三方基准测试结果。

不过也有人注意到，KIMI K1.5 技术报告中也探索了模型融合方法。

具体来说是把长思维链（long-cot）模型和短思维链（short-cot）模型融合，直接对两个模型的权重取平均值，获得一个新模型，无需重新训练。

不过在实验中，这种简单融合方法表现并不如这篇论文中提出的 Long2short 强化学习方法。

另一个在模型融合上有经验的团队是 Transformer 作者 Llion Jones 创办的 Sakana AI。

早在 24 年初就结合进化算法提出以 block 为部門融合的方法。

随着更多团队跟进这一路线，模型融合会不会成为 2025 年大模型的一大技术趋势呢？欢迎在评论区留下你的看法。

HuggingFace：

https://huggingface.co/tngtech/DeepSeek-R1T-Chimera

在线试玩：

https://openrouter.ai/tngtech/deepseek-r1t-chimera:free

参考链接：

[ 1 ] https://x.com/tngtech/status/1916284566127444468

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

点亮星标

科技前沿进展每日见

熱門排行

王治郅：杨瀚森主要的问题是速度他的速度跟郟君昊 | 2025-05-05
贸易战烧进电影院：特朗普拟重税打击外国电影習又夏 | 2025-05-05
贷款追高炒黄金的人后悔了！有人一天亏掉6年寸飛蘭 | 2025-05-05
手机电池突破8000mAh？硅碳技术的回旋镖：「折衛青柏 | 2025-05-05
贷款追高炒黄金的人后悔了！有人一天亏掉6年繁綺文 | 2025-05-05
任天堂对Genki提起Switch 2商标侵权诉讼，后郜萌運 | 2025-05-05
哪吒汽车APP和官网恢复正常知情人士：之前断袁曼雁 | 2025-05-05
极越汽车 CEO 夏一平名下青岛/义乌两家公司集玲琳 | 2025-05-05
全国经济第一大省明确，推动组建农商联合银行佼昌翰 | 2025-05-05
桑保利：亚马尔有配合意识&有点像梅西姆巴佩甄正浩 | 2025-05-05
高露现身上海虹桥机场黑色外套点缀亮色爱惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表賁芳蕤 | 2023-05-02
曹操墓，里面都有啥？衛青柏 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露賁芳蕤 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游衛青柏 | 2023-05-04
普京签署总统令，批准对俄刑法典相关法条的修集玲琳 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 — 袁曼雁 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花謝飛揚 | 2023-05-02
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
解除资格！停止一切合作佼昌翰 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压習又夏 | 2023-05-05
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
前董事长被免，天山生物全面进入“中植系”时惠惠君 | 2023-05-02
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
事关农村土地承包和农民权益，《农村土地承包郟君昊 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
200户连夜疏散，原因让人愤怒！“损失超一亿”，袁曼雁 | 2023-05-03
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《惠惠君 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊嬴覓晴 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02