腾讯混元深度思考模型T1正式版来了，吐字快、能秒回，解码速度提升2倍

今天小编分享的互联网经验：腾讯混元深度思考模型T1正式版来了，吐字快、能秒回，解码速度提升2倍，欢迎阅读。

腾讯混元 3 月 21 日周五宣布，正式推出自研深度思考模型混元 T1 正式版，已在腾讯云官网上线，输入价格为每百万 token 1 元，输出价格为每百万 token 4 元。

腾讯混元概括，混元 T1 正式版的特点为 " 吐字快、能秒回 "、" 擅长超长文处理 "，称它是腾讯自研的强推理模型。

速度方面，混元 T1 正式版在可比参数量下的解码性能高于行业 2 倍，首字秒出，吐字速度每秒 60 至 80token，具备优秀的长文处理能力。多项指标达到业界领先推理模型的水平，效果方面，混元 T1 正式版逻辑强、文风简洁、复杂指令跟随准确，摘要幻觉低。

通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元 T1 正式版进一步提升了推理能力。

在体现推理模型基础能力的常见评估指标中，如大语言模型（LLM）评估增强数据集 MMLU-PRO 中，混元 T1 取得 87.2 分，仅次于得分 89.3 的 OpenAI o1，高于得分 86.1 的 OpenAI GPT 4.5 和得分 84 的 DeepSeek R1。

在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元 T1 的成绩也达到业界领先推理模型的水平，其中，逻辑推理得分 93.1，高于前述三个模型 o1、GPT 4.5 和 R1。

混元 T1 正式版的强大推理能力源于，腾讯沿用混元 Turbo S 的架构，采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。

上述架构有效降低了传统 Transformer 结构的计算复杂度，减少了 KV-Cache 的内存占用，从而显著降低了训练和推理成本。

混元 T1 在超长文本推理领網域也展现出独特优势。

基于出色的长文捕捉能力，混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时，混合 Mamba 架构针对长序列处理进行了专项优化，通过高效的计算方式，在确保长文本信息捕捉能力的同时大幅降低资源消耗，在相近的激活参数量下，实现了解码速度提升2倍。

在上线全新推理模型之前，本周一，腾讯混元模型首次登上了海外权威大模型竞技场 Chatbot Arena 的榜单，跻身全球 Top 15。一同上榜的还有阿里巴巴本月 6 日发布的通义千问最新开源模型 QwQ-32B。

不同于其他测评，Chatbot Arena 的测评人是 C 端用户——用户在平台上以匿名方式与多个模型互动，然后投票决定哪个模型更好，从而根据分数生成排行榜。这种测评也被看成是大模型直接 PK 的竞技场，简单直接。

腾讯混元模型在中文基础能力测试中也表现突出。本周二发布的《中文大模型测评基准 SuperCLUE 3 月报告》中，腾讯混元位列基础模型国内第二，综合实力稳居国内大模型第一梯队。