大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科技

騰訊推出「快思考」:API 成本只有 DeepSeek 不到一半

2025-03-03 简体 HK SG TW

今天小編分享的科技經驗:騰訊推出「快思考」:API 成本只有 DeepSeek 不到一半,歡迎閱讀。

最近,騰訊元寶可以說是「殺瘋了」,先是多款產品接入 deepseek,推出自研混元 T1 模型,又是猛推流,一度超越字節 " 豆包 " 登頂中國區 App Store 免費榜第二,又是入駐微信生活服務 " 九宮格 "。

在各家大模型紛紛推出深度思考模型的同時,騰訊混元又「反常」地推了一個快思考模型 Turbo S。

2 月 27 日,騰訊混元自研的快思考模型 Turbo S 正式發布,目前已在騰訊雲和元寶上線。

區别于 Deepseek R1、混元 T1 等需要 " 想一下再回復 " 的慢思考模型,混元 Turbo S 能夠實現 " 秒回 ",吐字速度提升一倍,首字時延降低 44%,同時在知識、數理、創作等方面也有突出表現。通過模型架構創新,Turbo S 部署成本也大幅下降,持續推動大模型應用門檻降低。

有研究表明,人類約 90% — 95% 的日常決策依賴直覺,快思考正如人的 " 直覺 ",為大模型提供了通用場景下的快速響應能力,而慢思考更像理性思維,通過分析邏輯提供解決問題思路。快思考和慢思考的結合和補充,可以讓大模型更智能、更高效地解決問題。

據介紹,通過長短思維鏈融合,騰訊混元 Turbo S 在保持文科類問題快思考體驗的同時,基于自研混元 T1 慢思考模型合成的長思維鏈數據,顯著改進了理科推理能力,實現模型整體效果提升。

作為旗艦模型,Turbo S 未來将成為騰訊混元系列衍生模型的核心基座,為推理、長文、代碼等衍生模型提供基礎能力。

基于 Turbo S,通過引入長思維鏈、檢索增強和強化學習等技術,騰訊自研了推理模型 T1,該模型已在騰訊元寶上線,用戶可以選擇 Deepseek R1 或騰訊混元 T1 模型進行回答,具體操作上,在元寶中選擇 Hunyuan 模型,點亮 T1 即為深度思考,不點亮則為 Turbo S。

開發者和企業用戶已經可以在騰訊雲上通過 API 調用騰訊混元 Turbo S,即日起一周内免費試用。定價上,Turbo S 輸入價格為 0.8 元 / 百萬 tokens,輸出價格為 2 元 / 百萬 tokens,相比前代混元 Turbo 模型價格下降數倍,是 deepseek API 成本的 1/2-1/4,團隊稱「比大模型界的拼多多還便宜」。另外,混元滿血 T1 将在 3 月初發布。

在 3 月 2 日騰訊混元的直播裡,騰訊混元專家團隊對這次推出的快思考模型做出了詳解,極客公園整理重點如下:

為什麼要做「快思考」?

團隊通過分析和觀察發現,用戶約 90% 的請求都可以依靠大模型的 " 直覺 "(即快思考模型),無需深度思考就能精準簡潔地給出答案,所以針對這些請求需要模型能更快、更準地回應。

對于剩下的約 10% 的請求,需要模型能進行深度思考甚至反思,從而給出更精準的答案。

同時,快思考模型不僅成本更低,還具備強大的數據融合能力,能夠融入 MySQL 模型或 Max 模型中的優質數據。

Turbo S 借鑑了騰訊的慢思考模型 Hunyuan T1 的數據,該模型使用一種稱為長思維鏈合成的技術進行訓練。這有助于 Turbo S 在保持其速度優勢的同時,通過多步驟問題進行推理,使得對于其餘 10% 需要反復反思思考的問題也能得到較精準答案。

技術解析:模型架構 / 工程優化

在業界通用的多個公開 Benchmark 上,騰訊混元 Turbo S 在知識、數學、推理等多個領網域展現出對标 DeepSeek V3、GPT 4o、Claude3.5 等業界領先模型的效果表現。

* 表格中,其它模型的評測指标來自官方評測結果,官方評測結果中不包含部分來自混元内部評測平台

架構方面,通過創新性地采用了 Hybrid-Mamba-Transformer 融合模式,混元 Turbo S 有效降低了傳統 Transformer 結構的計算復雜度,減少了 KV-Cache 緩存占用,實現訓練和推理成本的下降。

傳統 Transformer 架構存在以下缺陷 :

計算復雜度高,序列維度呈平方級關系,在訓練和推理時復雜度高;

推理時需要 KV-Cache,且随着序列長度增加線性增加,部署成本高;預測時時間成本高,每步預測因疊加 KV-Cache 與序列長度呈線性關系,越往後生成越慢,尤其對于 Mamba 線性 Attention 機制,每步預測都是 O1 復雜度,所以需要做更高效的 attention 或甚至 linear 的 attention,目前行業内已有一些相關探索方案如 window attention、mobile、NSA 等,都是通過不同方式壓縮計算復雜度。

Hybrid-Mamba-Transformer 融合架構是混元 Turbo S 中的一項突破性架構創新,通過融合兩種強大的架構,平衡效率和上下文推理能力:

Mamba 是一種狀态空間模型(SSM),專為高效處理長序列而設計,在内存使用上比 Transformer 更為節省。與 Transformer 不同,後者在處理長文本時會遇到 KV-cache 内存的平方級擴展問題,而 Mamba 可以在不產生過多計算開銷的情況下處理更長的文本,更适合閱讀、總結和生成長文檔的回答(例如法律文本、研究論文等)。

盡管 Mamba 高效,但它在捕捉復雜的上下文關系方面不如 Transformer。Transformer 擅長理解復雜的模式和依賴關系,特别适合推理密集型任務,如數學運算、邏輯推理和問題解決,适用于多步驟推理、代碼生成和深度上下文理解。

混元 Turbo S 首次将 Mamba 應用于超大規模 MoE 模型 MoE(專家混合模型)通過每次查詢激活一部分參數,從而提高計算效率,在保持精度的同時充分利用了 Mamba 的高效性,同時也保留了 Transformer 在推理任務中的優勢。這一突破不僅降低了訓練和推理成本,還提升了速度和智能水平。

算法做到了哪些不一樣的工作?

長短思維鏈的融合。

通過長短思維鏈融合,對于需反復推理反思的問題也能得到更精準答案, T1 模型可得到相對長鏈數據,将長鏈數據和短鏈數據融合訓練後采樣,采樣依據正确性和長度正确性,采用規則方法和濾波 model case ,從而提升模型整體能力,尤其在數學、代碼、邏輯等強推理任務上表現更好,且短鏈模型能很好地融合長鏈能力,體驗更佳。

即短鏈模型其實體驗更佳,通過融合長鏈也能有很好的推理能力。

scaling law 還沒結束

GPT-4.5 是短鏈模型天花板的一個存在,但 API 的成本非常高,以百萬 tokens 計算約為 150 美元,約是 Turbo S 成本 500 倍,且據推測,GPT-4.5 的激活參數量達萬億級别。因此,Turbo S 等快思考模型的出現,正是為了在保證響應速度的同時,降低成本并保持較好的性能。

目前 scaling 遠未結束。從數據量來看,不管是模型 size 的 scaling 還是訓練數據的 scaling,現在中文互聯網上可獲取數據量各家差不多,誰能通過獲取或合成方式獲得更多數據量對模型 performance 來說是關鍵。

标注數據方面,更專業标注團隊對模型表現影響大,如小說創作、醫療方向等,擁有更專業标注團隊和數據的模型表現會更好,整體來看,在數據、算法、算力工程優化等方面對 scaling 的探索都遠未結束。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們