大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科技

DeepSeek小心,帝國反擊戰到來了

2025-02-27 简体 HK SG TW

今天小編分享的科技經驗:DeepSeek小心,帝國反擊戰到來了,歡迎閲讀。

文 | 字母榜,作者 | 王靖,編輯 | 趙晉傑

DeepSeek R1 引發的一場推理模型大作戰還在繼續,且參戰名單正随着時間推移逐步拉長。

僅僅昨天一天時間之内,這場戰局就又吸引來了 4 家明星大模型公司:先是阿裏發布推理模型 QwQ-Max-Preview 預覽版,接着 Anthropic 宣布推出全球首個 " 混合推理 " 模型 Claude 3.7 Sonnet,之後字節也被曝出豆包正在小範圍測試自研的深度思考型推理模型。

作為被各路對标的 DeepSeek,也有了新動作。昨晚,路透 . 社爆料稱,DeepSeek 正在加速推出 R2 模型,該模型原計劃在 5 月初發布,但現在官方希望能盡早發布。

香港科技大學校董會主席、美國國家工程院外籍院士沈向洋在近期分享中指出," 對于大模型,之前的研究焦點是 GPT 模式,現在的焦點是 Reasoner 模式,這是一種新的學習範式。"

DeepSeek R1,無疑成了這場範式變革的重點參考對象。在此之前,騰訊也上線了自研的深度思考模型 " 混元 T1",百度文小言上線深度搜索功能,馬斯克的 xAI 也發布了帶有深度思考能力的 Grok 3 新模型。

就連 OpenAI,都在 DeepSeek 壓力下,進一步開放了自家推理模型 o1 和 o3-mini 的思維鏈。

DeepSeek R1 這塊投向推理側的大模型技術迭代新石子,其漣漪效應正逐漸擴散至全行業。這一幕頗像 2023 年行業對 ChatGPT 的追趕。彼時,科技大廠如百度、阿裏,争先發布自家大模型;王慧文攜 5000 萬美元振臂一呼,正式開啓了一場席卷全行業的大模型創業熱潮,楊植麟、王小川、李開復等先後創辦起月之暗面、百川智能、零一萬物等明星大模型公司,争分奪秒搶奪市場融資并對外發布產品。

不過,在 ChatGPT 時刻到來後就落後一步的字節,如今在追趕 DeepSeek 時刻上又有了慢人一步的迹象。在國内其他科技大廠已經相繼完成深度思考能力的亮相後,字節的自研推理大模型才剛剛進入灰度測試階段。

DeepSeek R2 新模型可能提早發布的消息,無疑又給字節上了上競争強度。但好消息是,那些搶在字節前面發布推理模型的同行們,還沒來得及松一口氣就同樣又遭遇心頭一緊。

01

如同馬斯克着急推出半成品 Grok 3 一樣,阿裏新推理模型 QwQ-Max-Preview,也只是一個預覽版,而非正式版模型。

在 LiveCodeBench 編程測試中,QwQ-Max-Preview 也只是小幅超越 OpenAI o1 中檔推理模型,以及 DeepSeek R1 Preview 預覽版(注意,不是 DeepSeek R1 正式版)。阿裏官方介紹,QwQ-Max 正式版将在後續推出。

如同 DeepSeek R1 是在 V3 基礎模型上訓練出來的一樣,QwQ-Max 同樣基于阿裏的旗艦版模型 Qwen2.5-Max 而來,後者是于 1 月 29 日發布的一款 MoE 稠密模型,在公開的基準測試中,官方稱其性能超越 DeepSeek V3。

不同于阿裏 QwQ-Max-Preview,同一天發布的 Anthropic 新模型 Claude 3.7 Sonnet,則是個徹徹底底的完整體,官方直接放出了多項評測指标對比。

在傳統基準測試項目中,Claude 3.7 Sonnet 在指令遵循、通用推理、多模态能力以及智能體編碼方面的表現,都趕超了 OpenAI o1 和 DeepSeek R1。

無論是馬斯克,還是阿裏,在模型尚未完備之際就如此着急推出,秀技術肌肉之外,搶在 DeepSeek 前面,趁着對方多模态尚不完善之際,打出產品的差異化競争優勢,或許才是更重要的因素。

1 月 20 日發布的 DeepSeek R1,盡管支持深度思考的推理模式,但其并非一款多模态推理大模型,不支持圖片生成,也不支持語音模式。如在圖片識别上,DeepSeek R1 所做到的識圖,更多是通過 OCR 掃描技術,簡單将圖片上的文字一一復制下來,無法理解文字之間的邏輯對應關系。

接入 DeepSeek R1 的騰訊,就利用 DeepSeek R1 的這一短板,在近期的元寶内上線了圖生文功能,借助其自研模型的多模态能力加持,讓 DeepSeek 也可以理解圖片内容。

馬斯克同樣預告了 Grok 3 的語音模式,提前測試過這一功能的希馮 · 齊利斯(Shivon Zilis)—— Neuralink 高管,同時也是和馬斯克育有一對雙胞胎的孩子媽,大贊和 Grok 3 進行的語音對話,稱 " 是我一生中最出乎意料、最值得的時光之一。"

02

堅持推出自家推理模型的背後,更是各家大模型廠商對用户的一場全新争奪戰。

DeepSeek 的異軍突起,再次激發大廠對 AI to C 的重視。

在阿裏發布推理模型 QwQ-Max-Preview 的公告中,一并透露的還有将發布 Qwen Chat APP 的消息,并稱其可能獨立于通義 APP。阿裏解釋稱,該專用 APP 将優先考慮實時響應能力與流行生產力工具的集成,使全球閱聽人能夠使用先進的人工智能。

一旦成真,阿裏也将成為全球大模型玩家中,首個内部同時上線兩款 AI 助手應用的科技大廠。通義 APP 未能在用户規模上打開局面的客觀現實,或許是促成阿裏這一決策的重要背景。

在阿裏打算重起爐灶之外,如騰訊、百度則選擇了接入 DeepSeek 來争奪 C 端用户。但這一舉措的潛在風險,依然不小。

目前,各家還都能依賴 DeepSeek 外溢的流量,吸引到用户。一旦 DeepSeek 解決服務卡頓問題,這些用户難免不會再次流失。

且這樣的危險信号已經發出。據鳳凰網科技,目前 DeepSeek 官方通過技術優化,已經讓用户在體驗側少了觸發服務繁忙的頻次。

歸根到底,通過自研大模型,在技術上帶來體驗突破,才是徹底留住用户的最有效手段。這一策略,不僅适用于 C 端,同時更适用于對 B 端開發者群體的争奪。

盡管如騰訊般,開始選擇徹底擁抱 DeepSeek,并将開源的 DeepSeek 接入自家一系列產品,但面對這場涉及 AIGC 安卓夢想的争奪,沒有大廠想要放棄。

過去兩年中,大模型給傳統應用帶來的體驗更新,讓越來越多人開始認同一種觀點,即所有應用都值得用大模型重做一遍。

基于上述共識,在自研大模型之餘,科技大廠都相繼發布了自家的大模型服務平台,既做淘金者,又争當賣鏟子的人,都向着成為 AIGC 時代的安卓夢想發起衝鋒。

截至目前,包括騰訊、阿裏、百度、字節在内,一眾科技大廠都表達了仍會堅持大模型自研到底的決心。

為了繼續向 AIGC 時代的安卓夢想邁進,各家大廠為了聚攏開發者生态,都加快了在開源上的進度:阿裏在 QwQ-Max-Preview 亮相後,同步宣布未來将以 Apache2.0 許可協定開源自家推理模型;國内一直堅持閉源的百度,也開始重新擁抱開源路線。騰訊、字節也都在推動旗下垂類模型陸續開源。

另一邊的 DeepSeek,同樣也沒閒着。在新一代模型尚未發布的間隙,面對競争對手紛紛開源搶奪注意力的策略,DeepSeek 選擇了加碼,相繼開源了 FlashMLA 代碼庫、DeepEP 通信庫,以及 FP8 計算庫 DeepGEMM 把自己低成本高性能的訓練秘密公之于眾,讓有實力的開發者可以在 H800 等英偉達低效芯片基礎上,也能提高模型的運行效率。

同時,關閉 20 天的官方 API 充值服務也于 2 月 25 日恢復正常。據字母榜獲悉,當天 DeepSeek 官方還發布了一則特别提示,稱 " 當前白天時段伺服器資源依舊緊張,凌晨 0:30 到上午 8:30 相對空閒,若業務允許,建議開發者調整至該時段以獲得更為流暢的 API 調用體驗。"

被路透 . 社同天曝光的 R2 新模型提速發布消息,則成了 DeepSeek 應對這輪推理模型競賽而抛出的新武器。

03

眼下,唯一沒有對外大範圍提供推理模型服務的科技大廠,只剩下了字節。

對大模型技術演進路線的判斷失誤,或許是字節沒能及時跟進推出新模型的原因之一。

據晚點 LatePost 報道, 在近期的 All Hands 會上,字節 CEO 梁汝波反思道,DeepSeek R1 創新點之一的長鏈思考模式不是業界首創,去年 9 月 OpenAI o1 發布長鏈思考模型、成為行業熱點後,字節就意識到了技術的重大變化,但 " 沒有覺得要馬上復現出來 ......現在回頭看,如果一開始重大問題就争先,我們有機會更早實現。"

這不是字節在大模型領網域第一次錯判形勢。

ChatGPT 爆火後,在去年初的 All Hands 會上,梁汝波就曾反思," 公司層面的半年度技術回顧,直到 2023 年才開始考慮 GPT,而業内做得比較好的大模型創業公司,都是在 2018 年至 2021 年創立的。"

當時,字節在大模型研發方面除了進度緩慢之外,内部還一度将 AI 重心移向了細分垂直賽道的 AI for Science。這直接導致字節在大模型推出時間上落後了百度、阿裏一大截。

2022 年 11 月 ChatGPT 發布之後,百度、阿裏等國内大廠相繼在 2023 年三四月份推出自研大模型文心和通義,但直到去年 8 月份,字節才對外亮相了雲雀大模型(豆包大模型前身)。

在服務 B 端開發者群體上,字節也因此慢了一步。從 2023 年 4 月起,百度、阿裏、騰訊相繼通過旗下雲服務對外提供大模型接入服務。直到一年後的 2024 年 5 月,字節自主研發的豆包大模型才開始通過火山引擎正式對外提供服務。

好在,借助 2024 年大模型技術迭代趨緩的利好因素,字節在過去一年大力補課,不僅使得豆包一度成為國内月活用户最多的 AI 應用,而且從大模型性能到多模态布局,也都相繼追趕上了國内頭部廠商。

進入 2025 年,DeepSeek R1 引發的推理模型熱潮,則又一次将追趕壓力推到了字節面前。

稍顯不同的是,這次迎來壓力拷問的不只是字節一家。尤其随着 DeepSeek R2 模型提早到來的動作,一眾科技大廠,都難逃再被 DeepSeek 對比的緊張氣氛。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們