大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 财經

飢渴的大廠,面對大模型還需新招

2025-04-30 简体 HK SG TW

今天小編分享的财經經驗:飢渴的大廠,面對大模型還需新招,歡迎閱讀。

文 | 王智遠

昨天晚上,跟朋友聊起大模型。

他說現在各家都 " 卷 " 到一個新階段,模型之間差距已經很小,只能用 " 遙遙領先 " 或者 " 吊打同行 " 這種詞來形容。

從基準測試和數據來看,很多模型都遠超 DeepSeek R1、GPT-4o,但繼續往下比的空間已經不大了,真正的差異更多在使用方式上。

這讓我開始思考:大模型競争,是不是已經進入存量博弈階段?

1

說到 " 存量 ",就繞不開一個字:" 卷 "。不卷,哪來的存量?那問題來了:這個卷,到底在卷什麼?

我覺得,表面看到的就三點:算力成本、數據質量和場景滲透。

以前大模型拼參數多,現在開始拼誰的成本低。

阿裡家的 Qwen3,用 " 混合推理 " 的技術,簡單問題用低算力能快速回答,復雜問題再慢慢思考,這樣部署成本直接降到了 DeepSeek-R1 的 1/3 到 1/4。

騰訊混元 T1,3890 億參數的模型,通過稀疏激活機制,算力利用率比傳統模型提升了 30% 以上。

百度的文心大模型,雖然沒公開具體成本,但它的推理速度在工業級場景裡比競品快 20%,也算是有自己的優勢。

字節跳動沒直接在公開場合提到過算力優化,但它通過抖音、今日頭條的場景化落地,間接降低了通用大模型的部署壓力。

所以,算力成本上,大家是看能不能在不犧牲性能的前提下,把成本降下來。

降下來之後呢?

關鍵還不能影響數據質量,卷誰的訓練數據更硬核。

阿裡家 Qwen3 訓練數據量達到了 36 萬億 token,支持 119 種語言和方言,數據質量更有普适性。百度文心一言依托搜索、地圖等產品,積累了海量的真實用戶行為數據。

騰訊的混元則通過開源生态積累開發者數據,在遊戲和内容生成領網域有獨特優勢;字節跳動則利用抖音、今日頭條的龐大流量池,捕捉用戶偏好數據,讓内容生成模型更接地氣。

所以,數據質量的卷,是從 " 廣度 " 到 " 深度 " 的更新,不僅要數據多,還要精準、垂直。

技術再強,不能解決實際問題,也只是 " 空中樓閣 ",再看看場景滲透,誰更狠一些。

Qwen3 深耕電商、金融、醫療等垂直領網域,通過定制化微調提供行業解決方案;百度文心一言是嵌入搜索、地圖、智能音箱等產品,形成了 " 技術 - 場景 - 用戶 " 的閉環。

騰訊的混元聚焦遊戲和内容生產,通過混元 3D 等工具搶占多模态賽道;字節跳動是把大模型融入抖音和今日頭條的内容生產流程,甚至用 AI 生成短視頻腳本,直接打通了 " 技術 - 内容 - 流量 " 的鏈條。

看到了嗎?場景滲透的卷,是從 " 技術堆疊 " 到 " 價值創造 " 的轉型,誰能在細分場景裡跑通商業模式,誰就能突圍。

因此,我認為這個 " 卷 " 是:卷技術、成本、場景的三角博弈;算力成本決定了誰能撐到最後,數據質量決定了誰能跑得更穩,場景滲透決定了誰能活出差異化。

2

但這種 " 卷 ",背後隐藏着一個更深層的矛盾:

當技術突破趨緩時,大家一個勁地開源、吊打同行,是不是意味着用這些手段,在掩蓋真正的技術瓶頸?

我認為:是的。但不是完全沒進步,而是技術方向有點小調整。

為什麼這麼說?

先說數據。阿裡家的 Qwen3-235B-A22B,雖然總參數量有 2350 億,但每次實際用到的參數只有 220 億,激活效率才 9.4%。

什麼概念,說白了," 輕量化 " 策略确實降低了成本,這是對原來那種 " 參數越多越好 " 模式的一種妥協。現在單純堆參數已經沒有太大的效果了。

再看看騰訊的混元 T1:

總參數量 3890 億,激活參數量 520 億,上下文長度也很長,但它的稀疏激活機制,本質上還是在想方設法在不犧牲性能的前提下,把參數規模壓一壓。

文心大模型就更不用說了。4.5 Turbo 總參數量 1970 億,但每次推理最多用到 28 億參數。這說明什麼?

參數量已經不是唯一的衡量标準了,激活效率才是新的競争點。這種調整不是在掩蓋瓶頸,而是把技術突破的方向從 " 規模擴張 " 轉向了 " 效率優化 "。

然後,再看看技術優化路線,阿裡直接趕在五一前,推出 " 快慢思考 " 混合推理。本質是什麼?

想通過架構創新來緩解技術瓶頸。Qwen3 的 " 快思考 " 是用低算力處理簡單任務," 慢思考 " 用高算力處理復雜任務,這是在對原來的 Transformer 架構進行适應和改造。

騰訊混元的 T1 也一樣,官方說模型内存占用減少了 40%,性能提升了兩倍;這種優化還是依賴 MoE 架構的稀疏激活機制,但也受限于硬體兼容性和算法復雜度。

所以,技術優化的核心目标是延長現有架構的生命周期;說白了,更像「技術瓶頸下的權宜之計」,而不是真正的突破。

結論很明顯:

短期來看,參數激活效率、混合推理、MoE 架構這些優化确實緩解了算力成本壓力,但改進只是對現有技術框架的修補。

長期來看,技術瓶頸沒消失,變成了 " 效率瓶頸 "、" 場景适配瓶頸 "。開源生态的普及為技術迭代提供了數據和場景基礎,但真正的突破還得靠底層架構的創新。

所以,這波 " 卷 " 不是在掩蓋技術瓶頸,而是在重新定義瓶頸的形态。技術進步的速度是慢了,但方向更明确了:聚焦在效率、成本和場景落地。

3

既然這樣,問題就來了:

大廠在 " 模型卷 " 的浪潮裡,到底該怎麼找到 " 看家本事 "?是繼續在技術細節上摳來摳去,還是把精力放在怎麼把技術用到實際場景裡,或者去構建一個更大的生态呢?

我覺得,技術細節優化(比如調整激活參數、搞混合推理)确實能減輕算力的壓力。

但說到底,優化的核心價值是讓現有的架構能多撐一會兒。不過,這裡面有個風險:技術帶來的好處會比我們想象的更快地消失。

為什麼這麼說?舉個簡單的例子:

你買了一款新手機,一開始覺得電池續航特别厲害,比舊手機好很多,這就是技術紅利。但用了一段時間後,你發現電池老化得很快,續航優勢很快就沒了,甚至比你預期的更早。這就是紅利衰減速度超出預期。

換句話說,技術帶來的優勢不會一直持續下去,會逐漸減弱,減弱的速度比我們預想的更快。

有個研究,來自 DeepMind 的 Chinchilla 模型,提到通過參數補償來降低剪枝帶來的性能損失,可以在不依賴大規模後訓練的情況下低成本壓縮模型,提升推理速度,同時最大程度保留性能。

什麼意思呢?

大模型的性能提升和算力投入之間的關系已經到了一個瓶頸階段,有點像 " 帕累托最優 "(Pareto Optimality)——再怎麼努力,提升的空間也越來越小了。

說白了,現在大家都在過度依賴參數規模和稀疏激活機制,可能會陷入一種 " 技術幻覺 ":以為解決了成本問題,其實并沒有真正解決通用大模型的深層瓶頸。

換句話說,技術越來越同質化,競争也越來越内耗。

文心一言的多模态能力雖在行業裡領先,但核心還是依賴 Transformer 架構,沒辦法突破通用大模型的擴展性限制,這就是算法優化的天花板。

再比如,Qwen 系列雖然全球下載量突破 3 億次,看起來很厲害,但實際上模型的功能差異很小。

那怎麼辦呢?各家短期直接把架構推倒,重新來過嗎?肯定不可能。真正的路線是從 " 技術堆疊 " 到 " 價值創造 "。

我覺得,對于大廠來說,價值錨點的核心在于能不能真正解決實際問題,而不是單純追求技術指标的極致;很明顯,技術細節優化只是手段,場景落地和生态協同才是根基。

就像艾媒咨詢在 2024-2025 年中國 AI 大模型市場研究報告裡提到的:誰能找到自己的 " 價值錨點 ",誰就能在 " 下半場 " 突圍。

4

所以,大家到底怎麼才能突圍呢?

現在看來,真正能落地到企業實際場景裡的,是一個 " 三重共振 ":雲廠商 + 行業應用 + MCP 協定。

為什麼說 MCP 是關鍵?因為它本質上是重新定義了企業與 AI 怎麼合作的規則。

以前企業用大模型,就像給廚師一把刀,但沒告訴他菜在哪、鍋在哪、調料在哪——他只能靠猜。

現在有了 MCP,相當于給 AI 裝了一個 " 導航系統 ",它能自動找到企業的數據庫、API、業務流程,甚至還能跨系統操作。

高德地圖是阿裡雲的客戶,如果接入 MCP,以後導航建議就不是簡單的 " 繞開擁堵 ",而是能結合用戶的消費記錄推薦周邊餐廳,甚至直接跳轉到外賣 App 下單。

這背後是 MCP 把高德的數據和阿裡雲的 AI 能力打通了。

那 MCP 到底怎麼驅動 ToB 的範式變化?我認為,有兩點:

一、從 " 模型為中心 " 變成 " 數據為中心 ";以前企業做 AI,總盯着模型參數、推理速度這些技術細節。但 MCP 讓重點轉向數據流通 。

二、從 " 孤島 " 變成 " 協同 ";企業内部的系統通常互不聯通,比如:财務系統、供應鏈系統、客戶管理系統。一個公司用了誰家的雲,雲廠商就可以基于 MCP 把這些系統全打通。

打通之後,MCP 就從一個簡單的工具變成了生產力基礎設施。所以,這才是新範式。

它讓 AI 不再局限于 " 參數規模 " 或 " 推理速度 ",而是通過數據協同和場景嵌入,成為企業運營的 " 作業系統 "。這才是企業的剛需。

這也是我為啥說,在大模型和 AI 的推動下,自下而上看,未來可能會出現新的飛書、釘釘這樣的平台。它們不像飛書、釘釘那樣有通訊、協同功能,但至少能把企業的各種業務流程整合起來。

叙事還在繼續,到底會不會這樣呢?deepseek R2 出來後,就見分曉了。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們