今天小編分享的互聯網經驗:落選“果鏈”,别再捧殺DeepSeek了,歡迎閱讀。
文 | 鋅刻度,作者 | 陳鄧新,編輯 | 李觐麟
DeepSeek,持續正反饋 AI 賽道。
2025 年 2 月 13 日,文心一言宣布将于 4 月 1 日 0 時起全面免費,所有 PC 端和 APP 端用戶均可體驗文心系列最新模型,而此前只有免費使用 3.5 版。
随之而來的,則是輿論此起彼伏。
在蘋果不選擇 DeepSeek 作為 "AI 搭子 " 時,The Information 報道,蘋果考慮了多個國内的對象,與阿裡巴巴的合作已取得重大進展,并明确拒絕了 DeepSeek。
這意味着,DeepSeek 落選了蘋果供應鏈,令人唏噓不已。
其實,BAT 們與 DeepSeek 并非 " 針尖對麥芒 "。
文小言、騰訊元寶等接入 DeepSeek 大模型,為用戶提供更多的 AI 選擇;阿裡雲、騰訊雲、華為雲、京東雲、火山引擎、百度智能雲等主流雲服務平台紛紛上線 DeepSeek 大模型,鼓勵用戶嘗鮮 DeepSeek-R1、DeepSeek-V3 ……
BAT 們與 DeepSeek,是對手也是隊友?
沒有拔刀相向,反而雪中送炭
DeepSeek 的初衷,是印證 " 條條大路通羅馬 "。
生成式 AI 革命爆發之後,大模型站上了 " 風口 ",而算力成為衡量大模型能力的核心指标之一,在力大飛磚的簡單思維之下,矽谷将算力塑造為 " 皇冠上的明珠 ",被視為難以企及的力量。
于是乎,算力緊張成為行業的關鍵詞,令 AI 成本長期居高不下。
此背景下,DeepSeek 通過算法優化等手段降低了 AI 成本,用最少的資源達到最大的效果,為行業花小錢辦大事提供了新的思路和方向。
圖源:DeepSeek 官網
這意味着,擴大算力并非 AI 進化的唯一途徑。
斯坦福大學人工智能實驗室主任吳恩達:" 近年來,圍繞‘擴大模型規模能夠推動 AI 進步’的觀點備受追捧。事實上,我曾是這一理念的早期支持者。"
不難看出,消解算力壁壘才是 DeepSeek 的真正影響。
巧的是,這也是全球互聯網巨頭共同的夙願:唯有不斷降低成本,AI 普惠才可以從夢想照進現實,從而颠覆傳統的產業格局與商業模式。
更為重要的是,可以錯位競争。
DeepSeek 創始人梁文鋒表示:" 長遠來說,我們希望形成一種生态,就是業界直接使用我們的技術和產出,我們只負責基礎模型和前沿的創新,然後其他公司在 DeepSeek 的基礎上構建 To B、To C 的業務。"
關于此,從 BAT 們的态度就可見一斑。
QuestMobile 的數據顯示,DeepSeek 的日活躍用戶數已突破 3000 萬大關,創造了史上最快達成這一成就的新紀錄。
随之而來的則是," 伺服器繁忙,請稍後再試 " 屢屢被用戶诟病。
屢屢被用戶诟病
騰訊雲、阿裡雲、京東雲、華為雲、火山引擎、百度智能雲等紛紛伸出援手,滿足外界對 DeepSeek 不斷增長的推理需求。
譬如,京東雲上線 DeepSeek-R1 和 DeepSeek-V3 模型,支持公有雲在線部署、專混私有化實例部署兩種模式。
再譬如,騰訊雲支持開發者将 " 滿血版 "DeepSeek 接入微信小程式,可實現智能對話、文本生成等功能。
天使投資人、資深人工智能專家郭濤認為 DeepSeek 不會衝擊行業原有的競争格局:" 文心一言、通義千問等 AI 大模型都已建立起完善的生态體系,且背後有百度、阿裡巴巴等強大企業的支持,技術實力雄厚,能夠持續投入研發進行技術迭代更新。"
AI 創新是一場馬拉松而非短跑
以上可見,BAT 們對 DeepSeek 的态度頗為友好,這背後的緣由有三。
首先,降本一直進行中。
DeepSeek 之前,BAT 們就在不斷推動 AI 降低成本,也取得非常不錯的成就,共同推動大模型定價進入 " 厘時代 "。
事實上,BAT 們的創新也可圈可點。
譬如,字節跳動設計了一個全新的稀疏模型架構 UltraMem,有效解決了傳統主流 MoE 架構存在的推理時高額訪存問題,從而提升推理速度 2 倍至 6 倍,推理成本最高可降低 83%。
上述架構創新,與 DeepSeek 有異曲同工之妙。
再譬如,百度點亮國内首個自研萬卡集群,有效解決了過去算力價格高以及無法穩定應用的問題,通過集群效能最大化達到降低部門算力成本的目的。
" 今天,創新速度比以往都快得多。摩爾定律中,每 18 個月,性能就會翻倍,價格減半;如今,大模型推理成本每年能降低 90% 以上。" 李彥宏稱。
圖源:AI 產品榜
其次,模型蒸餾成為競争新高地。
模型蒸餾成為獲取低成本 AI 的重要路徑,進一步降低了大模型的門檻,為 AI 落地走進千家萬戶提供了更多的可能。
李飛飛團隊訓練出的 s1 人工智能推理模型,就是其中的代表。
s1 人工智能推理模型以阿裡巴巴通義千問為基座模型進行微調,蒸餾了谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 的 1000 個樣本,在數學和編碼能力測試中的表現與 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型類似,耗費不到 50 美元。
換而言之,模型蒸餾為行業指明一個新的前進方向。
德邦證券的研究表明,2025 年将是模型蒸餾技術的爆發年,AI 應用的成本有望大幅下降,模型能力也将全面提升;通過引導和支持,AI 模型不僅能夠在雲端獲取巨大的優勢,也能在邊緣計算等端側應用中發揮重要作用。
如此一來,BAT 們有了更大的發力空間,沒有與 DeepSeek 較勁的必要。
中國首席經濟學家論壇理事劉煜輝表示:" 現實世界可以用來訓練 AI 模型的數據資料已經耗盡,現在大家都是相互借鑑數據相互蒸餾,大家的模型水平根本拉不開差距,拼的就是誰能夠找到新的應用場景、誰能率先把價格打下來。"
再次,不排除結下善緣的可能。
種種迹象表明,DeepSeek 雖然初期拒絕了融資,但随着規模不斷擴大,資源瓶頸問題肉眼可見,成為一個棘手的問題。
一名私募人士告訴鋅刻度:"DeepSeek 背靠的幻方量化雖然是千億元體量,但客戶的錢不等于幻方的錢,更不等于可以投入的錢,遲早需要尋找外援。"
實際上,量化并不能長時間 " 躺赢 "。
幻方量化 CEO 陸政哲曾坦言:" 迅速崛起、規模快速放大、又飛快衰落消失,這仿佛是量化行業的死循環,像懸在我們頭上的達摩克利斯之劍。"
從這個角度來看,BAT 們可以在算力、數據、場景等全方位助力 DeepSeek,大家各取所需實現雙赢。
實際上,BAT 們一直青睐富有特色的 AI 初創企業,被譽為 "AI 六小龍 " 的智譜 AI、月之暗面、百川智能、零一萬物、階躍星辰、MiniMax,背後不乏騰訊、小米、美團、阿裡巴巴等身影。
總而言之,AI 創新是一場馬拉松而非短跑,比拼的是耐力與毅力,無論 BAT 們這樣的頭部選手,還是 DeepSeek 這樣的初創企業,都有彎道超車的機會,相互借力與借鑑才可以共同提高,大家都有美好的未來。
那麼,神話 DeepSeek 大可不必。