今天小編分享的科技經驗:李彥宏開卷:“DeepSeek慢且貴”,歡迎閱讀。
如何證明自家的模型是行業一流水平?跟 DeepSeek 比一比。
随着 DeepSeek 爆火,2025 年的大模型市場,DeepSeek 就像手機圈的 iPhone 一樣,成了各家模型廠商發布新品時的最新對标對象。
除了模型能力上号稱超過 DeepSeek 之外,上述對标更直觀的表現在價格上。
在今天百度文心大模型 4.5 Turbo、文心大模型 X1 Turbo 發布時,百度創始人李彥宏就吐槽 DeepSeek 也不是萬能的。除了能力上只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體内容、幻覺率高外,李彥宏認為使用 DeepSeek 更大的問題是慢和貴," 中國市場上絕大多數的大模型 API 調用價格都比 DeepSeek 滿血版要低,而且速度也更快。"
當然,其中也包括最新發布的文心 4.5 Turbo 和文心 X1 Turbo。官方數據顯示,文心 4.5 Turbo 每百萬 token 的輸入價格為 0.8 元,輸出價格 3.2 元。
作為對比,即便在打五折後的優惠時段(00:30-8:30),DeepSeek V3 每百萬 token 的輸入價格也達到 1 元,輸出價格 4 元。
推理模型上,百度模型的性價比則進一步凸顯:文心大模型 X1 Turbo 每百萬 token 輸入價格 1 元,輸出價格 4 元,與 DeepSeek R1 優惠時段價格一致,但比 DeepSeek R1 标準時段(8:30-00:30)要便宜得多(R1 每百萬 token 輸入 8 元,輸出 16 元)。
想用性價比頂住 DeepSeek 競争壓力的不止百度一家。4 月 17 日字節發布的豆包 1.5 · 深度思考模型上,其每百萬 token 的輸入價格為 4 元,輸出價格 16 元,綜合成本上依然要比 DeepSeek R1 标準時段便宜。
這樣的性價比策略更是不止局限于國内大模型玩家。國外同樣如此。
4 月份谷歌發布的首個混合推理模型 Gemini 2.5 Flash,便主打一個低成本。在關閉思考模式下,Gemini 2.5 Flash 每百萬 token 輸出成本暴降 600%,可以達到 0.6 美元 / 百萬 token,輸入價格 0.15 美元,也遠低于 DeepSeek R1 标準時段價格。
稍微偏離性價比策略的模型玩家是 OpenAI。
2 月底發布 GPT-4.5 後,其 API 價格達到 75 美元 / 百萬 token 輸入、150 美元 /token 輸出,是 GPT-4o 的 30 倍,高昂價格令其飽受争議。
但 OpenAI 很快糾正了自己的 " 錯誤 "。2 個月後的 4 月份,OpenAI 專為開發者推出了三款全新模型:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。最便宜的 GPT4.1 nano,每百萬 token 輸入價格暴降至 0.1 美元,輸出價格 0.4 美元。
但只靠性價比顯然還不足以打開市場。DeepSeek 之所以能夠出圈,除了低成本之外,其重要前提之一是模型能力有了創新,首次向外界免費展示了思維鏈的奇妙存在。
01
模型降本是趨勢,但國外比國内更貴
延續至今的大模型降本之争,源頭便是 DeepSeek。2024 年 5 月,DeepSeek 借助大模型價格戰一躍成名。當時,DeepSeek 發布了 DeepSeek V2 開源模型,并在行業内率先降價,将推理成本降到每百萬 token 僅 1 塊錢,約等于 GPT-4 Turbo 的七十分之一。
随後,字節、騰訊、百度、阿裡等科技大廠紛紛降價跟進。中國大模型價格戰由此揭幕。
在接受 " 暗湧 " 采訪時,DeepSeek 創始人梁文鋒解釋道,搶用戶并不是 DeepSeek 降價的主要目的。" 我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另一方面也覺得無論 API, 還是 AI, 都應該是普惠的、人人可以用得起的東西。"
此前,有雲廠商高管曾向直面 AI(ID:faceaibang)解釋:" 降價一直存在,并且只要摩爾定律在,降低計算成本将一直是模型行業的趨勢。"
包括李彥宏在内的部分大佬更是認為,降本将是推動 AI 應用爆發的重要前提。
但在降本的全球趨勢之下,值得注意的不同現象是,國外同類型、同尺寸的模型,調用成本依然要比國内的更貴。
4 月份剛剛發布的 OpenAI o3 新推理模型上,其每百萬 token 的輸入價格為 10 美元,輸出價格 40 美元。但以輸入價格論,o3 是文心 X1 Turbo 的超 70 倍。
造成這種不同的原因之一,或許也跟國外模型廠商的多元化商業變現有關。
相比國内只能靠 B 端 API 調用收費,目前國外還有來自 C 端的銷售訂閱服務,甚至後者商業變現能力還要強于前者。The Information 爆料,OpenAI 今年訂閱銷售額有望達到 80 億美元,遠超銷售其 API 接口的約 20 億美元。
OpenAI CEO 奧特曼近期在接受采訪時就談道,自己更感興趣的是,弄清楚如何為一個真正出色的自動化軟體工程師,或者其他類型的代理,向人們收取高額費用,而不是通過基于廣告的模式來賺取一些小錢。
此前,外界就曾爆出,OpenAI 有望推出高達 2000 美元,乃至 2 萬美元的月度訂閱制。目前,OpenAI 設有每月 20 美元和 200 美元兩檔訂閱模式。
02
只有性價比還不夠,關鍵在于模型是否有特色
商業變現受限之下,陷入價格戰之中的國内模型廠商,還可能迎來更大的成本壓力,甚至跌入互聯網時代燒錢補貼的競争邏輯。
更大的挑戰還在于,僅靠性價比也并不能徹底留住用戶。
DeepSeek 在去年開啟價格戰後,雖然在行業内開始嶄露頭角,但并未在大眾層面引發關注。直到 DeepSeek R1 模型的到來,DeepSeek 才真正出圈,成為一款家喻戶曉的 AI 產品。
奧特曼在點評 DeepSeek 爆火現象時曾認為,模型的能力并不是真正讓 DeepSeek 獲得病毒式傳播的關鍵,關鍵在于 DeepSeek 免費開放了 OpenAI 隐藏起來的思維鏈。
但環顧當下的一眾新模型產品,除了在各項數據上比肩或者趕超 DeepSeek,乃至 OpenAI 之外,它們尚未在產品體驗和功能上有創新之舉。
這方面從谷歌到豆包,都先後做過了反面示例。晚于 DeepSeek R1 近兩天發布的豆包 1.5 Pro 大模型,盡管在預訓練和推理成本上還要低于 DeepSeek V3,但卻因為模型體驗不如前者,而未能在輿論場上激起太多水花。
同樣趕在 DeepSeek R1 之後發布的谷歌 Gemini 2.0 系列大模型,盡管其 Gemini 2.0 Flash-Lite 版本的調用價格,比 DeepSeek V3 更低,但僅靠價格優勢,也依然難以俘獲用戶的芳心。
這也從某種程度上解釋了,為什麼頂着全球最貴大模型稱号的 Claude,依然能俘獲一批開發者的芳心,如繼 DeepSeek 之後另一出圈的通用 AI Agent 產品 Manus,便是基于 Anthropic 的 Claude 3.5 模型開發而來。
一切競争的原點,都又回到了底層模型的技術創新和突破上。