今天小編分享的互聯網經驗:京東這步暗棋,蟄伏了五年,歡迎閱讀。
出品|虎嗅商業消費組
作者|苗正卿
題圖|視覺中國
面對 DeepSeek 衝擊,互聯網大廠們正在重新調整 AI 策略。
3 月初,騰訊元寶徹底擁抱 DeepSeek,并借力 DeepSeek 完成熱度反超。幾乎與此同時,字節旗下火山引擎、飛書,阿裡旗下國際站、阿裡雲、釘釘紛紛宣布接入 DeepSeek。
一場互聯網大廠的 DeepSeek 愈演愈烈,而這背後是各大廠針對 AI 的關鍵博弈。
在這波接入 DeepSeek 熱潮中,京東也身處其中。2 月初,京東雲正式上線 DeepSeek - R1 和 DeepSeek - V3 模型,并率先在行業裡推出 DeepSeek 一體機。
和騰訊、字節通過元寶、豆包發力 AI to C 市場不同,2024 年京東在 AI 端重點發力言犀大模型、數字人、智能體平台、智能編碼助手 JoyCoder 等 B 端產品。截至 2024 年底,京東平台上已經有 80 萬商家使用了京東 AI 工具。
不過,擺在京東面前的也是更為激烈的 2025 年:随着字節、阿裡紛紛在 AI to B 領網域加注,以及百川、智譜等 AI 獨角獸公司進一步轉向 B 端市場,圍繞 AI to B 的競争進一步加劇。
DeepSeek 到底改變了 AI 圈的哪些底層邏輯?to B 市場到底有哪些關鍵機會?京東做好準備了嗎?
在京東雲宣布接入 DeepSeek 後,虎嗅第一時間與京東科技人工智能業務部總裁、京東探索研究院院長何曉冬進行了交流,請他分享了對于 DeepSeek 衝擊、AItoB 行業競争以及 AI 技術趨勢的一系列思考。值得注意的是,近日中國人工智能學會發布 2024 年度 " 吳文俊人工智能科學技術獎 " 公告,京東科技人工智能團隊憑借 " 多模态互動式數字人關鍵技術及產業應用 " 項目榮獲中國智能科學技術最高獎——吳文俊人工智能科學技術獎的特等獎,也是本年度唯一的特等獎。
下附交流實錄,有删改:
DeepSeek 重塑了商業格局
虎嗅:DeepSeek 年初的這波熱潮對你而言衝擊比較大的地方是什麼?
何曉冬:我覺得有兩點很有意思,DeepSeek 技術上做的深度推理以及它 R1 的開源模式。這兩點深刻重塑了 AI 行業格局。
技術上講,OpenAI 把 API 分了 5 個層次,就是 L1 到 L5,第一層是偏人機對話語言理解這部分,第二層就開始涉及到深度推理。如果按照這個分類看,OpenAI 發布的 O1 和 DeepSeek 發布的 R1 意味着我們正式從 L1 向 L2 階段邁進了。
其實在 2023 年底,矽谷的技術圈就有說 OpenAI 在開發一個叫做 Q-Star 的強化學習算法項目為 GPT-5 做準備。當時我們只是聽到這個名字,但一聽到名字就能想到 Q 能力就是經典的強化學習。我們聯想到,或許有點類似于 AlphaGo 這樣的方式,就是會用強化學習配上搜索來做深度推理。只是當時我們覺得,圍棋畢竟是一個固定網域或者說封閉網域,如果做到開放網域,也就是大模型上的開放智能,其實是有很多技術挑戰的。
但看得出來,2023 年底,其實大家已經看到這個技術方向了,2024 年 7 月 o1 就開始做出來了。2024 年 4 月份的時候,我在清華大學參加一個 AI 人工智能論壇時,說了一個觀點,未來可能有兩個方向,一個是深度強化學習,就是用模型來訓練模型,因為光靠人訓練模型在 GPT4 已經快到頂了。第二個方向就是 " 合成數據 ",因為普通數據幾乎用完了,下一步可能需要通過更加高效的合成數據來做這個事情。
可以說技術的進步确實挺快的,很多人雖然都看到了這個技術方向,但真正做出來的并不多。但對于未來大家應該更有信心了,尤其是模型開源和論文開源後。
另一個衝擊或者說影響是,開源本身重塑了商業格局。比如 OpenAI 就首先受到了衝擊,它的商業模式受到很大影響。但說到底,開源是一個非常好的事情,它降低了模型的成本,打開了應用的空間,大小公司都可以更低成本去運用 AI 能力構建應用,這會帶來生态的百花齊放。
京東也在考慮怎麼利用這個機會,包括我們也快速把 DeepSeek 上到了京東雲,給我們大小客戶提供這個能力,我們還提供私有化部署 DeepSeek 的能力,包括面向行業的解決方案。
虎嗅:當剛才你也說到,其實從 23 年底大家都在讨論或者說都看到了一些趨勢,但為什麼做出來的只有這麼一家公司?
何曉冬:2024 年上半年,很多人還是把精力放在了 " 大 " 上,比如追求更大的模型、追求更多的卡,搞萬億級或者 10 萬億級規模,大家只看到了所謂的尺寸 Scale,并沒有真正深度認識到推理的重要性。
到了 2024 年下半年,大家看到了推理的重要性。DeepSeek 是一個非常純粹的技術公司,他們基于這種純粹性更能夠看到技術本身的深刻性,所以在推理這些方面投入會更加堅決。
虎嗅:DeepSeek 引發的另一個熱議話題就是開源,好像一年前乃至于 2024 年四季度,大模型圈對于開源閉源的判斷并不像今天這樣,為什麼 DeepSeek 堅決走這條路?
何曉冬:回到一年前,只有 OpenAI 的技術領先且能比别人拉開一個身位,它不開源,所以大家會覺得開源的意義沒有那麼大。其實一年多前,Meta 的 Llama 模型也在開源,但它的效果确實比 OpenAI 差一些。以及,大家會覺得,閉源或許是一個可以成立的商業模式。
DeepSeek 為什麼對于開源這件事影響這麼大呢?我覺得是因為它用一個很高質量的模型衝擊了 OpenAI 的護城河,大家會覺得開源生态能夠建起來了。所以很多時候,關鍵公司、關鍵的人的一些影響,會改變大家對一些問題的根本性看法。
虎嗅:開源的想象力空間打開後,對于京東在做的事情有哪些影響?
何曉冬:AI 的技術競賽會持續下去,這意味着需要進一步投入。我們不能停也不會停。從京東做大模型的實踐中,我們看到在應用層确實現出現了很多機會,尤其是 DeepSeek 帶來的周邊生态影響。大量客戶都意識到可以用相對低廉的價格部署一個高質量的 DeepSeek 模型。所以你看京東雲以及其他的雲,都在部署。随之而來的,也帶來了一些機會。
在技術和應用上,大家都會有更大的動作。在技術上,我們會吸收這些最新的論文裡面的技術,比如進一步做強化訓練、進一步使用包括蒸餾在内的技術。市面上現在頭部的模型,都在嘗試這種綜合性蒸餾以提高效率。
在應用上,我們在擁抱 DeepSeek 本身,快速接入到我們的 AI 全系產品中,直接給客戶提供端到端的服務。比如用它來寫直播文稿、營銷文案,我們一直在嘗試。但同時也發現了一些問題,比如幻覺太高。在嚴肅使用的場景裡,需要我們微調的地方還有很多,比如用 DeepSeek 生成權益文案,有時候會出現一些并不存在的權益,對于商家而言這是不可接受的。對于整個 B 端而言,開源的 DeepSeek 目前在适配中存在的最大挑戰就是幻覺,我們在想各種辦法把幻覺降下來。
AI to B 市場拼的不只是技術
虎嗅:你覺得在 AI to B 市場,今年的競争情況是怎樣的?
何曉冬:其實 AI to C 和 AI to B 都是我們想做的。AI to B 其實可以分為兩個層次,一個叫做 Model Service,一個叫做 Software Service,前者是更加基礎的服務。這個 Model Service 包括了模型、API 接口,以及剛才提到的 DeepSeek 上雲,以及更上層智能應用的開發。我們目前就在提供這樣的能力,不久的将來我們會提供新一代的能力,比如 API 調用等。
Software Service,是一種端到端的產品,比如一些深度閉環的 AI 產品,包括智能客服、智能營銷,還有數字人直播,就是這樣的產品。
通過這兩類 AItoB 產品,我們可以形成商業化閉環,我覺得大家都有機會。
虎嗅:好像和之前京東在 AI 上的思路沒啥變化?
何曉冬:對,京東的戰略是比較有定力的。DeepSeek 開源,對于京東而言,可以讓我們之前想做的一些商業化模式有更高的效率或者說更低的成本。但是 DeepSeek 開源并不會改變京東根本性的思路。
虎嗅:你們是選擇 MaaS 多一些還是 SaaS 多一些?
何曉冬:這兩邊都在并行推進。在 DeepSeek 開源後,MaaS 的機會确實不太一樣。開源之前,我們做 MaaS 往往基于雲之上,然後采用自己或者業界的開源模型,但當時業界的開源模型一般效果會差一點,所以自己的模型收費一般更高一些。但 DeepSeek 開源後帶來的較大的衝擊是,我們自己的收費模型需要和免費的開源 DeepSeek 做出差異化,才能讓商業模式閉環。
所以現在的情況變了,一種是拼部署成本誰更低,包括了更低的成本或者更高的并行推理技術;第二種是在 DeepSeek 基礎上做進一步的微調,或者說做強化學習、做蒸餾,改變它的幻覺問題,也就是在特定行業上做培育,幫助企業構建自己的大模型,這樣 DeepSeek 的價值可以更好地呈現。這兩個模式,都是當下 MaaS 可以做的,也是京東有技術積累,能夠商業化的部分。
在 SaaS 部分,基座模型只是其中一部分,整體效率、場景、端到端體驗都是核心問題。這就會衍生出在應用層的差異化,由此會帶來新的商業模式。
這一部分我們現在做的比較多的是 AI 客服、AI 營銷以及數字人。以數字人為例,現在數字人已經不只是語言大模型和其他大模型的多模态結合了。它是一個綜合性的產品級比拼,商家看重的是 AI 帶動最終的銷售效果。就好比在互聯網時代,當互聯網已經變成了基礎設施,大家拼的就不是網速而是不同的應用了。而當時京東能夠勝出,除了有技術因素,也包括了整體終端的體驗、運營方法論、直播流量與玩法等一系列因素。
京東發力 AI 分了三步走
虎嗅:你們做 AI 時,當時有具體的目标嗎?
何曉冬:早在 2020 年左右,我們提出過一個規劃,現在回看我們其實還是按照這個規劃走的。我們當時講要做到 " 一個平台三級火箭 "。一個平台是指,我們需要一個基礎大模型平台,當時,我們已經看到模型的規模效應價值了,所以這個是必須要做的。而在這個平台上,我們規劃了三級火箭:從 AI 智能客服,到 AI 營銷,然後智能互動媒體,指的是數字人等產品。
AI 客服其實是一個比較具象的產品,在 2020 年我們就做好了。當時我們也開始做 AI 營銷,主要是想用 AI 把營銷更新。我們也希望 AI 可以給營銷帶來一些颠覆性創新,比如用 AI 語音去做營銷推廣、關系維護,甚至做助理和導購。在這個領網域,我們進一步看到了智能互動的價值,包括延展到今天數字人這樣新型的人機的界面。這幾個方向是我們當時規劃好的,我們今天其實也依然按照這幾個方向在做。
智能客服其實是一個比較成熟的賽道,AI 營銷未來還有巨大的空間。你看國外的幾個巨頭,它們 AI 的商業化很多都包含營銷。智能互動包含 AIGC,這裡面不只是數字人,還有 AI 生圖、AI 生音視頻,這些技術又能支撐很多新的 APP 和業态出現,也就是說,它可以把社交、内容、搜索、電商都重新做一遍。這個想象空間是巨大的。
它其實很像當年的互聯網,互聯網剛出現時,大家一窩蜂覺得賣網關最賺錢,後來出現的早期商業模式也只是發郵件。但你回看,會發現這些只是前菜,後來那麼多巨頭公司、萬億級别公司,在二三十年前最早的互聯網時代幾乎都不存在。
虎嗅:這幾年京東在 AI 投入上的比例是怎樣的?
何曉冬:我們一直在堅定的投入 AI。 DeepSeek 給我們的啟示是,我們整個計劃提速了,這其實是一個動态競争,DeepSeek 讓圍繞 AI 的競争更加激烈了,當然機會也更多。
虎嗅:2023 年的時候,你們糾結過嗎?
何曉冬:2023 年的時候糾結過,包括投入規模、以及先後次序、時間空間上到底怎麼分配資源。
虎嗅:你們在 AI 上的投入,和你們實現商業化之間有一些關聯嗎?
何曉冬:我們比較大的項目是通過專項去投入。京東探索研究院裡有很多致力于長期研究的 AI 方向,集團層面對 AI 是有長期信心的。
虎嗅:你們當時規劃京東的 AI 戰略時,參考了什麼國内外公司的模範嗎?
何曉冬:前期主要是通過技術的發展趨勢做研判,通過技術趨勢做核心技術的積累與突破,這個是由京東探索研究院以及基礎算法的同學承擔這個責任。
第二個階段,我們是想形成一個能力平台,這樣才能夠落地生成產品化應用。第三個階段則是強化生态,我們要把技術生态、產品生态、服務生态都做起來。從我們現在做的事情來看,我們處于第三個階段。但我們也看到,平台光有 API 是不夠的,你需要有标杆式的示範性、拳頭產品。一方面這些產品本身可以帶來利潤,另一方面這些產品可以讓生态夥伴看到标杆性案例,才能吸引大家來一起做生态。
虎嗅:此刻你對 AI 未來,有哪些核心預判?
何曉冬:首先是合成數據應該會成為趨勢,它會類似我們合成材料一樣,成為未來的基礎。我們現在用的主要是大眾數據,就是互聯網上幾千億、幾萬億的數據,我們關心的其實是數據裡面的智力而不是數據本身,所以在訓練模型時我們實際上是要把這些數據之中的智力榨取出來。但大眾數據能夠提供的智力已經快到邊界了,接下來如果我們想進一步提升模型智力水平,不能依靠大眾數據裡面的智力了,而是需要更高智力密度的數據。這也是為什麼現在很多模型用數學奧賽題做訓練,然後再通過其他模型蒸餾、做強化學習。
合成數據和強化學習,模型與模型之間的對抗,是接下來模型發展的關鍵。而更深的一層是,要讓這些模型的智力水平進一步提升讓其走入真實世界,并在真實世界接任務、進行互動與對抗,繼續提高智力水平。
虎嗅:在這些方面,京東探索研究院做了哪些準備工作嗎?
何曉冬:京東探索研究院有一個三步台階的布局——從語言大模型到多模态智能再到具身智能。這其實是整個 AI 走向 AGI(通用人工智能)或者 ASI(超級人工智能)的過程。也就是說,從語言和認知智能擴展到多模态智能後,下一步一定是實體世界智能。