今天小編分享的互聯網經驗:裝上DeepSeek後,CTO更焦慮了,歡迎閱讀。
開年,各個企業都在争相接入 DeepSeek,初創團隊在公有雲上連夜調用 API 開發智能客服等輕量化應用,金融機構迫切采買 DeepSeek 一體機,各地政府則悄然在政務雲上部署了 DeepSeek ……不同賽道的企業正以迥異姿态湧入這場智能更新的軍備競賽。
對于 CTO 而言,DeepSeek 的驚人模型效果,無疑讓技術從業者們振奮。但更多的 CTO 也開始焦慮:在企業大面積使用大模型之後,如何通過大模型加速自己企業的智能化更新?如何規劃?如何投入?做什麼方向?聚焦哪些業務場景?如何更新技術棧……
企業到底怎麼在業務流程中用好包括 DeepSeek 在内的大模型?
在京東雲看來,企業應用大模型将經歷四個階段,答案也在其中:
開始時,不管能否找到應用價值,企業都選擇先讓員工把大模型用起來,目前,國内大多數企業都處在這個階段,将 DeepSeek 的部署作為首要工作。
随着通用模型使用的深入,企業會開始輕量化的嘗試,首選就是智能體,部分企業已開始這一階段的探索。
智能體應用深入後,企業會發現通用模型在解決企業專業問題上存在瓶頸,大中型企業就會利用自己的數據蒸餾垂直模型,這就進入了第三階段,用垂直模型替換通用模型。
最後垂直模型強化智能體的能力,部分智能體就會成長為超級智能體,多智能體協同產生新的業态,進入終極的場景智能。
輕量智能體破局:從 " 能用 " 到 " 好用 "
智能體是打開大模型價值的第一把鑰匙。科技行業已達成一個共識,智能體已經成為企業數智化轉型的核心驅動力。作為主流應用形态,智能體不僅能提升運營效率,還能降低 AI 使用的門檻。
根據德勤《2025 年技術趨勢》預測,智能體将成為未來企業的重要組成部分。
作為智能體落地的先驅,目前京東自有的多場景中,已落地超 1 萬個智能體,累計提升人效上億元。基于此,京東雲作為京東對外輸出技術與服務的核心平台,充分解耦京東智能體實戰經驗,總結出五大核心場景:協同辦公、專業助手、客戶服務、營銷推廣和數據應用。
這些場景已在京東内部發揮巨大業務價值。例如在專業助手方面,JoyCoder 智能編碼助手能幫助開發者預測代碼、生成注釋、進行智能評審,生成的代碼采納率超過 40%,開發周期縮短 30%。在營銷上,通過 AIGC 技術可以快速生成高質量的營銷文案和商品場景圖,制作效率提升高達 90%。比如,言犀數字人能自動生成直播腳本,已經覆蓋 7500 個直播間,帶貨 GMV 總量超百億。
京東雲相關負責人表示:" 我們總結出的五個場景,已經能覆蓋企業用智能體,提升業務效率的 80% 通用需求,在現階段,智能體落地過程中,把核心場景打穿打透,遠比一味追求智能體數量,重要得多。"
目前京東雲将這些智能體能力,沉澱在言犀智能體平台,對外支持更多企業在智能體方面探索。
例如,食品行業上下遊角色分散,會議對決策管理至關重要。在味全食品,京東雲搭建了一套會議管理系統,可自動生成會議文本記錄,并分類歸檔,有效提升公司運轉效率;在中國飛機租賃,該公司專業知識復雜,人工查詢影響決策效率,京東雲構建一個智能問答系統,提供高效、準确的問答互動,并依據反饋持續優化性能,大幅提升員工辦公效率。
企業在智能體上取得成效後,對于很多中型和大型企業來說,考慮到未來 AI 應用越來越深入廣泛,自建智算基礎設施将成為決策的必答題。
構建智算底座:技術決策者的 " 重投入時刻 "
當 AI 算力密度突破 40kW/ 機櫃,模型參數邁向萬億級,企業構建智算基礎設施已超越技術更新範疇,成為重塑產業話語權的戰略抉擇。那些率先完成智能化改造的企業,正像百年前電氣化革新的先行者那樣,在數字時代的版圖上刻下新的坐标。
從通用計算向智算更新,基礎設施面臨三重挑戰:高密度智算的供電 / 制冷、算力集群的微秒級互聯、異構算力的動态調度。例如,随着伺服器功耗提高,單機櫃功率上升趨勢明顯,目前普通數據中心是 4-6kW,為滿足 GPU 伺服器的運行,現在新建智算中心單機櫃的功率需求已經達到 20~40kW,按照最新發布的 GPU 伺服器的參數,智算中心單機櫃功率需求将達到 40~120kW。 同時,現在 GPU 伺服器要求網絡組網距離越近越好,并且有明确的傳輸距離的要求,這種要求直接造成機房房間功率密度也同時增加。
基于京東集團復雜場景實踐,京東雲構建了一站式大模型產品矩陣,從底層的智算基礎設施,到中間層的模型服務和工具,再到上層的 Agent 應用開發,支持企業快速部署大模型及應用。
在高密度智算的供電 / 制冷方面,智算中心功率密度是傳統數據中心的 5 倍,對供電、散熱的要求嚴苛。京東雲自研的阿爾法智能算力模塊,支持液冷系統一體化交付,PUE 控制在 1.15 以内,同等規模成本直降 15%;新一代液冷伺服器,散熱效能提升 50%,單機櫃 20kW 年度省電 8500 度。
在算力集群互聯互通方面,計算、存儲、網絡的 " 黃金三角 ",對大模型高效使用至關重要。
京東雲超智算一體化算力集群,單集群萬卡、全局 10 萬卡級集群調度能力,依托軟硬體協同優化,驅動大模型算力利用率(MFU)躍升至 75%。
雲海 AI 存儲,千億級大模型全棧支持,4K 随機寫 IOPS 突破 1000 萬級極速響應,存算分離架構實現性能與成本雙 30% 突破,構建超大規模 AI 訓練的普惠存儲底座。
京東雲高性能雲網絡,RDMA 帶寬提升至 3.2T 級,端到端通信時延壓降至 2 微秒級,支撐千億參數模型無損訓練,釋放 AI 算力極限。
在異構算力的動态調度方面,京東雲 vGPU AI 算力平台,為應對大模型異構算力需求而生。支持多元算力統一納管與精細化運維,通過深度優化 DeepSeek 架構,滿血版推理性能提升 50%。同時借助 AI 全場景密态計算以及容器隔離技術,确保模型參與訓練數據雙網域零洩露,為用戶提供金融級安全防護。
在行業實踐中,京東雲成功支持某新能源汽車頭部廠商、某全球新能源科技領導企業,打造覆蓋全集團的智能計算底座,實現千卡級 AI 算力集群的精細化管理。技術上一方面創新多元算力調度,顯著提升 GPU 利用率,另一方面創建全生命周期 AI 開發環境,實現開箱即用,大幅提升研發效率。目前,該平台已支撐起企業智能駕駛研發、人形機器人等 20 餘個核心場景,成為集團的 " 數智發動機 "。預計一年内,兩家企業大模型訓練周期将縮短 40%,每年節省的算力成本相當于新建兩座數據中心。
垂直模型蒸餾:邁向全面智能場景的關鍵一躍
當通用大模型完成技術啟蒙,千載難逢的良機屬于那些擁有高質量自有數據的企業。他們通過運用自有數據完成模型蒸餾,率先推動產業效率變革,讓 AI 應用走向真實價值深水區,打開全面智能場景。
京東雲認為,全面智能場景形成,可以通過兩種途徑實現:一是智能體成長為超級智能體,成為新的業态。二是對過去數字化場景的智能更新。
在京東内部,一場針對大模型小型化的效率改造正在悄然展開。通過在通用大模型注入京東零售、金融、健康等體系内復雜、真實、動态的領網域數據,言犀大模型已經跑在了健康咨詢、金融營銷、代碼生成、協同辦公等多個智能場景,在特定任務中的準确率較通用模型提升超過 20%。更關鍵的是,神經元剪枝技術實現 " 瘦身不減智 ",模型顯存節約 70%、推理速度提升 1.5 倍,讓千億、萬億級參數模型也能輕盈落地。
效果突破的背後,是京東在模型蒸餾、數據治理與混合、訓練配方優化、大小模型協同等多領網域沉澱下來的大模型開發計算技術。最近,京東探索研究院自研的這套模型開發計算研究成果也将首登 Nature,并通過言犀 AI 開發計算平台,向外部企業開放服務。
大模型應用的技術紅利形成多點開花的應用圖景,向外生長:
在數據要素領網域,大模型正在重構企業數據價值鏈。面對海量非結構化數據,傳統人工處理僅 50-60% 的準确率,企業數據要素服務平台通過大模型可實現 99% 的精準識别;
在智能運維領網域,AI NOC 智能運維系統将重大故障定位時間從小時級壓縮至秒級,背後是沉澱了超萬名研發人員經驗的運維知識庫;
在城市治理領網域," 一表通 " 系統通過智能體自動抓取數據,将基層工作效率提升 70%,ICOS 城市平台将政務應用開發周期縮短 60%。
在智能營銷領網域,超 35 萬商家借助 AIGC 生成商品圖,30 億字的營銷種草文案由 AI 生成、50 萬條 AI 采銷短視頻實時投放中 ... 產業數據的轉化效率已發生質變。金融增長雲還開放了包括 4.6 億京東金融用戶運營 Knowhow,通過互動式營銷、廣告投放、營銷内容生成三大智能場景,幫助銀行客戶實現 AUM、MAU 增長超 30%。
這些場景驗證了垂直模型的兩大價值支點——既要深入業務毛細血管獲取數據養分,又要通過工程化改造适配真實業務場景。京東通過自身復雜業務場景錘煉出的模型蒸餾技術,正在降低更多企業的 AI 準入門檻,輕松拿到大模型時代的入場券。
當京東雲向產業打開他的大模型 " 工具箱 ",CTO 們的焦慮有了新注腳:技術部署只是起點,真正的競争在于如何将 AI 轉化為業務進化基因,重塑 AI 生產力。那些在輕量化應用中積累場景認知、在智算底座建設時預留技術彈性、在垂直蒸餾中構建知識壁壘的企業,正悄然拉開身位。
有業内人士斷言:" 大模型淘汰的不是技術,而是組織的遲鈍。" 當 DeepSeek 将 AI 能力民主化,CTO 的焦慮本質上是企業數字化轉型的集體陣痛——這場關乎生存的進化競賽中,焦慮或許是最好的清醒劑。(本文首發于钛媒體 APP)