京東大模型交卷：天生離產業更近一步

今天小編分享的科學經驗：京東大模型交卷：天生離產業更近一步，歡迎閱讀。

做大模型的公司不少，能明确給出產業落地時間線的還是頭一次見。

剛剛，在 2023 京東全球科技探索者大會暨京東雲峰會上，京東推出了言犀大模型 + 言犀大模型開放計算平台，并展示了零售、健康、物流、營銷、金融、客服等多個產業場景的階段性實踐成果。

一開場，就欣賞了一段由大模型驅動的數字人歌舞表演。

電商場景下，支持 AIGC 商品内容生成。

還有 AI 增長營銷平台，幾句話構建出營銷方案、推廣網站。‍

醫療場景下，通過多輪對話即确定用戶腰疼的的原因。

除了現場演示之外，三步走的落地路線圖也格外引人關注——

今年下半年在京東内部高復雜場景中反復打磨錘煉，并針對重點場景的标杆客戶進行對外服務，主要目的是發現那些看起來 " 不起眼 "，但產業應用中又非常關鍵的問題。

2024 年上半年，就能針對嚴肅商業場景将大模型能力全面對外開放。

劃重點了，這裡的對外開放不只是提供 API，而是連產業應用一起打包，讓企業開箱即用的那種。

京東不會把沒做好的菜端上餐桌。

而京東之所以有底氣制定這樣路線，也是頗有不少幹貨在裡面的。

產業夥伴需要什麼樣的大模型？

通用大模型火過半年之後，整個產業已經把目光聚焦到下個階段——產業大模型。

随着最早提出產業大模型的京東交出答卷，關于「產業夥伴需要什麼樣的大模型」的問題也可以得到階段性解答。

大模型時代到來，C 端應用層出不窮，普通大眾有了直觀感知，對其所存在的 " 胡說八道 " 等問題，也有了切身體會。

但對于 B 端企業而言，由于身處行業不同以及自身業務考慮，到底「用什麼？如何用？」始終沒有很好的答案，大多都 " 還是不知道怎麼用 "。

當大家談到產業大模型，第一反應是聚焦某個行業做小模型。

但何曉冬告訴量子位，這可能是一個誤解，做產業模型的時候還是需要一個通用網域的數據，通用網域數據對行業應用也非常關鍵，它提供了背景常識性的知識。否則如果用戶突然提出一些跟這個領網域不相關的詢問的時候，話題的跳躍性比較大，原來領網域小模型就會很茫然。

所以，企業所需要的產業大模型也必須建立在通用能力基礎上。

大模型于企業而言，大都是降本增效之用。比如可以自動化處理數據和任務、分析大量數據給出更精準的決策、擴展到新的業務領網域等等。

而要實現這些用處，大模型就必須滿足兩個原則：可信、可用。

可信，意味着模型的預測結果是可靠的，可以被企業信任；

可用，則表示模型可以在實際業務中發揮作用，為企業創造價值。

這兩點，不僅是企業用什麼大模型的選擇基準；也是實現大模型產業化的兩個基礎特性。

首先來看可信。

針對性地解決大模型可信問題，市面上仍未形成完整的解決方案。

過去幾個月大模型從亮相到應用以來，始終存在的幻覺問題。而早在 2020 年京東基于 Transformer 做的K-PLUG模型實體屬性抽取準确率達到了 95%，已經達到了商用的水平。

這各中原因，在于京東走出了自己一條路——知識注入。

當時放在業内，屬于首創。

它大幅改善了此前 AI 生成長文本任務中文本多樣性、篇章連貫性，以及在商品賣點文案的生成中尤其需要關注的賣點獨特性、屬性一致性，給予商品 " 真實的贊美 "。

最終在一系列 NLP 任務中，比如實體屬性抽取準确率、生成式多輪對話 ROUGE-L、多輪問答知識檢索率，其性能明顯優于其他基線模型。

之所以能這麼早地發現 " 幻覺 " 問題并解決，這與他們一直以來圍繞產業實踐有關。

市面上一般生成式語言模型生成的内容正确率是 83%、85% 左右。一般 toC 用戶用起來覺得還可以，十個裡面錯一個，但是商用是不可接受的。

同樣的思路，也集成到了可用的實踐上。

從提供大模型企業的視角下，這個問題就轉變成如何讓大模型創造普惠價值。任何一項技術實現普惠，意味着技術門檻和使用成本的盡可能降低。

算法的泛化 + 向量數據庫 +SaaS，這是京東給出的一套組合拳。

前兩者自不必多說，一方面算法泛化能力，可以讓模型處理多種任務，解決行業中復雜長尾場景。

2022 年，針對模型泛化性不足，京東提出百億級 Vega 模型。并于 2023 年在通用語言理解基礎模型方面對織女大模型進行再更新，提出規模更大、性能更強、遷移性更好的 Vega v2 模型。

向量數據庫則可以實時更新知識庫，補齊大模型的長期記憶，還能降低訓練成本，可以說一舉多得。

而向量數據庫，2019 年京東就在業内率先研發了 Vearch。目前服務超 100 家大中型企業用戶。數據顯示，将京東的向量數據庫用于大模型預訓練，相比傳統方式，通過優化模型推理效率，推理成本降低 80%。

目前大模型在應用上的主流思路，就是調用 API。何曉冬在接受采訪時表示，這對于一些傳統行業客戶來說，這依舊有一定的技術門檻。

而客戶唯一關心的就是服務效率，只要能将產品用起來就行。

于是團隊決定直接将技術解耦形成" 言犀 AI 開發計算平台 "，并在内部實踐中打磨產品模塊。客戶甚至不需要掌握深厚的 AI 知識，跳過中間步驟直接引入成熟的大模型能力。

之前需要 10 餘人的科學家團隊工作，現在只需要 1-2 個算法人員，通過平台即可完成從數據準備、模型訓練到模型部署的全流程，訓練效率提升 2 倍，推理提效 6.2 倍，成本節約近 90%。

從可信、可用這兩個角度來看，京東給出的解決方案，在整個行業中打了個樣兒。

從語言大模型走向多模态數字人互動

這種圍繞產業實踐發現問題、解決問題的方法，不光體現在大語言模型上，也體現在京東產業 AI 發展的各個階段。

前深度學習時代，還很少有人期望 AI 能像今天一樣獨立成為一個功能甚至產品，當時的目标主要集中在降本增效、體驗優化上。

2012 年京東開始應用智能客服中心，着力于用技術輔助客服提升人效，優化客戶體驗。回首看來，其中探索的三個具體任務方向：

ASR 語音識别技術、NLP 語義分析技術、數據挖掘技術。

時至今日，這三類技術對大模型的訓練影響頗深。

進入深度學習時代，AI 開始能在更綜合、復雜的場景下發揮作用。

2015 年，京東智能客服正式應用了深度神經網絡技術。2018 年，首度更新無人客服實現人機結合。在同樣 " 深度 " 的實踐過程中，言犀團隊逐漸認識到了這樣一個問題：

客服對話屬于任務導向性對話，最終是要解決真實場景的問題，與一般閒聊有本質區别。而且不同的場景，用戶對于對話的要求也不一樣，僅售前和售後就差别很大。

于是，早在 AlphaGo 掀起上一輪人工智能熱潮的那段時間，何曉冬就提出" 對話的本質就是推理和決策 "，後來他在各種場合常用 " 圍棋也叫手談 " 來解釋這個觀點。

在此思想指導下，何曉冬帶領團隊融合聲學、語義、時間等多模态特征，開發出一系列人機互動場景的 " 話語權決策 "（Turn taking）技術路線。

最近谷歌整合旗下谷歌大腦與 DeepMind 團隊，提出要用 AlphaGo 技術與 Transformer 結合開發下一代大模型 " 雙子星 "Gemini，也标志着這條路線的價值終于被更多人認識到。

再後來就到了現在 Transformer 大模型時代，京東的布局也很早。

京東在 AI 工程化方面，每天服務數億活躍用戶。以智能客服領網域為例，每年產生數百億的動态互動數據，一是數據規模大，每天提供 1000 萬智能客戶服務，每月 200 萬小時通話語音，今年京東 618 期間累計服務超 7 億次，在各種高負載考驗下，京東沉澱出了最佳實踐。

加上京東其他領網域的人機互動，數據量級達到了數百億。

2022 年，京東以言犀 2.0 ——人工智能應用平台的方式将内部驗證過的技術解耦出來，開始對外輸出。

如今的言犀 AI 開發計算平台，也是延續着這個思路。

何曉冬介紹，今年起，言犀大模型正在強大工程化能力基礎上于京東場景内深度落地，在健康、金融、物流等京東眾多優勢行業可復制性的場景中率先錘煉能力，打磨出成熟可靠的技術能力。

以健康領網域為例，靠着言犀大模型的多輪互動、工具調用、總結摘要、圖文多模态等能力，打造了健康助手及輔助診療應用。

目前，健康助手及輔助診療已積累超 3 千萬高質量臨患對話，構建起百萬級規模醫學知識圖譜，涵蓋超千種疾病專業性服務，20 種評價标準保障醫療安全。

在物流領網域，在言犀大模型的支撐下，京東物流超腦實現實時互動、根因分析和智能決策，并更新迭代至具備實時自動生成全局最優的供應鏈解決方案的能力。

在營銷領網域，京東科技市場和平台運營團隊打造了 AI 增長營銷增長平台，運用大模型解決了諸如關鍵性任務，動态适應性、用戶體驗等問題，大幅優化了營銷運營流程，實現方案生產效率上百倍提高；将過去涉及產品 / 研發 / 算法 / 設計 / 分析師等 5 類以上職能才能完成的流程，壓縮至 1 人；同時，一個入口的全新互動模式，讓人機互動次數從 2000 次降低至少于 50 次，将操作效率提升了超過 40 倍。

接下來是正在加速到來的通用人工智能時代，何曉冬認為一定是往多模态方向走。

當 AI 的通用能力達到一定程度，就可以不只停留在幕後提供技術支持，而是形成產品直接面對人類用戶，甚至像未來智能體一樣更深層次與人類互動。

對此，京東雲在言犀大模型的基礎上整合了多項多模态數字人互動能力，也在數字人客服、直播等場景實踐中找到出一些心得。

比如實現了語義驅動的肢體動作編輯，通過與大模型結合讓數字人說話時的動作與語義匹配，互動更加自然。

又比如數字人動态局部高清技術，利用了人類視覺感知并不均勻的特點，對臉部特别是眼睛周圍格外敏感。通過重點區網域提高分辨率，其他區網域适當降低分辨率，從而降低部署成本。

在 JDD 上他們表示，言犀會進一步降低操作門檻與操作難度，讓更多中小商家與個人能夠用得起、用得上數字人服務。

……

如此看來，言犀大模型落地路線圖中強調要有 " 半年打磨期 " 的原因就呼之欲出了：

不能只提供 API 告訴外界有這麼個 AI 能力，最終目标是為合作夥伴提供直接可用、有端到端價值的產品模塊。

大模型時代下的京東路線

幾個月前，企業們還在紛紛搶發大模型，到世界人工智能大會搖身一變 " 大模型主場 "，各家紛紛給出自己的行業落地解決方案。

雖然看上去琳琅滿目，但若進一步了解就會發現，這些方案不可避免存在業務場景趨同、落地進展仍處于起跑階段等問題。

這與大模型技術產業化難點有關，尤其是最後一公裡的問題，往往就是能用與否的邊界。這牽涉到整個系統工程難題，并非傳統 AI 三要素就可解決。

作為最早提出聚焦產業大模型的京東，早已感知到這種轉變，并将其更新為全新 " 三要素 " 内涵：

場景，以往靜态的數據無法适應動态的互動，只有活的在行業應用中的場景數據，才得以實現。

產品，單點算法不足以支撐起新的大模型。最終產品形态才具有核心競争力，并能帶動體系算法的創新和突破。

算力，單個 AI 芯片進步的速度慢于大模型算力需求的井噴，算力集群成為更好的解決方案。

至此大模型時代下的京東路線，也就此明晰：

產業原生。源于產業、服務產業。

于是在這場峰會上，京東将自身底層能力解耦，從基礎層、模型層、到 MaaS、SaaS 一攬子技術產品和解決方案都給釋出亮相給產業夥伴。

甚至于，已經給出了明确的 " 三步走 " 戰略：

第一步，基于核心產業數據，内部構建基座大模型；

第二步，在零售、金融、健康、物流等京東内部核心業務應用；

第三步，針對金融、政務、健康等京東網域外重點產業場景全面開放大模型能力，向產業輸出可用可控可信可負擔的定制化模型。

這樣一條落地路徑，也是京東再次向業内重申了自己的技術追求：

成本、效率、體驗、可信、普惠、突破。

早在 2017 年，京東提出" 技術、技術、技術 "口号，這三個技術代表了三個層次：

第一個層次是服務自己業務的需要；第二層次是服務產業的技術；第三層是探索未來的技術。

這三者兩兩耦合，形成技術與產業的閉環——基于產業的前沿創新突破，随後在内部打磨沉澱實現 " 可信 "，最終服務產業創造普惠價值。

也正是因為基于產業的思考，自今年 2 月業内首宣產業大模型之後，京東沒再透露更多進展，直至現在才首次将自身技術積累首次亮相。

畢竟從現在發展情況來看，大模型落地的難點并不在于技術追趕，而在于產業突破。

— 完 —

點這裡關注我，記得标星哦～

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~