今天小編分享的科學經驗:大模型的“第一性原理”:技術創新與社會價值的接軌,歡迎閲讀。
随着時間來到 2023 年第三季度,國產大模型已經達到 100 多個," 百模大戰 " 正式開啓。
大模型,我們有了很多選擇,也開始呈現出某種同質化。除了拼參數、比背景、看榜單,有沒有其他方法,讓我們更好地判斷一個大模型的價值呢?
亞裏士多德認為,任何一個系統都有自己的第一性原理,它是一個根基性命題或假設,不能缺省,也不能被違背。
透過表象,追尋本質,會發現各家大模型的 " 第一性原理 ",有很大的不同。而這個核心的不同,也會帶動大模型走向不同的發展模式。
比如 OpenAI 的内核是 AGI,大語言模型以 " 通用人工智能 " 的目标,作為出發點,最近才開始走向行業。
一些通用大模型,内核是 " 科研 ",在榜單上有不俗的成績,而行業應用所需要的配套工具、算力基礎設施等,則不在研發者的考量中,逐漸淡出主流視野。
一些產業大模型,内核是 " 應用 ",要快速勝任某一些具體的任務場景,加入了行業知識和專有數據 " 特訓 ",可基礎模型能力一般,遇到 " 常識性問題 " 就掉鏈子。
工具可以開發,算力可以買,一個大模型的内在價值核心,卻不會輕易替換。
我們一層層剝開京東大模型,看到了一個核心,就是—— " 產業 "。
最近恰逢 WAIC 和 JDD 大會,我們跟京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬博士,進行了多次交流,他深入分享了很多京東對于大模型的思考。
将 " 產業價值 " 作為大模型的 " 第一性原理 ",會讓大模型走出怎樣一條差異化的發展之路呢?我們不妨以京東為例,來展望一下產業大模型的未來。
大模型的價值起點
巴菲特曾説過,投資是滾雪球,找到 " 長長的坡 " 和 " 很濕的雪 ",雪球一旦啓動,堅持下去,就能越滾越大。
從產業的視角出發,會發現大模型這顆 " 雪球 " 的核心價值自證,确實還存在着很多問題,比如:
1. 技術的可用性存疑。
產業化最後一公裏的問題,看起來好像不大,卻是決定大模型能用不能用的邊界。
京東從 2017 年開始關注大模型,就很注重行業落地,也碰到了一些經驗教訓。
何博士直言," 拿着刷榜的技術給業務部門去秀,用起來碰到各種各樣的小問題,對使用者來説不可用,後來人家就不信你了,你再怎麼説也覺得你技術不行 "。
2. 行業的連接不夠充沛。
大模型落地,需要解決一個一個具體問題。這些問題不可能在實驗室裏 " 湧現 ",行業到底需求什麼,有哪些限制條件,都要從產業實踐和應用中找到答案。
何曉冬博士認為,大模型是不能自己坐在辦公室拍腦袋想出來的,一定是行業凝練出來的。
但向上觸碰學術、向下扎根行業,這樣的 AI 研究機構本身就很稀缺。
3. 價值回報還很朦胧。
引入大模型,意味着企業要增加各種成本,消耗大量的資源。企業引入大模型,也希望得到經過反復嘗試被證明沒有問題的產品。目前很多大模型的價值自證,還不夠有力。
何博士就提到,一般的生成式語言模型,内容正确率是 83%、85% 左右,to C 用户覺得還可以,但嚴肅商用的時候,模型正确率要達到 95% 以上,才能達到企業的要求。" 明明這個活動打的是八折,大模型生成的營銷文案説是五折,這個事情商業上是不可接受的 "。
事非躬行不知難,大模型急需一場產業價值的自證與他證。
破解方式其實也很簡單,就是一步一個腳印,把該踩的坑都踩了,把遇到的問題都一一解決。
所以年初,大語言模型高歌猛進的時候,京東沒有跟風,它在忙什麼?忙着解決問題。
京東的長坡
以 " 產業價值 " 作為 " 第一性原理 ",京東做大模型最先關注的,不是籤了多少單,什麼時候開發布會,而是夯實基礎設施。
AI 三要素:數據、算力、算法,都需要更新,才能撐住大模型時代,如同一個 " 長坡 ",讓大模型的 " 價值雪球 " 可以向前滾動。
先説數據。產業大模型,一般是先用公網域數據訓練基礎模型,再用行業專有數據進行 " 特訓 ",相當于先在中學上通識課,再到大學裏去學專業技能。京東的思路很不一樣,言犀大模型訓練時融合 70% 的通用數據與 30% 數智供應鏈原生數據,把零售、金融、健康、物流的 know-how 和數據,也放到基座模型中,相當于既做了通識教育,又上了很多門專業課,有更多的行業理解。
所以京東的大模型一推出來,面向知識密集型、任務型產業場景,已經可以解決真實產業問題。
再説算法。算法是大模型的核心能力,也是拉開產品體驗差距的關鍵。目前,單點算法已經不足以撐起大模型了,大語言模型就包含了強化學習、提示學習、預訓練等一系列優化。成體系的技術體系和算法創新,也更容易形成護城河。
然後是算力。很多大模型推出後不久便停止開放、限制互動次數,就是因為算力不足或成本昂貴,企業想用也用不起。所以,大模型後續能否持續為產業所用,算力不能成為短板。
京東在 2021 年就建立了最先進的 DGX 集群,在重慶落地了全國首個基于 SuperPOD 架構的超大規模計算集群——天琴 α,推理提速 6.2 倍,推理成本節省 90%,為基礎大模型的訓練和迭代提供保障,保持競争力。
一路深耕 AI 三要素,京東為大模型從技術走向產業,構築了一條 " 長坡 "。至此,大模型的價值底座,已經非常堅實。
產業的厚雪
回顧上一階段的產業智能化,很多技術能力都停留在表面,難以深入行業或規模化復制。大模型的價值變得飽滿,要卷起產業的 " 厚雪 ",将雪球越滾越大。
在何曉冬博士分享的一系列京東大模型技術和實踐裏,我們可以看到,大模型黏住產業 " 厚雪 " 的多種姿勢:
一是技術黏着。
產業 AI 落地難的很多問題,其實都源于技術瓶頸,比如深度學習的不可解釋性、泛化能力不足、模型精度不夠等。京東通過基礎技術的體系化突破,讓大模型變得高可用,形成端到端的產品價值。
比如數字人,基于 10 餘年智能對話經驗與多模态互動技術積澱,京東雲多模态數字人只需要極少量樣本素材,5 分鍾簡易拍攝,就可以自動生成聲情并茂的數字人,讓中小商家與個人能夠用得起、用得上數字人服務,算力、開發周期、人才等高門檻不再成為問題。
二是工具黏着。
目前,很多大模型廠商都開放了 API 調用的 MaaS 服務,但一個容易忽略的問題是,調 API 也是需要一定能力和開發工作的,很多傳統行業的用户,連 AI 基礎調用 API 的能力都不一定有。
豐富、極簡、開箱即用的工具,是產業落地必不可少的條件。京東的目标是,讓對 AI 完全沒有認知的用户,也可以直接使用大模型,提供從數據模型到應用服務的全周期管理,從基礎層、模型層、MaaS,延伸到了應用層的 SaaS 服務。
言犀大模型開放計算平台的行業知識庫,就沉澱了 100 多種訓練和推理優化工具,不到一周時間,即可完成從數據準備、模型訓練、到模型部署的全流程。
三是實踐黏着。
比起某個榜單上的書面效果,企業應用大模型,更希望看到實際應用中的真實效果,對技術能力和價值收益有一個更清晰的感知。京東已經進行了大量的產業實踐,優勢格外明顯。
目前,大模型在零售、金融、健康、物流等京東内部高復雜場景大規模錘煉,并融合行業解決方案對外輸出,可以減少大模型落地的顧慮和成本。
比如文本生成,零售領網域的文案,每個品類的敏感信息審核門檻都不一樣,基于京東全品類豐富的商品數據積累和大模型,京東雲 AIGC 内容營銷平台,已經可以通過一張商品圖片,生成電商運營需要的商品主圖,營銷海報圖和商詳圖等,每套圖成本降低 90%,周期從 7 天縮短到半天,而且不用擔心内容有風險,因為大模型的安全可信,在京東零售内部已經錘煉過了。
再比如健康診療,是一個對内容專業性和可靠性要求非常高的場景,京東健康應用大模型,進行健康助手及輔助診療,已涵蓋超千種疾病專業性服務,目前累計超 3 千萬高質量醫患對話,百萬級規模醫學知識圖譜。這些積累。
黏住產業的 " 厚雪 ",做實大模型的技術紅利,是這一輪 AI 熱潮,帶給科技企業的真正機遇。
在京東,產業大模型已經從一種技術設想,逐漸變為清晰的發展方向,以及可執行的行動方案,正在撬動產業 AI 的下一個可能。
抱一而為天下式
大模型的價值探索
在年初的熱鬧中保持冷靜,在 " 百模大戰 " 來臨之際,京東卻率先給出了大模型的價值公式:大模型的價值 = 算法 × 算力 × 數據 × 產業厚度的平方。
當下階段,大模型的野蠻生長,已經告一段落,走向新的應用紀元。推動大模型 " 從參數為中心 " 向 " 以應用為中心 " 轉變,是目前的核心問題。京東憑什麼後發先至?或許是很多讀者心中的 " 未解之謎 "。
但透過 " 第一性原理 ",我們卻可以看到,京東大模型差異化,是一種 " 必然 "。
京東技術的 " 第一性原理 ",就是 " 產業價值 "。
如京東 CEO 許冉所説,京東研發每一項技術,都将產業屬性作為出發點、產業價值作為目标:技術源于產業需求,歷練于產業場景,創造產業價值。
這個 " 第一性原理 ",造就了京東大模型的路線分野——產學研用的高度結合。
不同的出發點:不同于科研類大模型的 " 兩耳不聞窗外事 ",也不同于行業大模型的 " 一心只掃門前雪 ",京東從產業端切入大模型,既需要錘煉基座模型的先進技術,又需要考慮為整個產業和社會創造價值,這條路如同 " 從北坡等珠峰 ",更難也更有價值。
不同的行路人:看到了路,就需要有攀登的人。以何曉冬博士為代表的京東技術人,眼中有人間煙火,聚焦產業場景,服務京東自己的業務需要,技術在真實場景中被實踐打磨,被驗證,再解耦賦能其他合作夥伴;眼中也有星辰大海,京東探索研究院當技術剛剛在地平線上露出來的時候,就看到五年後可能會發生一些革命性的改變,開始前瞻性的布局,大模型就是其中之一,具身智能、多模态大模型、AGI 等,都是京東正在關注的方向。
不同的路線圖:京東做大模型,不是 " 無的放矢 ",對于大模型的應用實踐,已經有了明确的 " 三步走 " 規劃,第一步,基于内部實踐構建通用大模型;第二步,在零售、金融、健康、物流等京東内部高復雜場景大規模錘煉,融合行業解決方案對外輸出;第三步,針對嚴肅商業場景将大模型能力對外開放。目前,京東雲已經基于内部實踐構建了通用大模型。到今年年底,京東将經由高復雜場景大規模錘煉,迭代出扎實的產業服務,預計在 2024 年初,會将大模型能力向外部嚴肅商業場景開放。目前,京東已經走到第二步,并在内部取得了豐富的實踐成果。
以 " 產業價值 " 作為大模型的 " 第一性原理 ",驅動着京東在大模型領網域,走上了差異化的發展模式,率先完成了產業價值的創生和積累,更早進入應用紀元。
京東大模型的 " 價值雪球 ",正以 " 馬太效應 " 越滾越大,加速駛向千行百業、人間煙火。抱一而為天下式,大模型的產業價值,最終會凝結在萬千眾生的微笑裏。
>