今天小編分享的科技經驗:大模型生成的下一個範式:從“能説會道”到貫通行業,歡迎閲讀。
智東西(公眾号:zhidxcom)
作者 | 程茜
編輯 | 漠影
行業需要怎樣的大模型能力?
目前,大語言模型的生成、理解能力目前大多以文字為載體,通過此前的文字去預測下一個文字,從而形成完整的文字回答。但當其深入行業,單靠文字這一形式很難解決實際問題。
如用户的體檢報告、器材設備的檢測數據等,通常并不會直接以文字出現,而這些有價值的數據正在被大模型能力重塑。
今天,第四範式發布的行業大模型平台先知 AIOS 5.0,作為一大載體将這些面向不同場景的行業大模型能力集成了起來。
大語言模型的原理在于Predict the Next "X","X" 這一未知數的指代形式正不斷擴展延伸,在 AIOS 5.0 之上,它可以是用户的一份個人體檢報告,也可以是水文數據、設備檢修數據等多元化形态。
那麼,"X" 的這些不同形态數據落地到行業中後表現如何?我們通過深入剖析幾大行業大模型的典型案例,找到這些問題的答案。
一、行業大模型承載多元化場景需求
話不多説,先來看看與我們日常生活密切相關的場景。
正如開篇提到的健康領網域,在慢病管理大模型中,當 "X" 化身為用户的個人體檢報告,就可以基于過去 5 年的體檢報告數據,依次生成未來 3 年的體檢報告,并且給出一些可能引發慢性病的核心指标的變化趨勢,供醫生參考給出相應的健康管理建議。
其次,在一些數據量龐大的工作場景中,由于對數據量的利用率不夠,往往需要人工監測、計算,會導致浪費大量的時間精力。當設備檢測數據、水文數據變成 "X",AI 的加持就能讓這些數據的價值更高效釋放出來。
在水電領網域,水電設備大模型可以基于過去 7 天機組子部件的運行狀态,生成未來 3 天小時級的定轉子部件報告,供運維人員給出維修方案;在水務領網域,水務大模型可以依據歷史數據和未來 7 天氣象數據, 生成未來 7 天小時級的報告,供水文監測人員識别發生洪水及相關次生災害險情、采取應急預案。
除此以外,行業大模型還有很多提升用户各項體驗的多元化能力,如 AIOS 5.0 平台中的聲效大模型,可以基于音樂廳的幾何模型和房間數據,幫助專業人員評估音源擺放位置,從而讓觀眾的聽覺體驗更好。
可以看出,大模型的能力正在從語言等單一形态為中心不斷向外擴散,讓 "X" 化身不同行業的數據類型,在不同的垂直場景釋放出更大的業務價值,真正成為解決場景核心痛點、問題的載體。
二、先知 AIOS 5.0 成 " 最佳練兵場 "
大模型深入行業已經成為產業發展的一大趨勢。
從大模型的發展來看,現在已經不僅僅唯參數規模而論。一方面,大模型參數規模繼續擴大,并不斷激發其更智能化、聰明能力之路上極速狂奔;另一方面,更多參數規模相對較小,更能解決行業痛點問題的模型出現。
這背後的原因在于,基礎模型的算力規模非一般公司可以承載,上周,微軟工程師 Kyle Corbitt 就在社交平台 X 上爆料,微軟已經在悄悄為 OpenAI 開始訓練 GPT-6,預計要部署 10 萬個 H100 GPU,而一個 H100 售價 2.5 萬 ~3 萬美元。如此龐大的算力規模,使得企業付出的金錢成本更高。
當前對于行業大模型的普遍認知就是用大語言模型去 fine-tune 行業數據,解決行業特定問題。大語言模型作為語言 " 通才 ",能夠學習理解文本知識,但放到垂直場景解決,解決數學題或者是經驗題,這些都遠遠超出了 " 語言 " 的範疇。
在這樣的背景下,第四範式打造的先知 AIOS 5.0,就是承載大模型在行業應用的關鍵底座。讓 "X 模态 " 的數據,能像文字一樣快速被處理,并解決高價值的問題。
結語:大模型部署落地新周期,深耕多元場景
前沿技術的進步能對人們生活產生價值才是關鍵,大模型的能力與人們日常生活的結合日漸緊密。但龐大的算力需求等挑戰使得基礎模型的能力無法真正釋放給每一個人,行業大模型的優勢顯現出來。
第四範式打造的行業大模型平台在讓大模型與行業的場景需求結合的更加緊密的同時,進一步降低了業務人員應用大模型的開發門檻,開啓了大模型落地部署的產業新周期。