今天小編分享的互聯網經驗:企業級AI落地三步走,歡迎閱讀。
當生成式 AI 風頭正勁,越來越多的企業開始積極在自身行業布局相關的 AI 應用。但在風頭之下,從準備工作到業務價值落地之間環環相扣,從數據準備到篩選場景,再到落地應用,每一個環節都會成為企業級 AI 應用的卡點。
第一步:數據 " 就緒 "
" 從現階段應用來看,具備企業級 AI 應用落地的企業并不多,"IBM 大中華區董事長、總經理陳旭東告訴钛媒體 APP," 若想有更多成熟的生成式 AI 應用場景落地,企業首先需要大量多維度的高質量數據。"
" 數據是 AI 時代的石油。" 領悅數字信息技術有限公司南京分公司總經理戚海飛對钛媒體 APP 表示。确實,無論是對于政府,還是企業,數據已經成為互聯網時代、AI 時代的 " 石油 "。
2020 年 4 月,國務院發布檔案《關于構建更加完善的要素市場化配置體制機制的意見》此次意見首次把數據和土地、勞動力、資本、技術四大傳統要素并列,成為第五個生產要素。目前行業公認的以次為 " 起點 ",數據成為越來越重要的存在。2023 年 10 月,國家數據局的正式成立,将數據的重要性推到了最高峰。
2022 年底,ChatGPT 橫空出世以後,新一輪 AI 的浪潮席卷各行各業,企業對于數據的重視程度越來越高。中國信息通訊研究院雲計算大于數據研究所所長何寶宏表示,伴随着大數據產業的發展,數據質量越來越高的前提下,人工智能已經逐漸從以代碼為中心,轉向以數據為中心的人工智能," 當下企業需要通過加強數據治理和增強數據質量,來解決模型輸出效果。"
何寶宏還曾指出,據作為第五大生產要素,正在從數據資源演變為數據資產,其經濟屬性日益凸顯,數字經濟邁向以數據可信流通為核心的數據技術 3.0 時代,大模型的出現加快了各行各業的數字化和智能化更新進程,正在推動智能技術產生深刻變革。
固然,對于企業而言,想要落地大模型的第一步就是要具備足夠的高質量數據。對此,圖靈新智算董事長兼 CEO 劉淼告訴钛媒體 APP,企業應用 AI 大模型就像是 " 中央廚房 " 一樣,而數據就是原材料,企業如果連高質量的數據集都不具備的話,就形成了 " 巧婦難為無米之炊 " 的窘境。
而好的企業顯然已經在數據方面做好了 " 就緒 "。戚海飛告訴钛媒體 APP,寶馬從 2018 年就開始數據資產化進程,建立數據和 AI 的團隊," 特别是最近幾年,我們把所有的數據落湖,進行資產化。"
數據資產化之後,對于大型企業來說,實現了跨地網域、跨業務部門之間異構數據的互通互享," 打通了數據的通路,才能激發更多的數據價值。" 戚海飛如是說。
寶馬也正是在打通了數據之後,才在此基礎上進行應用開發," 數據準備好後,無論是做用戶高級分析,還是 AI 模型的訓練,就顯得’得心應手‘了," 戚海飛告訴钛媒體 APP," 而這也是寶馬提出的 Data AI,Data 在前,AI 在後的原因。"
而伴随着生成式 AI 的火爆,合成數據也成為了大模型時代企業訓練大模型的 " 必備品 ",Gartner 數據顯示,預計 2024 年,60% 用于 AI 開發和分析的數據将會是合成數據;2026 年,GPT 等大型語言模型就将耗盡互聯網上可用的文本數據;2030 年,合成數據将徹底取代真實數據。
盡管合成數據發展的速度超乎想象,不過目前業内對合成數據的看法并不一致。
一種觀點認為,合成數據無異于 " 近親繁殖 ",會造成模型崩潰的情況,這種觀點主要的核心理論是:如果在訓練中不加區别地使用 AI 產生的内容,模型就會出現不可逆轉的缺陷——原始内容分布的尾部(低概率事件)會消失。其主要觀點來自于牛津、劍橋等機構在 Nature 封面發布的一篇論文。
另一種觀點認為,當現實中高質量數據不足的時候,合成數據能夠精準的提供高質量的數據。根據 IBM 的觀點,合成數據是現在比較有效的方法,特别是訓練一些大模型的時候,主要原因是因為合成數據的質量比較高,覆蓋性比較好,可以滿足利用一些比較精簡的數據集訓練出好用的模型產品。
數據的重要性在當下已經不言而喻,而數據就緒也成為了企業在利用大模型產品賦能業務發展的過程中的第一步,既是基礎,也是前提。
第二步:選準應用場景
擁有了足夠量的高質量數據,企業才具備大模型的 " 入場券 ",而進場之後,如何才能讓大模型產品幫助到自身業務發展?找準場景就成為企業第二步要做的事。
目前企業場景中,比較容易率先應用大模型的場景是:對一些原有的類似智能客服的產品的迭代。一方面,這些簡單的大語言模型的應用目前已經可以做到無需 GPU 卡就能實現,從部署成本上,給企業降低了部署的成本,當然也降低了試錯的成本;另一方面,原先的知識問答類的產品,相較于人工智能,更像是 " 人工智障 ",并不能很好地理解人們的訴求,但當植入了大語言模型的能力之後,能讓智能問答類的產品有質的飛躍。
對于智能問答類的產品的延伸——知識圖譜,也是企業現階段可以率先應用大模型賦能的一環。
除此之外,在陳旭東看來,從應用的深度上看,企業的 IT 運維管理方面,也是企業率先應用大模型時好的選擇。" 大模型的能力對復雜的 IT 運維環境提供了更好的監控,優化資源配備的能力,可以監控到指令級的問題,并對問題進行自動化的幹預。" 陳旭東指出。
除了知識類和 IT 運維類的應用以外,立足各行業中,企業也在積極的探索大模型的應用。從目前的應用場景上看,醫療、金融這兩部分是比較常見的,也是落地比較快的兩個場景。
金融行業方面,現階段,大模型在金融行業的應用主要還是集中在風險評估和管理,以及知識圖譜平台搭建方面。在風險評估方面,大模型可以通過分析大量的歷史數據和實時信息,預測市場風險、評估信用風險等,為金融機構提供更加準确和及時的風險管理決策支持。
另一方面,就如同陳旭東所言,金融機構還在嘗試将大模型與知識圖譜平台結合,用大模型代替 NLP 技術,在進一步提升效率的同時,提升風控水平。
醫療行業方面的應用目前主要集中在識别和同樣是類似問答的分診領網域。一方面,通過行業大模型對大量醫療數據的學習和分析,可以自動識别病變特征,輔助醫生進行疾病診斷,提高診斷準确率與診斷效率;另一方面,通過類似 "AI 助手 " 的模式,利用大模型為患者提供分診助手也是在醫療側目前布局廠商較多的一類產品。
第三步:規模化應用
除了金融和醫療領網域,其實還有很多領網域湧現了不少大模型可以應用的場景,雖然這些場景有一些不錯的落地效果,但企業也不應該對大模型 " 趨之若鹜 "。對此,IBM 咨詢大中華區總裁陳科典對钛媒體 APP 表示,如果一個企業級 AI 應用沒法形成規模化應用的話,那麼這個應用,這個場景對于企業而言意義不大," 無論是傳統 AI,還是生成式 AI 技術,如果好幾月才能做一個場景,且無法規模化應用的話,那就不能說是企業級 AI。" 陳科典強調。
無獨有偶,戚海飛也有着與陳科典相似的看法,他指出,當寶馬具備了數據 " 就緒 " 的能力後,開始嘗試在各個場景中應用," 後來發現,一些個别的小的場景沒有太大價值," 戚海飛表示,"AI 的應用還是需要從方方面面出發,具備規模化的能力。"
而據戚海飛介紹,寶馬用了 2 年時間,落地了 100 多個 AI 應用的場景," 之所以能形成這麼大規模的應用與復制的能力,數據是一方面,更重要的是平台化的能力。" 戚海飛強調," 平台化是 AI 規模化應用的一個重要前提。"
如果能将 AI 的能力通過平台化進行復制,重復使用 AI 的能力,對于企業而言,使用 AI 的成本與技術門檻将會下降很多。
陳旭東也曾對钛媒體 APP 表示,IBM 認為平台化是企業級 AI 落地過程中重要的方式,IBM 相信,雲計算将會是未來很長一段時間内企業數字化的主要手段,而 AI 發展的趨勢也是不可逆的,"AI 已經成為企業核心競争力,所以企業需要打造自己的企業級 AI 平台。" 陳旭東如是說," 雖然這種方式短期上來,企業的投入相較于其他兩種更大,但長期來看,企業投入的回報率非常可觀。"
而在戚海飛看來,平台化僅是企業級 AI 規模化應用的開始和前提,在實現了平台化的能力後,通過公司内部的系統對 AI 應用集成決定了企業級 AI 規模化的好壞,在他看來," 以我們所處的汽車行業為例,很多内部的應用系統都是有關聯性的,通過這些系統,将 AI 的能力進行集成後,就能產生聯動效應,才能實現真正的規模化應用。"(本文首發于钛媒體 APP,作者|張申宇,編輯丨蓋虹達)