今天小編分享的教育經驗:大模型企業化應用需要解決的問題,歡迎閲讀。
以下文章來源于 AI 探索時代 ,作者 DFires
作者 | DFires
來源 | Al 探索時代,管理智慧
咨詢合作 | 13699120588
文章僅代表作者本人觀點,圖片來源于 pixabay
" 企業級大模型應用要比想象中的復雜的多,技術是為業務服務"
在企業級應用場景中,大模型的落地是一個系統性問題或者説是工程,同時涉及到業務,資源 ( 包括人力,資金,技術等 ) ,現有的技術架構等多個領網域,而非是單一的大模型本身的問題。
而太多的人太過關注于技術和模型本身,而這樣的結果就是一葉障目,不見泰山。
思考一下,如果讓你負責大模型技術的引入,并做一份詳細的方案,你應該怎麼做?
下面就來讨論一下大模型在企業級應用場景中的問題。
企業引入大模型所面臨的問題
企業引入大模型的前提是其能夠對業務進行賦能,能夠提升當前業務的效能,或者開辟新的業務線。
如果抛開這個前提,那麼引入大模型是否是一個好的選擇就是一個需要思考的問題。
為什麼説企業引入大模型是一個系統性的問題,因為它涉及到多個方面,需要有一套完整的企業級解決方案,而不是一時的心血來潮。
企業引入大模型需要考慮哪些問題?
企業引入大模型主要需要從兩個方面考慮,一是業務側;二是技術側。但同時還要結合公司技術實力,資金,人力,運營成本等多個方面進行考慮。
業務側
任何技術都是為業務服務的,因此如果一項技術對業務沒有幫助,那麼技術的存在就沒有任何意義。
所以,企業引入大模型之前,首先要考慮大模型是否能解決業務問題;其次就是,怎麼把技術和業務相結合。
技術側
技術側需要考慮的問題就比較多了;主要包括以下幾個方面,模型的選擇與評估,訓練數據的準備,模型訓練和微調,知識庫的搭建,模型優化與部署,模型的使用等。
模型引入方案
首先關于模型的評估與選擇,怎麼選擇一個模型,選擇哪個模型?模型的評估标準是什麼?
模型的選擇不只是一個純粹的技術問題,它是業務和技術的結合;選擇模型首先考慮的是滿足業務需求,其次需要考慮的是選擇商業模型還是開源模型。
在企業應用中,商業模型的優勢是技術門檻低,但在一些垂直領網域的應用中,表現可能不盡人意。
開源模型的優勢是,可以完全定制化,可以根據業務需要使用自身的業務數據進行訓練和微調;缺點是技術難度較高,維護成本高。
因此,在一些比較垂直的領網域内,使用開源模型比較好;而在一些比較普通和邊緣化的業務,使用第三方商業模型比較好。
當然,某些第三方的商業模型也提供了訓練和微調的接口,用户可以根據自己的需求在其模型之上進行重新訓練或微調。
但如果對數據安全有要求,那麼還是使用開源模型本地部署比較好。
其次關于模型的評估,自從人工智能產生以來,模型評估就是一個有争議的話題;因為随着技術的發展,人工智能也有了很大的變化,從機器學習到深度學習,以及現在的生成式人工智能。
不同的技術階段對應着不同的任務類型,比如在機器學習和深度學習階段,人工智能技術的主要領網域是分類任務和預測任務 ( 回歸模型 ) ;這種基于監督學習的機器模型有一個明确的标準。
比如,一個分類的機器學習模型,是否能識别貓和狗,這是一個很明确的結果。
但在生成式 AI 時代,模型生成的文字,圖片是一個沒有标準的結果;你可以説它好,我也可以説它不好。
因此,根據這些就提出了幾個評估标準:
在分類模型中,主要有準确率,召回率等;在文本生成領網域,主要有 BLEU 和 METEOR 指标;影像生成領網域又有 Perceptual Loss,Frechet Inception Distance 等方法。
市場上的評估工具:SuperCLUE,Ragas,MMLU,Open LLM Leaderboard,C-Eval 等
在垂直領網域内,模型的訓練數據是必不可少的;而模型的訓練和微調又需要大量的 GPU 和能源需求;目前一款合格的企業級模型,訓練一次的成本少説也要大幾十萬。
最重要的是,模型的訓練一次很難獲得好的結果,可能需要多次的訓練,甚至到最終都無法訓練出一款合格的大模型。
而模型的優化和部署問題,不能像個人使用那樣,随便找一台伺服器即可;而是要通過使用并行計算框架,使用分布式部署的方式,使得大模型能夠支撐高并發和高可用。
根據不同的并行方式,又會有不同的實現方式和框架。
比如,Data Parallel, ZeRO,DeepSpeed 等
最後,由于大模型天生的知識滞後性;因此,本地知識庫的搭建是必不可少的一個過程。而怎麼用本地知識庫解決大模型的幻覺問題,也是一個值得思考的問題。
由此可見,一套企業級的大模型應用方案,需要考慮很多問題;不只是技術上的,還有非技術上的。
怎麼選擇,訓練和微調一個大模型不難,難的是怎麼訓練出一個合格的,可以應用于企業服務的大模型才難。