今天小編分享的互聯網經驗:百度智能雲黃鋒:從企業視角如何運用大模型應用開發平台,歡迎閱讀。
在大語言模型蓬勃發展的今天,AI 應用落地已成為產業界關注的重點。在矽星人首屆 AI 創造者大會(ACC 2024)" 重構基礎設施:更開放的架構與更聰明的 Token" 環節中,矽星人分析師周一笑與百度智能雲應用平台部總經理黃鋒就大模型應用開發平台、企業落地實踐等話題展開深入對話。作為百度智能雲千帆 AppBuilder 的負責人,黃鋒分享了平台建設經驗與企業應用觀察。
以下為對話實錄整理:
周一笑:我剛才在下面查兩個數據,在百度指數和 Google Trends 上,我查了兩組關鍵字,第一組是 AI 或者大模型相關的關鍵詞,第二組是 AI 應用或者是大模型應用相關的關鍵詞,過去十二月的走勢,會發現第一組基本是持平的情況,第二組從今年開始會看到有一個明顯在往上走的趨勢,這其實也說明大家越來越關注 AI 應用落地相關的話題了。百度一直在号召大家卷應用,不要卷模型,我們今天也邀請到百度智能雲應用平台部總經理黃鋒總來跟大家一起聊一聊,關于落地應用的話題。
第一個問題,千帆 AppBuilder 企業級大模型應用開發平台的核心功能是什麼?和其他 AI 應用開發平台的差異點在哪裡?
黃鋒:百度智能雲整個大模型 To B、To G 是通過千帆平台對外輸出的,千帆平台裡有兩個工具,千帆 ModelBuilder 和千帆 AppBuilder。千帆 ModelBuilder 是做大模型開發的,千帆 AppBuilder 是做大模型應用開發的,我自己在百度主要負責 AppBuilder 這個產品。今年做大模型應用開發、Agent 開發的平台雨後春筍特别多。對于百度而言,從六七月份之後,我們對外講都是講企業級的定位。企業級和大家拿工具去學習去玩一玩是有天壤之别的。百度智能雲過去十年,服務了許多互聯網客戶,還有傳統政企的客戶,我們更了解企業客戶對于平台的要求,比方說效果、效率、性能、穩定可靠、開放性、動态擴縮容、可調可配等等問題。我覺得如果沒有這些點,平台開發出來的 Agent 是很難真正落地使用的。所以我們產品定位是企業級大模型應用開發平台。
周一笑:百度從最早搜索到後來 AI,經歷了 AI 的幾波浪潮,這種穿越周期的經驗,對于你們做平台型的產品有幫助是什麼?能不能用一些具體的產品決策和細節來講一講?
黃鋒:百度做這樣的平台跟别的公司還是不一樣。我覺得在百度而言,最大的優勢在于整個公司都是在 AI 戰略上是非常堅決的。我們有文心系列各種尺寸的模型,有做大模型開發的千帆 ModelBuilder 這樣的平台。包括算力納管上面我們有百舸平台。有很多客戶需要的是完整的方案,在工具鏈層面上是可以借力的。
第二點是在百度内部,去年廠長就要求我們所有的產品都要重構,包括網盤、文庫、搜索、文小言等等很多產品,其實在基于大模型做重構,它們天然也需要工具上的支持。我們除了對外輸出之外,支持内部的業務,也在很大程度上幫我們更快的打磨了產品的工具鏈的效果、性能、吞吐等等能力。這樣的能力再對外輸出,減少了中間打磨的時間。内部業務線的要求是非常高的,對于大模型的理解,以及大模型到底在應用層面如何落地,他們的認知是跑得比較快的。
周一笑:内部用好了,再拿出去服務客戶。
黃鋒:是這個邏輯。
周一笑:剛才聊了一些思路上的問題,回到應用開發這件事情上。傳統的 AI 應用開發和現在的大模型應用開發,兩者的區别是什麼?這對于做平台的挑戰是什麼?
黃鋒:我 14 年加入百度,從 16 年開始做 AI 商業化,但是那個時候是小模型時代 AI 的商業化,其實一直到大模型爆發之前,我自己的感受是不管 CV 語言,還是傳統的小模型,它是有價值的。它也能解決客戶的很多業務問題,但它最大的問題在于泛化能力不夠。所以你的定制成本就會很高,比方說前幾年,我做過工業能源行業一些 CV 應用的場景。
例如面向安全生產,訓一個安全帽識别的模型,想達到非常高的準确率是很難的,其中有環境、角度等等因素。因此要想落地,投入到交付上定開調優的成本非常高,總體來說要麼只能服務有錢的大客戶,規模起不來。要麼你鋪開了,成本降不下去,利潤就起不來。
這個時代其實都是這樣的,其他的這些友商你去看它的利潤率,在小模型時代都是不太好過。我覺得大模型來了之後,最大的改變就是它的通用性,泛化能力比小模型時代強太多了。
但是在大模型時代,如何讓做應用開發門檻能夠降得更低,效果能夠做得更好,能夠讓真正的價值交付最後的交付環節成本降得更低,還是在嘗試的過程中。今天而言,還沒有明确的答案。但這已經是一個清晰可見的發展趨勢。
周一笑:從現有接觸到的企業客戶當中有什麼觀察可以和大家分享的?
黃鋒:前些年我們有一些大的項目的交付,應用的定開由夥伴來交付。但是有很多客戶的項目,夥伴搞不定,還需要原廠的人去調優。但過去一年多商業化過程中,夥伴能搞定的項目比例大幅度增加,只要我們把調優的經驗方法論去輸出給夥伴,他們基本都能搞定。這一迹象已與過去小模型時代有所不同。
周一笑:問一個相關的問題,也是大家都關注的一個點。你們接觸的客戶在大模型預算占 IT 總預算的比例上有什麼變化嗎?能反映這個趨勢嗎?
黃鋒:還是非常明顯的。從去年 3 月 16 日百度發布文心一言之後,我天天就跟各界客戶、合作夥伴、政府領導、媒體在交流。去年我的感觸,大家都只是聊,并沒有真正立項花錢去做,但是從去年 Q4 開始,這個勢頭明顯發生了變化。一直到今年出現明顯的爆發。市面上也有一些分析,今年上半年整個市場上面立項金額和數量遠超去年的,今年還有兩個月,我自己感受到真正企業願意花錢立項去做,這是非常明顯的。
周一笑:其實預算反映了企業的重視程度,最後想問企業實際落地相關的問題,從你們觀察來看,這一波企業實際應用當中,大模型更多是替代上一波 AI 的場景,比如說客服,還是新的場景多一點?
黃鋒:我覺得兩者都有,像客服、内搜,小模型時代也都有,只是大模型來了之後,它的意圖理解能力,歸納總結的能力會更強,我覺得這是一波技術更新帶來的舊市場的替換。更多爆發出來的是新場景,原來壓根兒做不了,現在能做了。比方說我們看到的試題解析、法律咨詢助手,像現在 AI 手機特别火等等,因為我們做平台,所以看到各行各業新的場景還是很多的。我們也經常會遇到一些,壓根兒想不到的客戶會拿大模型來幹這個事兒。
周一笑:有沒有比較有意思的案例可以跟大家分享一下。
黃鋒:有一個群體叫 ASD,他可能很難理解常人對話,但是大腦的想象力很豐富,這樣的孩子對于圖片的理解,包括他自己畫畫的能力很強,但是表達的能力比較弱。所以有一個開發者用我們的平台搭了一個工作流,比如說小孩畫了一張圖,大人很難理解他想表達什麼,可以拍照讓大模型理解背後的意思。大人再說一句話,通過大模型文生圖,再把圖片給孩子看。這樣就把圖作為一種信息互動的媒介去跟小孩溝通。
這樣的場景我自己肯定想不到,但是我們的開發者有一個公益組織,專門去幫助這樣的孩子,他們就有這樣的創意。他們也不是學計算機相關專業的,借助我們的平台很容易把這個產品搭出來,并且确實是有用的。我們用這樣的平台能夠把開發門檻降低,讓更多人發揮他們的創意,創造不同的 Agent 出來,我覺得這個事兒蠻有意義。
周一笑:确實挺有意思的,它相當于跟孩子用影像來交流。最後也是和落地相關的問題,現在企業落地有兩個路徑,第一種是在垂直行業,可能自己有數據做一些垂直的模型。第二種是基于基礎大模型來做二次開發。從你們視角來看,如果企業要選擇的話,會給一些什麼建議呢?
黃鋒:首先一條路是直接用通用的基模去做,第二是在通用的基模上加上自己的數據做一個模型,這兩條路不衝突。做一個行業大模型這件事情,不是每個場景都是必須的,并且門檻還是相當高的。首先你得有相應的語料,并且你得有人真的懂,真的能訓一個模式出來,這裡的調優經驗,對人的能力要求還是很高的。我們也在幫助大型國内頭部的國央企在做類似的事。
有些行業的知識是很垂的,比如法律、醫療等等,它是有必要做自己的行業模型。但是有一些行業專有的知識沒有那麼多,沒有必要非要去做行業大模型,直接從基模就可以取得比較好的效果。能訓行業大模型,在今天而言還是門檻相對比較高的事兒。
周一笑:所以更多的是需要依靠咱們這樣的平台去做模型應用,可以這麼理解嗎?
黃鋒:對,我們總結過一些應用落地的範式。最簡單的是自己寫 Prompt,調 Prompt 會更好的發揮模型的能力。如果這樣效果不理想,可以在某些場景下嘗試 RAG 或 Agent,再不行的話,可以做一些 SFT 作為進階方法。這些選擇與具體場景高度相關,關鍵是明确應用目标,選擇最高效的方式來解決問題,而不必一味追求所有高精尖的技術。
技術本身還是服務于最終創造出來的應用價值。包括模型的選擇也不是都用最好的模型,夠用就行,解決問題就好,畢竟成本和效率都是要考慮的問題。
周一笑:這其實也是百度智能雲包括做 ModelBuilder、AppBuilder,不同場景服務針對不同的企業。非常感謝黃鋒總針對企業落地的分享。
黃鋒:歡迎大家多多試用我們的千帆 AppBuilder 的平台,謝謝大家!