今天小編分享的科學經驗:大模型應用,必須警惕“速成幻覺”,歡迎閲讀。
我們知道,大模型會編造不正确的答案,產生 " 幻覺 "。
其實,在應用層面,還存在一個更隐蔽的 " 幻覺 ",就是創業公司忽略了大模型落地所需要的長周期、重基建和工程化難度,帶來的 " 速成幻覺 "。
随着 " 百模大戰 " 拉開序幕,大模型過剩帶來的市場擠壓,也給整個大模型生态帶來了行業洗牌的風險。
越來越多的人有了共識,基礎通用大模型競争激烈,注定是少數人的遊戲。創業公司随時可能倒掉,造成項目爛尾。
具備技術、產品和行業優勢的 " 第一梯隊 " 大廠,比如百度的文心大模型 3.5,已經跟國内其他模型拉開了差距,具有了一定的先發優勢和市場打開度,更容易在這場白熱化競争中生存下來。
既然大模型很難 " 速成 ",那麼創業公司的 " 幻覺 ",又是從何而來的呢?
第一種 " 幻覺 "
開源幹翻閉源
創業公司紛紛入局大模型,給它們勇氣的,不是梁靜茹,而是開源。
以 Meta 的 Llama 2、智譜 AI 的 ChatGLM 為代表的開源大模型,陸續免費并支持授權商用,這無疑是一件好事,讓創業公司不用重復造輪子,可以用開源大模型作為基座模型,快速開發出相應的商用版本大模型或大模型應用。
開源的低門檻、低成本,帶來了 " 開源幹翻閉源 " 的幻覺。
為什麼説是幻覺?我們可以從企業視角為出發點——即使有了開源模型,想要落地應用大模型,還有哪些必要條件?
一是雲基礎設施。
大模型落地需要進一步微調、訓練、運行,要在雲平台上運行。而創業公司跟 OpenAI 、百度等閉源頭部公司的一大差距,就在于缺少跟雲平台的 " 緊耦合 "。
眾所周知,OpenAI 有微軟的大力支持,百度文心大模型背後是百度智能雲,這些大廠自研大模型,都對雲基礎設施的計算硬體集群、資源調度等,進行針對性的協調優化,大模型 +AI 雲的緊密配合,可以更高效地利用計算資源,降低大模型的邊際成本。
海外大模型開源社區的 " 明星 " 如 Together 會為企業客户提供開源模型及配套的雲平台,MosaicML 也提供 Mosaic Cloud 和多雲混合服務,國內的開源項目如 ChatGLM,也選擇與多家雲廠商合作。
可以看到,開源項目跟雲平台的 " 松耦合 ",會受到雲平台的配合度、商業政策等的影響,一旦後期出現資源漲價、利益抽成、研發意向變化,都會給基于開源的大模型項目帶來商業化風險。
其次,是二次開發。
基于開源模型的創業公司,往往是在底座模型的基礎上做一些微調,靈活有餘,但開源模型的分支多、變異快、創新迭代速度快,不承諾任何确定性,一般由程式員自組織來完成開發,這就導致基于開源的大模型穩定性不足,對客户技術團隊二次開發能力要求很高,選型難度也很大。
目前看,第一梯隊的大廠推出的基礎大模型,更能滿足企業對大模型穩定性、可靠性的需求。
因為閉源大模型,遵循的不是開源範式,而是工程範式,所以,會以保證開發質量為前提,對用户需求進行明确的描述,組織工程師按照規範的開發流程和周期,以确定的時間和預算,更好的控制開發質量,保證開發效率。
開源是一件好事,但開源并不是一把萬能鑰匙。如果不解決基礎設施、二次開發等瓶頸,創業公司也無法靠開源,快速取得成功。
第二個 " 幻覺 "
三五個人幹翻大廠
因為開源,創業公司和互聯網企業都可以叫賣大模型,這就產生了第二個 " 幻覺 ":三五個人的創業團隊,就能幹翻 AI 大廠。
需要注意的是," 百模大戰 " 帶來了白熱化的淘汰賽,同時,大模型還在以周為部門進行迭代。
在激蕩的市場競争中,具有長期研發能力和投入意願的大廠,更容易保持動态的生長力和持久的話語權,體現在幾個方面:
一是模型本身的技術城池。
谷歌研發人員此前曾發文稱,因為開源,谷歌和 OpenAI 都沒有護城河。這在長期看是對的,但大廠在大模型技術上的領先性,也是現實存在的優勢,這個技術代差,足以在大模型的商用周期中,為大廠帶來顯著的競争優勢。
而且,大模型具有數據上的 " 飛輪效應 ",更早應用、更多用户的大廠大模型,會不斷拉大效果差距。比如國內最早推向大眾的文心大模型,其 3.5 版本已經在一些基準測試中,超過了 GPT3.5 的表現,而宣稱達到 GPT-3.5 的 Llama 2 剛開源不久,因此目前國產開源大模型最多也就達到 GPT-3 的水平。
二是持續迭代的成長能力。
大模型落地不是一蹴而就的,企業應用大模型也不能上馬後很快不了了之,後續的算力成本、數據工程負擔、每一次迭代的資金壓力,很快就成為困擾很多大模型公司的頭疼問題。
目前,已經有不少曾經想走商業閉源路線的大模型創業公司,直接宣布退出競争。光年之外中途離場,被美團接手;Hugging Face 專注賣算力資源和咨詢業務,做大模型更多是 " 面子工程 "。科大訊飛等企業的财報表現,也會直接影響到市場對其 " 是否有錢繼續做大模型 " 的信心。
從成長性看,有資金實力、基礎設施完整、商業表現良好的大廠,才能陪企業用户走得更遠。
比如 " 文心一言 "3 月 16 日推出以來,在一個月内完成 4 次迭代,将推理成本降為原來的十分之一,離不開百度在大模型上的長期投入,以及人、錢、卡、基建等多種方面的儲備,才讓文心一言可以持續進化,在高速迭代的大模型競争中保持領先。
三是完善的工具鏈。
沒有人會否認,大模型是拿來用的,不是為了當擺設或 " 公關效應 " 的。
要用,就要考慮到技術和場景的适配。不同行業和企業對于大模型落地的需求,可能是完全不同的,這種差異化,需要更完善、全面的配套工具,來降低應用門檻。舉個例子,行業 + 大模型需要進行專有數據的清洗、标注、向量化等工作,這個過程是非常復雜的。
三五人的創業團隊,很難将主要研發力量,放在開發這些看上去技術含量不高、但對用户十分重要的工具上。
這時候,百度等大廠長期押注 AI 的優勢就凸顯出來了,已經沉澱了從數據集、模型訓練、開發部署等整套流程的工具,并且開箱即用,把大模型到產業落地的門檻不斷降低,從而開啓增長飛輪。
四是長期積累的行業 Knowhow。
大模型產業化,走向 ToB 和 ToG 是大勢所趨,要求對行業 Knowhow 有深層次的理解。因此,政企客户在大模型選型時,非常看重廠商的成功案例和行業服務經驗。
AI 大廠在產業已經深耕多年,因此大模型的商業開發度更高。目前,百度 " 文心大模型 + 飛槳深度學習框架 " 的組合已與 300 多家客户合作,在 400 多個企業場景中取得良好測試效果,并打造了 10 多個行業大模型。
與之相比,還沒有走通產業場景的創業公司,在技術體驗、功能創新、工程能力等細節上,可能還需要花費更多時間去摸索。
從這些角度看,頭部大模型已經建立起了較為明顯的優勢,并且還在持續進化。三五人的創業公司,想要在高速迭代的大模型競争中幹翻大廠,需要補的課有點多。
第三個 " 幻覺 "
大模型能 " 賺快錢 "
創業公司通過 " 資金換規模 " 的短平快戰略,上市融資再套現離場,來兑現投資回報,已經越來越難了,在大模型領網域并不現實。那麼,另一條路就是通過 ToB 客户付費,來完成大模型的商業化。
眾所周知,ToB 行業要幹苦活累活。
企業客户在業務場景中接入大模型,可能帶來一系列復雜的整合動作,是一個體系化工程,這就要求大模型廠商不能單一快節奏地交付,而要提供解決方案式的整體能力,以及長時間的更新運維服務。
一個項目的交付、運維、迭代、回款等,可能以年計,是無法快進快出的。所以,大模型下沉到行業,必須打消 " 賺快錢 " 的念頭,以長期主義的心态來做生意。
構建服務團隊、形成衣務基因,對創業公司及其背後的投資機構的耐心和定力來説,是不小的考驗。
與之相比,大廠在長期走向 ToB/ToG 市場的過程中,已經經歷了客户的捶打,鍛煉出了更加成熟的服務鐵軍,也證明了自身的定力。
以百度為例,對于不同行業,有深入了解客户的交付、運維和保障專屬團隊,在大模型落地應用時,能夠給予更具針對性的方案,從而減少無效支出,讓大模型更好地幫助企業提質增效。
大模型廠商不能一心只想 " 賺快錢 ",要沉下心來走向產業深處。同樣的,企業引入大模型也不能一心只 " 圖便宜 ",要從智能化轉型更新的這個生命周期出發算總賬,綜合考慮改造、交付、運維等多項成本。
大模型強大的理解能力和泛化能力,會加速產業智能化的進程,也讓 AI 企業和創業公司發現了新的機會。
就像啤酒總是伴随着泡沫,在一擁而上的大模型創投熱潮中,創業公司和企業客户也很容易陷入 " 速成幻覺 "。
大模型走向產業的長路,更需保持冷靜和理性,警惕 " 爛尾 " 風險。希望大家真正飲下的,是用時間和技術沉澱的精釀,而非随時可能消失的 " 泡沫 "。