大模型應用，必須警惕“速成幻覺”

今天小編分享的科技經驗：大模型應用，必須警惕“速成幻覺”，歡迎閲讀。

我們知道，大模型會編造不正确的答案，產生 " 幻覺 "。

其實，在應用層面，還存在一個更隐蔽的 " 幻覺 "，就是創業公司忽略了大模型落地所需要的長周期、重基建和工程化難度，帶來的 " 速成幻覺 "。

随着 " 百模大戰 " 拉開序幕，大模型過剩帶來的市場擠壓，也給整個大模型生态帶來了行業洗牌的風險。

越來越多的人有了共識，基礎通用大模型競争激烈，注定是少數人的遊戲。創業公司随時可能倒掉，造成項目爛尾。

具備技術、產品和行業優勢的 " 第一梯隊 " 大廠，比如百度的文心大模型 3.5，已經跟國内其他模型拉開了差距，具有了一定的先發優勢和市場打開度，更容易在這場白熱化競争中生存下來。

既然大模型很難 " 速成 "，那麼創業公司的 " 幻覺 "，又是從何而來的呢？

第一種 " 幻覺 "

開源幹翻閉源

創業公司紛紛入局大模型，給它們勇氣的，不是梁靜茹，而是開源。

以 Meta 的 Llama 2、智譜 AI 的 ChatGLM 為代表的開源大模型，陸續免費并支持授權商用，這無疑是一件好事，讓創業公司不用重復造輪子，可以用開源大模型作為基座模型，快速開發出相應的商用版本大模型或大模型應用。

開源的低門檻、低成本，帶來了 " 開源幹翻閉源 " 的幻覺。

為什麼説是幻覺？我們可以從企業視角為出發點——即使有了開源模型，想要落地應用大模型，還有哪些必要條件？

一是雲基礎設施。

大模型落地需要進一步微調、訓練、運行，要在雲平台上運行。而創業公司跟 OpenAI 、百度等閉源頭部公司的一大差距，就在于缺少跟雲平台的 " 緊耦合 "。

眾所周知，OpenAI 有微軟的大力支持，百度文心大模型背後是百度智能雲，這些大廠自研大模型，都對雲基礎設施的計算硬體集群、資源調度等，進行針對性的協調優化，大模型 +AI 雲的緊密配合，可以更高效地利用計算資源，降低大模型的邊際成本。

海外大模型開源社區的 " 明星 " 如 Together 會為企業客户提供開源模型及配套的雲平台，MosaicML 也提供 Mosaic Cloud 和多雲混合服務，國內的開源項目如 ChatGLM，也選擇與多家雲廠商合作。

可以看到，開源項目跟雲平台的 " 松耦合 "，會受到雲平台的配合度、商業政策等的影響，一旦後期出現資源漲價、利益抽成、研發意向變化，都會給基于開源的大模型項目帶來商業化風險。

其次，是二次開發。

基于開源模型的創業公司，往往是在底座模型的基礎上做一些微調，靈活有餘，但開源模型的分支多、變異快、創新迭代速度快，不承諾任何确定性，一般由程式員自組織來完成開發，這就導致基于開源的大模型穩定性不足，對客户技術團隊二次開發能力要求很高，選型難度也很大。

目前看，第一梯隊的大廠推出的基礎大模型，更能滿足企業對大模型穩定性、可靠性的需求。

因為閉源大模型，遵循的不是開源範式，而是工程範式，所以，會以保證開發質量為前提，對用户需求進行明确的描述，組織工程師按照規範的開發流程和周期，以确定的時間和預算，更好的控制開發質量，保證開發效率。

開源是一件好事，但開源并不是一把萬能鑰匙。如果不解決基礎設施、二次開發等瓶頸，創業公司也無法靠開源，快速取得成功。

第二個 " 幻覺 "

三五個人幹翻大廠

因為開源，創業公司和互聯網企業都可以叫賣大模型，這就產生了第二個 " 幻覺 "：三五個人的創業團隊，就能幹翻 AI 大廠。

需要注意的是，" 百模大戰 " 帶來了白熱化的淘汰賽，同時，大模型還在以周為部門進行迭代。

在激蕩的市場競争中，具有長期研發能力和投入意願的大廠，更容易保持動态的生長力和持久的話語權，體現在幾個方面：

一是模型本身的技術城池。

谷歌研發人員此前曾發文稱，因為開源，谷歌和 OpenAI 都沒有護城河。這在長期看是對的，但大廠在大模型技術上的領先性，也是現實存在的優勢，這個技術代差，足以在大模型的商用周期中，為大廠帶來顯著的競争優勢。

而且，大模型具有數據上的 " 飛輪效應 "，更早應用、更多用户的大廠大模型，會不斷拉大效果差距。比如國內最早推向大眾的文心大模型，其 3.5 版本已經在一些基準測試中，超過了 GPT3.5 的表現，而宣稱達到 GPT-3.5 的 Llama 2 剛開源不久，因此目前國產開源大模型最多也就達到 GPT-3 的水平。

二是持續迭代的成長能力。

大模型落地不是一蹴而就的，企業應用大模型也不能上馬後很快不了了之，後續的算力成本、數據工程負擔、每一次迭代的資金壓力，很快就成為困擾很多大模型公司的頭疼問題。

目前，已經有不少曾經想走商業閉源路線的大模型創業公司，直接宣布退出競争。光年之外中途離場，被美團接手；Hugging Face 專注賣算力資源和咨詢業務，做大模型更多是 " 面子工程 "。科大訊飛等企業的财報表現，也會直接影響到市場對其 " 是否有錢繼續做大模型 " 的信心。

從成長性看，有資金實力、基礎設施完整、商業表現良好的大廠，才能陪企業用户走得更遠。

比如 " 文心一言 "3 月 16 日推出以來，在一個月内完成 4 次迭代，将推理成本降為原來的十分之一，離不開百度在大模型上的長期投入，以及人、錢、卡、基建等多種方面的儲備，才讓文心一言可以持續進化，在高速迭代的大模型競争中保持領先。