今天小編分享的互聯網經驗:半年大模型,還在天上飛,歡迎閱讀。
圖片來源 @視覺中國
文 | 光子星球,作者 | 吳坤諺,編輯 | 吳先之
大模型的火,已經在這片土地上燒了半年。随着華為、京東、攜程三家發布會趕上晚集,按互聯網一貫的範式,國產大模型這個 " 新東西 " 也迎來了自己的半年考。
只是跟其他業務的半年考有所不同,像新能源車、手機、電商平台等業務形态的半年考,都有足夠的公開數據信息為支撐,便于考據分析,而大模型到現在都還處一個 " 黑盒子 " 的狀态,沒能跑出一個清晰的商業模式,所謂數據信息等論據也就無從談起。
頗為戲谑的是,即使是從產品功能角度出發,大模型也未曾誕生通用的評測手段。面向 AGI 這一終極目标,評測方法自然五花八門,例如國内 C 端用戶賴以 " 測評 " 大模型的典中典—— " 松鼠鳜魚法 "。
或因如此,國内大廠大多未能像 OpenAI 一般将自家大模型開放使用,而是實行内測機制。
而大模型更多的落地探索向 B 端與 G 端傾斜,例如騰訊先聲奪人的行業大模型以及華為的盤古 3.0、京東靈犀等。作為目前頭部玩家聚焦的賽道,其大模型偏重盡可能展現成熟的產品形态,以商業化落地為基本目标。例如這一類大模型為了快速向下普及推動商業化,除卻業務落地導向外, 本地化部署能力也成為重要的參考指标。
即使如此,在業内人士看來已經是 " 把碗送到面前 " 的行業大模型仍缺少買賬的企業,行業模型的風自 6 月起已經吹了一個月,至今未曾出現較大規模的商業合作。
因此我們也不難看到,在如今的投資市場中,與大模型相關的投資集中于二級市場而非一級市場。即使是王慧文這個級别的大牛入場,公開消息稱其 A 輪融資遠高于 2.3 億美元,其融資能力相較時不時接收微軟百億美元投喂的 OpenAI 不可同日而語。
投資市場是合格的晴雨表。顯然,國内大模型在半年考的時間節點所提交的答卷不盡如人意,還需要一段時間的蟄伏與打磨,才能讓 " 故事 " 成真。
大模型沒有商業模式?
在國内的大模型需要回應市場的質疑中,商業模式應該擺在首位。
ChatGPT 這位早已占據用戶心智的頭把交椅出現熱度的明顯下降,國内最早發布通用大模型百度與阿裡兩家也在一眾玩家跟進後陷入 " 沉寂 "。究其原因,在于通用大模型的商業模式未能跑通。即使在輿論場上獲得了用戶的認可,但商業閉環始終未能出現。
以測試範圍較廣泛的百度大模型為例,其商業化應用文心千帆的付費模式是以調用生成的 token 數量收費,标準為 0.012 元 / 千 tokens,輸出千字文稿需花費 0.12 元。
撇開其回收成本的速度不談,0.012 元 / 千 tokens 的收費看看似便宜,但文本生成往往需要多次互動後才能獲取理想結果,多次互動 prompt 将會無限量增加隐性成本,畢竟文心千帆可不是揮之即來的員工們。
與之相似的場景是問答社區,學界人士孫權(化名)告訴光子星球,模型應用的使用體驗與問答社區中搜尋高質量答案相似,其用戶思維是問題粒度,而付費意願往往只會在找到高質量回答之後才會產生。因此百度選擇了推理文本數為付費标準,只是目前還無法 cover 商用隐性成本。
如果采用 B 端喜聞樂見的月度付費,那也只是将成本支出方從用戶轉為自己,顯然不是長久之計。ChatGPT 面對 C 端用戶 20 美元 / 月的定價之下,尚且存在偷工減料之嫌便是最佳佐證。
當下,通用大模型的商業化無論是走 B 端還是 C 端都難以做到盈虧平衡,同時還很可能遭遇諸如 AI 倫理、監管等合規性風險。因此,大模型的行業化、垂直化成為落地需求下的範式轉變。
反觀行業大模型,雖說其產品形态始于落地需求,但是在實際落地中出現的問題卻也有待解決。
一類值得參考的案例是依托自身產品生态而打造的垂類 to C 模型,例如知乎早早宣布于產品内進行内測的知海圖 AI 以及前不久才發布的攜程問道。
兩者切入大模型賽道的優勢并無二致,在于自有的社區生态和以此為基礎衍生的高質量社區内容。而内容作為行業數據,在簡單清洗後便可成為大模型的訓練語料。兩者的細微差别則是知乎自始便是内容社區,而攜程則是近年才開始發力做内容。
可是就目前來看,無論是知乎還是攜程,其大模型的產品形态似乎都未能切中用戶痛點,亦未能對既有功能有足夠的提升。
知海圖 AI 目前已公布的產品 " 熱榜摘要 " 是通過 AI 抓取優質問答并潤色改寫出梗概呈現給用戶,而另一項應用 " 搜索聚合 " 則是自回答中聚合觀點,提高用戶獲取信息、形成決策的效率。
本身推薦、熱榜一類聚合功能便是知乎 " 傳統藝能 ",大模型賦能後的表現在用戶層面并未掀起水花。況且,AI 改寫潤色的流程也将熱門答案的個性化特征覆蓋,于用戶而言,這項應用的功能僅在于快速了解信息,這與内容社區所倡導的差異化、個性化交流背道而馳。
而立足 OTA 的攜程問道,在攜程董事局主席梁建章看來是一個旅遊業的 " 可靠答案庫 "。其產品成效如何還需時間檢驗,但自定位來看,同樣有 " 舍本逐末 " 之嫌。
旅遊在年輕用戶眼中本就不存在标準答案," 特種兵式 "、" 打卡式 "、" 沉浸式 " 等多樣化旅遊形式的出現證明了這一點。如假設大量用戶通過 AI 制定旅遊路線規劃,千篇一律的路線規劃反而會影響社區交流與氛圍,甚至遭致用戶停留時間的下降。
大體看來,垂直模型在 C 端的落地嘗試算不上順利,甚至有成為 " 沉沒成本 " 的可能。或許受到大模型本身 " 提高效率 " 神話的影響,產品定位也大多囿于 " 效率 " 二字,只是效率僅僅是用戶體驗中一個不算核心的維度。
相同的範式在 to B 領網域也有所展現,而在追求效率的 B 端,行業大模型的商業模式與落地問題得到了更深刻的展現。
摸不清的黑匣子
"AI 不是物理,很少有理論上的重大技術突破,更多的是在模型結構、數據質量等維度做微調和小優化,甚至很多時候模型輸出更好了,團隊卻找不到原因。"
在一位業内人士看來,大模型在業内外存在巨大的認知偏差,而原因則在于大模型訓練以及 AI 行業對于外界而言是一個不折不扣的 " 黑匣子 ",很難審視大模型產生輸出結果的推理過程,它看不見摸不着。
這導致外界在度過 ChatGPT 帶來的狂熱期後,一旦冷靜下來,便會對大模型這個 " 黑匣子 " 持審慎态度。這将導致大模型在落地上的困境,而這一現象在如今向 to B 路線轉變的過程中更為明顯。
以如今已明确 to B 路線的大廠出品為例,包括騰訊雲推出的 MaaS 技術方案、華為雲推出的盤古大模型等,依靠自身雲計算生态,均稱其大模型服務支持多樣化部署,包括雲端部署、本地化快速部署等。在互動、操作、後續加入新的行業數據迭代優化等方面也有建樹,可以說是為了落地,把大模型的門檻降到了極低。
但 " 審慎 " 帶來的認知牆還是沒有打破,即使 ChatGPT 的風吹了半年,許多企業沒有動力也沒有興趣去研究如何導入大模型。
數年前的雲計算行業可以看到因循的相似邏輯。雲計算是在認識到數據價值後,以此為基礎的服務和衍生,至于大模型于企業的價值,相對而言更是數據價值的躍升。同樣是企業客戶缺乏的技術能力,連雲計算在國内企業的普及之路都距終點尚遠,大模型自不必說。
行業大模型究竟好用與否,其實已經并不重要了,畢竟商品的使用價值最終還需使用者來挖掘。更有甚者,外界會粗暴通過某些測試、表現來衡量模型水平,例如 " 松鼠鳜魚法 " 或近來因預測特大台風 " 杜蘇芮 " 的登陸地點與強度有錯誤現象而遭受質疑的華為盤古氣象大模型。
或許正因如此,于近期發布的京東靈犀大模型選擇優先跑通自家業務場景,預計于明年初方對 " 外部嚴肅商業場景 " 開放。
更值一提的是," 行業成風 " 之下,商業化導向下的所謂行業模型在取代大模型原本的 " 通用 " 叙事的同時,也遭致不少人的 " 迷失 "。
所謂行業大模型的定義存在模糊不清。大模型(Foundation Model)的内涵不在于參數量多少而在于使用通用數據訓練而湧現出的通用能力。如采用同樣的模型架構,但在數據上使用單一領網域數據,不僅喪失了通用能力,甚至會由于湧現的折扣導致領網域問題也無法解決。
如在原大模型基礎上使用行業數據做二次預訓練,相當于微調了原模型,那麼即產品本身仍處于模型層,可以被稱作行業大模型;如通過 prompt 或外挂數據庫的方式加入領網域知識,那便僅是對原模型能力的激發,產品也應歸屬至模型之上的應用層,稱之為行業大模型言過其實。
目前大廠中發力行業大模型的絕大多數均是前者,如騰訊、京東、華為等。後者則由于更輕的投入與快速提高模型能力的表現,更多會出現在開源社區中,例如前段時間引發熱議的法律大模型 ChatLaw。
" 相比前者,後者在產品形态上更為成熟,便于快速構建模型能力,但後者在完成灌輸領網域知識的流程後,往往上限會更高 ",一位業内人士稱。
開源威脅
近日,Meta 在開放商用許可下免費提供其最新開源大模型 Llama2,并将其引入微軟的 Azure 平台,此舉被譽為開源 LLM 的重要裡程碑,甚至開始威脅閉源的頭部廠商 OpenAI 的地位。
通過微軟這個大模型金主,Meta 以更開放的姿态挑戰 OpenAI。
實際上," 開源派 " 早在此前便以第三方的身份悄然崛起。" 我們沒有護城河,OpenAI 也沒有。" 這句話出自 5 月谷歌意外洩露的一份内部檔案。其内容大意是表面上, OpenAI 和谷歌在大模型上你追我趕,但真正的赢家未必會從這兩家中產生,下此判斷的原因便在于愈加豐富的開源生态。
開源生态愈發活躍,乃至于出現了模型能力的代表 Llama2 以及 Finetune(模型微調)範式的代表技術 LORA,這一切都讓閉源争取 " 大力出奇迹 " 的巨頭廠商感受到明顯寒意。
開源的技術分享以及人才流轉等因素,也在讓大模型的黑匣子愈發 " 玻璃化 ",缺少壁壘的必然結果是大廠在巨量資金、時間的投入下的 Konw How 輕易為開源社區所傾覆。
國内頭部大廠對此的應對大多是 " 兩手抓 "。左手 " 關門造車 ",以小規模内測形式不斷打磨產品形态與能力,右手 " 集思廣益 ",以雲端開發者生态為基礎打造生态内的開源社區,但這剛需廠商自算力層、模型層到應用層的全棧布局。阿裡雲推出了大模型開源社區魔搭 GPT,華為雲、百度雲、騰訊雲也都有所布局。
總體來看,無論是行業還是通用,to C 還是 to B,大模型的半年考給予我們的直接感覺是:落地困難,盈利預期不斷後移;風險漸強,難言技術壁壘。那麼,當下的破局之路在哪?
目前而言,有兩個有意思的方向。其一是被譽為 " AI 時代的 Memory" 的向量數據庫,其二是模型智能賦予下的智能硬體。
所謂向量,即是可以代表任何東西的多維數據,包括如今 LLM 訓練最為重視的文本,以及影像、視頻、音聲等。這些形式的内容會在數據庫中清晰表示,并且支持語義檢索,即通過相似性檢索,例如男人與男孩。換句話說,于大模型而言,向量檢索就是大模型的 SEO。
如上文所述,領網域知識可以通過向量數據庫能力,或是精調或是外挂來提高行業模型的建構和使用,于大廠而言自然是下一階段的發力點所在。自 5 月起,資本便不斷湧入向量數據相關賽道,作為前景更為确定的應用層產品,向量數據也收獲了一眾 VC 的密切關注。
至于智能硬體内置模型,則是相對曾經的 "siri"、" 小愛 " 等智能助手的能力躍升,也是對真正的智能設備(手機、電腦)的外延拓展。開源社區内早有将大參數模型内置 MAC 的嘗試,而大廠則是在過去的移動互聯網時代便積累了一定硬體生產能力,相對而言其先發優勢更為明顯。
少了 PR 式的春秋筆法,落地成為核心需求的大模型不再神秘,故事也越來越少,開始 " 深潛 " 的賽道玩家們仍在發力。行業需要下一個 "ChatGPT" 時刻,我們方能見到潛水者浮出水面,正面對抗。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App