今天小編分享的互聯網經驗:“百模大戰”即将迎來一輪應用淘汰賽,歡迎閲讀。
圖片來源 @視覺中國
文 | 互聯網江湖,作者 | 志剛
這年頭,不做大模型就不好意思説自己是科技公司。
這不," 百模 " 大戰打了幾個月之後,又有新玩家入場了,京東、攜程都加入了大模型 " 戰場 "。
相比京東、攜程發發布大模型布,這兩天的大模型發生了一個更重量級的事情:Meta 發布新一代 AI 模型 LLama V2,并宣布 LLama V2 開源,并可直接商用。
傅盛發朋友圈評論:" 這一下不知道多少公司笑醒在深夜,多少公司哭暈在廁所…… "
據傳,LLama V2 性能超過了 GPT-4、Microsoft 和 Google 的 AI 模型,能夠生成語言、代碼和影像。最重要的,相比 GPT4,LLama V2 開源,并且可以直接商用。
消息一出,不少人都在感慨:一夜之間大模型變天了。
要説大模型行業變天,恐怕還有點早,但 LLama V2 開源可商用、再加上國内這麼多大模型落地," 百模 " 大戰,恐怕要迎來第一個 " 淘汰賽 " 階段。
" 百模 " 大戰之後,大模型邁進應用驅動階段
大模型賽道,做通用模型的都是大公司。
Open AI 背後站在微軟,文心一言背後是百度,通義千問背後是阿裏,混元大模型背後是騰訊……再加上商湯、訊飛等 " 本土 " 玩家,留給後來者的舞台其實并不大。
而這個不大的舞台,如今卻顯得有些擁擠。此前一份國產大模型列顯示,目前國内的大模型已經有近百家。
這麼多大模型落地,説明 AI 大模型可能即将進入產品驅動階段。
互聯網江湖認為,大模型的發展會經過三個階段。
第一階段,模型數據、數據為核心的技術驅動階段。
從 ChatGPT 到 GPT3 階段,大模型是由技術驅動,這時候關鍵是算法,和數據訓練。
GTP3 之後,差距就在于數據量,這不難理解,這好比是一個有着超強學習能力的孩子,在咿呀學語之前,進步不大,一旦掌握了世界的 " 數據語言 ",那麼大模型的進展是飛速的。
而做通用大模型的玩家,需要盡快度過這個階段,并建立自己的核心優勢。
目前來看,百度文心、騰訊混元、阿裏通義千問、商湯大模型、以及訊飛火星等,國產主要大模型都走到這一階段。
這些大模型,都是大公司做出來的,能走到這個階段的大模型,要麼算法更先進,要麼有足夠的數據參數和訓練量。
以百度為例,5 月份上線的文心大模型 3.5,能力已經超出 ChatGPT 3.5,雖然官方沒有公布具體的數據量級,但大量的數據、算法優化訓練是必經之路。
這個階段,拼的其實就是硬實力,拼的是數據生态,人才技術和資金投入,創業公司很難真的從底層做起來。
第二階段,是產品驅動階段。
當國產大模型不斷湧現," 百模 " 大戰的格局上演之後,行業其實就已經走到了產品驅動階段。
產品驅動階段," 百模 " 大戰會經歷一輪淘汰賽。
大模型從業者普遍認為,400 億 -500 億參數量級是模型能力 " 質變 " 的門檻。 換言之,對于資本市場來説,百億參數量級之前,一些大模型項目很可能會首先遇到 " 生存問題 "。也就是説,對于一些後來者、在遇到生存問題之前,必須要有足夠應用落地。
也因此,產品階段的大模型,核心在落地場景。
大模型其實沒有什麼路線之争,垂直或者通用,與其説是路線之争,倒不如説是落地的場景之争。
我們認為產品驅動階段,大模型落地的重點在于,大公司底層做起,打造行業大模型基礎設施,在此之上,垂類的創業公司去做應用端的垂直創新。
其實現在已經有企業走在這條道路上了,比如商湯 SenseChat 大模型,在不少領網域已經開始與品牌合作落地。
" 表面上看通用大模型和垂直大模型代表了兩種技術方向,但實際上兩者相輔相成,可以并行發展。更強的通用大模型具備更強大的學習能力,可以快速融合不同行業領網域的知識,支持垂直大模型的訓練和開發。" 商湯科技相關人士表示。
在大模型領網域,商湯扎根很深。
4 月份,商湯 " 日日新 SenseNova" 大模型體系公布,并迅速落地。在自動駕駛行業,商湯構建了業内首個感知決策一體化的端到端自動駕駛解決方案 UniAD,,使車道線的預測準确率提升了 30%,預測運動位移的誤差降低了近 40%,規劃誤差降低了近 30%。
天眼查 APP 顯示,商湯科技 2021 年在香港上市,彼時上市募資 55 億港元。
科大訊飛落地也很快。此前科大訊飛曾表示,随着星火認知大模型的不斷迭代,其診後康復管理平台将逐步實現對所有病種、病程的精細化管理等能力。科大訊飛的大模型最大的特點是更 C 端,有自己的產品矩陣,接入大模型之後,更容易觸達 C 端用户。
大模型領網域,最先產生商業價值不一定是通用的 ChatGPT4,反而更可能產生在應用端走得更快的領網域。
實際上,在科技進步的浪潮中,并不是所有的價值都會被先發的企業拿走,技術商業化的價值,往往會被更成熟的企業拿走的更多。
就像微信不是最先出現的社交應用,但無疑是最成功的。
第三個階段,是用户驅動階段。
有了場景之後,最重要的是能夠獲得用户的認可。從過去 AI 技術的落地來看,由 ToB 到 ToC,是大模型落地的最終路徑。所以,首先為大模型買單的一定是 B 端。
不過,從底層商業邏輯上,誰是最終的 " 受益者 ",也就會是最終的 " 買單者 ",説到底,大模型應用的最終結果還是要服務用户。長期來看,也最終會走到用户驅動的階段。
只不過,與現在大家所熟知的移動應用不同," 大模型應用 " 的用户驅動會更快更直接,因此,有大量 C 端用户的公司(百度、阿裏、騰訊)的進展速度可能會超出想象。
大模型應用爆發的黎明,商業化拐點已至?
雖然大模型很火,但真正躬身下沉的玩家都是大公司,投資市場的交易數量與去年淡季沒有什麼變化。
很明顯,市場有顧慮。
比如,現在下場了,将來如何退出?大模型畢竟是個需要長期投入的項目,募資難,想要退出也難。再比如,比較有潛力的大模型項目其實都在大公司手裏,這不是説創業公司沒有機會,但市場還是在觀察。
" 大模型的終局會是什麼呢?我認為對于大模型來説,終局會集中在少量的幾個大模型 "。百度集團副總裁吳甜表示。
吳甜認為,大模型產業生态可類比芯片代工廠,把大數據、大算力、大算法都封裝,建設自動化、數字化、标準化的生產模式。
一方面,從底層做起來的大模型,成本非常高,需要多年積累。另一方面,應用層面,幾個少量大模型,就會有非常廣泛的應用生态。換句話來説,其實并不需要那麼多大模型來做重復的應用。
大模型領網域,可能也會有一個新的 " 二八定律 ":兩成的大模型玩家掌握真正的底層核心技術,而八成的大模型企業都在各個領網域創新,去做大模型的應用。
可以預見的是,Meta 的 LLama V2 大模型開源、放開商業化之後,大模型應用端的創新會迎來一個高潮,而國内大模型產品集中爆發,應用端也會迎來許多的新變化。
過去的十年,以用户關系為中心,互聯網完成了内容消費、服務消費、商品消費的中心化。
大家看視頻到抖音、快手、B 站,買東西到淘寶京東拼多多,本地生活到餓了麼美團。于是,搜索廣告之後,短視頻、本地生活、電商,成了互聯網技術創造價值的主要方式。
而大模型,正在用新技術和新互動,重新改變價值的創造方式。
這種改變分為幾個方面:
一、過去的互聯網是分發内容,而大模型則是在分發的過程中創造内容;
你向大模型發出一個提問,AI 不是事先給出答案,而是在實時生成答案,這樣的信息互動方式,本身是分發,也是在創造。
如果應用到廣告領網域,就可以通過大模型實時生成廣告,廣告内容、呈現方式觸達用户更精準,不再是所謂的 " 精準投放 " 而是真正意義上的 " 一對一 " 的制作、傳播廣告。
在過去,一千讀者心中有一千個哈姆雷特,而在未來,一千個用户面前同時展示的,則是一千個不同定制的品牌廣告。用户更能接收到品牌關鍵信息,廣告的轉化率也就更高。
在廣告領網域,已經有相關的嘗試,百度基于大模型推出 " 擎舵 "、騰訊推出 " 混元 ",阿裏媽媽的 AIGB 出價模型,都是這個方向上的應用嘗試。
進一步來看,這種 " 黑鏡 " 式的信息分發、創造,可能會改變整個互聯網的内容生產邏輯。
二、大模型的互動設計,有新的商業化機會;
大模型的應用,淺層的是強調功能性,深層的是改變成本結構。
一個基本的判斷是,大模型商業化應用首先會改變的一定是廣告、營銷行業,因為廣告行業對用户獲取信息的方式變化更敏感。
因此,在營銷、内容創造等行業,一些新的商業機會可能會被發現。
幾乎可以确定的是,在初期的應用階段,商業化的機會一定與互動有關。
比如,Copy.AI 和 Jasper 這兩個營銷創意工具,以 GPT-3 作為底層接口實現了持續的規模化變現。他們提供了互動界面和插件、API 接口,讓大模型能更好的去服務某個領網域的客户。
當然,這只是解決最基本的功能性問題,大模型真正的價值在于改變垂直行業的成本結構,比如自動駕駛大模型的商業化價值,就是在于改變了人們的出行成本結構。
營銷只是一個方面,商業化方面,其實還是得看具體細分領網域的應用。
對于不同的領網域,大模型會不斷的被垂直細分,去滿足更小、更細微的場景應用。而這些更細微,更小的場景,可能會有率先商業化的機會。
比如,文本生成,比如圖片生成。能夠先讓編劇、漫畫家的工作變得更容易?能不能把文案從做 PPT 的日常循環中給解放出來,這些細小的場景,能夠率先變現。
大公司,和創業公司,在應用層差别可能不是很大,應用層是創業機會最多的大模型領網域,未來行業内也可能會跑出幾家專注于大模型應用的公司。
互聯網江湖認為,新技術應用,找到專有價值鏈要素,嵌入行業,是一個必經之路。因此在應用上,找場景的公司,比練算法、堆參數的公司更有機會。
大模型的成功有階段性質變,就像是 GPT3 到 GPT4,但接下來這種變化會越來越不明顯。也就是説,數據訓練的邊際收益會降低,
大模型能力的進階需要數據量做支撐,而商業化則需要考慮成本問題,如何解決這個問題,頗為關鍵。
商業化拐點已至,大模型的商業化短期看 B 端,長期機會可能還是在 C 端。
大模型,有點像前幾年火的 ToB,不僅是要看自身的成熟度,也得看行業端的适配。
大模型的成本很高,商業化首先就要到合适的場景中,并且能夠真正賺到錢,只有真正在 AI 應用場景中掙到錢,并且能夠真正與行業适配,大模型才有商業化的競争力。
能夠承載大模型商業化的,只有降本需求更迫切的 B 端。
事實也的确如此,以商湯為例,在金融領網域,商湯與銀行、保險、券商等客户展開合作,利用數字人進行智能客服、智慧營銷等工作,并通過接入大語言模型能力,提供投研分析、研報撰寫等新功能,試圖幫助銀行金融機構降本增效。
在醫療領網域,商湯中文醫療語言大模型 " 大醫 ",也能夠提供導診、問診、健康咨詢、輔助決策等多場景多輪會話能力。
進一步來看,B 端之外,未來的大模型也可能會承載更多的商品和服務分發。
移動生态中,觸達用户的方式其實就是網頁、APP、小程式,那麼未來的大模型生态中,如果用大模型來分發内容,那麼流量的分發會更加去中心化。
實際上,一旦語言大模型成熟,并且有了足夠多的用户習慣,那麼,承載商品與服務分發的 APP、小程式,可能就會被大模型取代。
也就是説,在 ToB 應用的階段之後,未來大模型長期的價值和商業化機會,更多其實還是在 C 端。
只不過,以當下的視角來看,很難去定義 AI 應用的 " 新場景 ",這就像是當你身處 90 年代,你不可能預測到如今的微信、抖音崛起。
如今的大模型也同樣如此。
結語
從公元元年到 18 世紀,人類經濟增長曲線幾乎是平的,也只有在近三百年才出現工業革命,近幾十年才有了信息技術。
人類歷史上第一台計算 ENIAC 最初誕生,并不是用于個人計算,而是用于大量軍用數據的計算,但數十年後,它卻徹底改變了人們的生活方式。
如今的大模型,就如同當年的 ENIAC。
當泡沫散去,大模型究竟是不是 " 比互聯網更偉大 " 的機會?或許人們心中早已有了答案。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App