今天小編分享的互聯網經驗:大模型狂飙半年,掏出真金白銀的投資人是少數,歡迎閲讀。
圖片來源 @視覺中國
文 | 甲子光年科技產業智庫,作者|劉楊楠,編輯|栗子
在高喊 " 要做中國版 OpenAI" 之後的第 136 天,王慧文把光年之外賣給了美團。
2023 年 6 月 29 日,美團在港交所發布公告,于 2023 年 6 月 29 日全資收購「光年之外」100% 的股權,收購總代價包括:2.33673 億美元現金 + 承擔 3.66924 億元人民币債務 +1 元人民币,合計大約 20.65 億元人民币。
很難想象,國内第一家由大佬入局創辦的大模型初創公司會以這種方式收尾,這一結局給市場留下了無數的疑問和猜測。
從整體商業視角看,光年之外被美團收購只是企業間常見的收購動作。但對于國内AI行業來説,這筆收購似乎預示着僅火熱半年的 AI 大模型創業潮正在降温。
資本市場對行業水温的感知更加直觀。自 6 月 26 日開始,科大訊飛、昆侖萬維、360 等 AI 概念股集體大跌。
不只是國内,人們甚至對曾經趨之若鹜的 ChatGPT 也不再追捧。
根據網站數據分析工具 SimilarWeb 數據,前期 ChatGPT 的訪問量增長率驚人,1 月份的環比增長率為 131.6%,2 月份為 62.5%,3 月份為 55.8%,在 4 月份明顯放緩,環比增長率為 12.6%,到了 5 月,這個數字只剩 2.8%。
當大模型的熱度不再,人們很容易想到一個問題:大模型到底是不是創業的好機會?
這個問題顯然沒有标準答案,甚至連大佬之間的看法都大相徑庭。就在前幾天,獵豹移動董事長兼 CEO 傅盛和金沙江創業投資基金董事總經理朱嘯虎為此在朋友圈 " 吵 " 了起來。
大模型的認知矛盾并不只集中在個體身上。當創業者、投資人與需求方都存在認知偏差的時候,對于大模型的 " 謹慎與保守 ",就成了絕大多數玩家的普遍狀态。
在 6 月 16 日召開的 2023 年華映資本年度大會上,華映資本投資人與被投的硬科技及消費科技企業之間,對產業如何擁抱大模型與 AIGC 的問題也曾展開過激烈的探讨。
在「甲子光年」看來,大模型市場急需理性的聲音,創新的腳步不能停,諸多問題尚待厘清——大模型究竟能不能投?如何投?入局大模型有哪些問題?大模型未來的商業化前景到底是否會重蹈此前 AI 行業的覆轍?
無論人們多憂慮,產業擁抱大模型幾乎是既定結局——問題是,以什麼樣的姿态擁抱。
謹慎的投資人們
百川智能、銜遠科技、聆心智能、西湖心辰、MiniMax ……從 2023 年初至今,國内大模型創業公司層出不窮,每一位創業者的背景都足夠光鮮,每一家企業的實力都備受資本方認可。
那段時間,某某明星企業家離職創業入局大模型獲得巨額融資的消息屢見不鮮。
例如 6 月 1 日,有消息稱國内大模型初創公司 MiniMax 即将完成一輪超過 2.5 億美元的融資,公司估值超過 12 億美元;
而剛剛被美團收購的光年之外的融資消息在當時更是撲朔迷離,王慧文曾一度否認公司獲得了包括源碼、騰訊、五源以及宿華的 2.3 億美元融資,但這筆融資最終也因為美團發布的收購公告而坐實。
這種投資人追捧創業者的浪潮,讓人們一度以為大模型将要激活國内整個 AI 創投圈,但事實卻并非如此。實際上,除了自帶光環的明星團隊,投資人對大模型創業更多是觀望和審視,真正拿出真金白銀的人是少數。
早在今年初 ChatGPT 浪潮席卷全球時,「甲子光年」便第一時間和部分投資人們交流看法。那段時間,幾乎所有人都在快速學習,邀請專家對公司内部進行科普。
當時,AI 領網域熱烈讨論着一個問題:ChatGPT 是不是人工智能界的 iPhone 時刻?對此,險峰給出的答案是不急于下定論。" 我們暫時還不能确定這個影響到底有多大,但我們認為它(大模型)肯定會改變一些東西。" 險峰副總裁李抗説。
但也有投資機構對大模型表現了擔憂。某一級市場投資人對「甲子光年」表示,很擔心中國的反應過熱。ChatGPT 爆發後,國内的 AI 概念股被引爆。" 我們的一二級市場都必須考慮注入的相關投資能否產生相應的回報。如果都是為了短期利益,這種投資到最後很容易打水漂,因為你沒有真正去促進技術的發展,而是一個概念性投資。"
在他看來,投資人的關注點要聚焦,去探索更多對人類未來有影響力的基礎科學,這才是真正深藏潛在市場價值的科技力量。" 既要和市場動态結合,也要和市場價值以及真正的、未來的社會進步結合,不能盲從,我們要清醒認識到哪些東西能改變未來,不能去蹭熱點,一窩蜂做這件事兒,我們不應該成為一個浪潮中的泡沫。"
不過,一位 FA 從業者向「甲子光年」表示:" 最近慢慢開始有投資人出手大模型項目了,但手筆都不大。"
" 本質問題還是認知不夠。" 對于投資人們的謹慎态度,華映資本管理合夥人章高男給出了自己的理解。他進一步表示:" 幾乎沒有人能清晰地定義大模型,我們要先把大模型的邊界定義清楚再來讨論,你説的大模型與我説的大模型,很有可能都不是一件事情。"
在一些人看來,投資人的謹慎對大模型創業而言或許是一種負面信号,是在給大模型潑冷水。但客觀來看,謹慎不代表拒絕,經過深刻思考後的理性擁抱更為珍貴。
無論投資者還是創業者,又或是希望借助大模型将自身業務轉型更新的傳統企業,在真正投身大模型市場前都需要厘清兩個問題——大模型的能力邊界是什麼,以及自身是否有必要引入大模型?
擁抱大模型前,厘清兩個問題
當一項新技術出現時,商業世界最核心的問題就是:這項技術能用在哪,怎麼用?
這對大模型來説尤其重要,也是當前還未真正入局大模型的企業都應謹慎考慮的問題。
要回答這個問題,首先需要劃定大模型的能力邊界。
大模型的特殊之處在于,其内部的模型算法是一個巨大的黑箱,大模型的生成過程不可解釋且不可預測,因此很難界定其能力邊界。但可以确定的是,通用大模型不是萬能的。
智源研究院副院長、總工程師林詠華曾在一次分享中提到,從產業落地角度來看," 大模型 + 提示學習 " 無法代替一切。
她進一步提到,對于許多特定任務或新任務,提示學習或許能通過多輪提示 prompt,讓大模型輸出需要的結果,但大模型 " 記不住 " 這個過程,而如果開發者把整個提示 prompt 都加到每一次的調用中,一方面有可能使得 prompt 越加越長而超過了大模型的上下文能力,另一方面勢必導致每次的推理開銷增大、效果也會難以控制。在投入了真金白銀的產品落地環節,這種不穩定性更為致命。
國家語音創新中心首席專家張熠天也在 2023 年華映資本的年會上表示:" 大模型是一個生成邏輯,他給出的只是一個最優的詞匯梯次聚類,答案和問題之間并無因果。我們得到的東西只是一個 'result',需要鑑别,而不是 'answer'。所以大模型是否能夠直接在教育、醫療、司法等嚴肅領網域應用,可能都是一個問題。但是它在輔助決策上,是有意義的。在直接生成結果上,如果要商業化、產品化,我們認為還是有很長的路要走的。"
因此,一個在業内基本形成的共識是,未來每個行業都會有一個自己的垂直大模型,重點在于如何将通用大模型的能力與企業自身的行業數據很好地融合起來。
但在真正考慮大模型工程落地前,創業者們還需要考慮一個更加重要卻很容易被忽視的問題——大模型是否是企業的 " 剛需 "?
對此,國内一家多模态大模型團隊曾對「甲子光年」表示,大模型是否是企業的 " 剛需 " 需要多角度來理解。對于一些企業而言,沒有引入大模型,就相當于在市場競争中失去了一把利刃,他們不得不上大模型來獲取客户青睐——這也是一種 " 剛需 "。
但某種程度上,這更多是新興技術在發展初期的一種市場情緒。長遠來看,新興技術的產業化發展,本質還是要靠業務需求驅動。這時,企業究竟是否需要大模型就需要考慮多重因素。
除了具體的工程落地問題外,企業還需要考慮數據安全問題,以及大模型對原有市場格局的影響。
這兩大問題在信息化、數字化時代已經頻頻出現且無法根除,智能化時代,這些問題則可能以一種更隐晦的方式出現。
" 很多消費型、或者是平台型的企業,如果毫無保留地去擁抱大模型,那大模型對行業的反噬能力是很強的,因為這意味着從產業端很輕易地就交出了行業的進入門檻和認知鑰匙。" 張熠天表示。
在數字化轉型的大背景下,大多數行業都通過大數據、雲計算等技術實現了數字化轉型更新。但與此同時,傳統企業也向數字化技術廠商交出了大量的行業數據,數字化技術的提供商成為產業中一個不可忽視的主體,原有的市場格局被改變。
但工業、建築等行業由于數據量小,且各業務線之間的數據難以打通,傳統企業至今仍保持着較高的競争壁壘。
張熠天表示:" 目前,建築業是在數字化背景下被保護得最好的行業。現在建築業的信息化,除了一個廣聯達可以做預算以外,沒有一家巨頭能夠切入。為什麼?因為建築有設計圖、施工圖、維修圖、規劃圖、備案圖等八張圖,所有的圖之間相互都是打不通的,政府部門都不是互認的,打通整個建築的這八張圖的成本足夠高,所以建築業才保持了這種競争主體的多元化。我們通常認為競争主體的多元化是產業發展活力和動力之源。"
因此,在大模型浪潮下,對于行業标準、競争優勢尚不完善的企業,是否要無條件擁抱大模型,是每一家都需要慎重考慮的問題。
大模型的工程化落地沒有标準答案
對于已經将真金白銀投入大模型市場的入局者而言,接下來要做的是解決實際的工程落地問題。
對此,業内已經逐漸形成一個共識——未來,在產業落地環節,大模型和小模型将會相輔相成。
林詠華曾表示,對精度要求高、對泛化能力要求低的窄網域場景更合适 " 小模型 + 遷移學習 " 的範式。比如工業檢測、工業質檢、醫療影像分析等等。
此外,華院計算創始人宣曉華也曾表示,未來AI企業的商業模式,是将大數據驅動的通用大模型和以知識驅動的面向垂直行業的小數據模型相融合,實現雙輪驅動。
章高男也對「甲子光年」表示:" 企業在做自己的模型優化或訓練垂類模型時,可以和大模型有所結合。不需要大模型那麼高維的數據,也不需要完全套用大模型的訓練方法,但可以将大模型技術和其他技術耦合,形成低算力要求的行業垂直模型,這是有啓示作用的,絕不是簡單套用大模型。"
例如,對于大模型屢遭诟病的 " 幻覺 " 問題,短期内可能還需結合上一代AI技術來解決。
" 產生幻覺的原因很多,可能是因為數據在某個領網域相對稀疏和不足。在這種情況下,我們需要為模型提供更多數據來進行訓練。此外,在用户提問時,清楚地向模型提供更多背景信息也是減少幻覺的一種方法,或者降低‘温度’。有時候幻覺的產生是因為問題提得不夠完整,缺乏背景和前提。因此,問題的提出也非常重要,prompt engineering 是關鍵。另外,如果用户真的想要百分之百解決準确的問題,可能還是需要用到知識圖譜。知識圖譜能夠保證邏輯推理的準确性,以及包括 Meta AI 的負責人 Yann Lecun 提出的‘世界模型’等更新的技術。" 金柚網 CTO 邬學寧表示。
除和上一代 AI 技術相結合之外,将大模型的訓練過程與高質量的行業數據結合也是很重要的部分。
例如,作為一家為 AI PaaS 平台服務的混布型數據庫,天雲數據已經走過了十餘年,如今已經走到了和大模型結合的階段。
天雲數據副總裁李從武表示,将從兩個方面考慮自身與大模型的結合——首先是如何将私網域數據與大型模型結合使用。例如天雲數據為證監會完成了一個類似政策解讀的項目,通過結合法規、判例和解釋等各種數據,天雲數據生成了對違規行為的解讀,類似于法院判罰的過程,可以通過綜合各種數據來解讀違規行為的原因。
其次,天雲數據一直在研發混布式數據庫,是國内最早的幾家之一。早在 2018 年左右,天雲數據就提出了 AI native 數據庫的概念,其實就類似今天支持大型模型的向量數據庫,天雲數據已經發布了自研向量數據庫,并應用于自己的模型。
總的來看,大模型的工程化落地問題沒有标準答案。
在人工智能這條路上,中國一定會走出一條不同于别國的道路。兩條路很難有優劣之分,更多是基于不同國情下的現實選擇。
險峰副總裁李抗曾在訪談中向「甲子光年」做了一個類比,如今看來依然适用:" 借 OpenAI 的成功去説國内創業者的諸多問題是不公平的,就像兩個人打牌,牌風不同,對方突然玩了一把大的,胡出了同花順,你就説人家打牌好,我太謹慎了,但我赢的時候你怎麼不説?"
張熠天分享道,從中央的判斷來看,大模型,包括人工智能的問題,是赢得全球競争主動權的重要戰略抓手,是推動我國科技跨越發展,產業化優化更新,生產力總體躍升的重要戰略資源。
" 二十大報告談產業問題的時候,将人工智能從新一代信息技術中單獨提出。所以從政策上來看,發展人工智能、大模型,不僅僅是技術問題與產業問題,還是一個國家經濟核心競争力的問題,從更深遠上看,更是一個政治問題,大家要從更高的角度來認識這個問題。"
如果将視野跳出中國,将技術發展的時間線拉長,ChatGPT 引發的軒然大波或許只是人工智能技術發展歷史上的一個點,現在一切判斷都可能為之過早。
畢竟,即使是長期浸淫人工智能研究一線的技術人員,現在并未對人工智能的未來形成共識,并深陷于一種不安情緒中。
在近期爆火的《為什麼偉大不能被計劃》一書中,肯尼斯 · 斯坦利、喬爾 · 雷曼兩位作者寫道:" 我們不得不面對這樣一個令人不安的事實,即我們無法确定任何經驗法則能否成為追求實現人工智能目标的可靠指南。"
在前不久落幕的 2023 北京智源大會上,智源研究院院長黃鐵軍也有着極度相似的不安。他直接用 " 無法閉幕 "4 個字作為閉幕式的演講标題。他説:" 我們處在一個不能确定的狀态,這樣的 Near AGI 它比我們強嗎?它超過我們的智能了嗎?還是它在什麼時候能超過我們呢?我不知道,我們處在一個完全無法把控的狀态裏。"
在閉幕致辭的最後,他用這樣一句話收尾:" 如果我們能夠用投資大模型一樣的熱情去應對風險,至少有一定可能把握未來。但是,你相信人類能做到嗎?我不知道。"
放眼所有技術與產業,這種來自一線核心技術人員的 " 失控感 " 在其他領網域并不常見。現在,幾乎所有人都在摸着石頭過河。如今入場的每一家企業,都有可能成為技術處女地的拓荒者。
而時間,是證明一切的最佳憑證。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App