今天小編分享的科技經驗:三個清華校友,争搶大模型一哥,歡迎閱讀。
圖源:Pixabay
僅僅過了一年,大模型競争就出現了分野。
近期,有媒體報道稱,由王小川創立的百川智能進行新一輪數億美元融資,将成為國内 2024 年最大 AI 領網域融資之一。來自參與的投資人證實,百川智能今年以來估值已超 18 億美元(約 130 億元)。對此,百川智能方面回應時代财經表示,報道存在一定誤差,具體信息有待官方進一步宣布。
如果上述融資消息落地,這意味着又一家清華系大模型公司跻身百億估值俱樂部。
據時代财經不完全統計,2019 年 -2023 年至少有 30 位清華校友下場創業,投入大模型產業,創辦公司超過 15 家,累計融資超過 150 億元。這些由清華校友創辦的企業,在業内被稱為 " 清華系 "。
随着清華系大模型企業估值走高,一場行業内的 " 三國殺 " 默默上演。
大模型繞不開清華系
三年前,兩位初代互聯網創業大佬先後宣告退圈。
2020 年 12 月,美團發布内部信宣布,美團聯合創始人、高級副總裁王慧文已經順利完成交棒,按計劃正式退出。半年後,搜狗被騰訊收購,曾經在搜索領網域叱咤風雲的王小川也逐漸遠離互聯網舞台中央。
此時的大洋彼岸,AI 學術界正升起一顆耀眼的新星。OpenAI 推出的 GPT-3 橫空出世,在學術界掀起不小波瀾,其參數規模高達 1750 億,不僅能做語言生成,而且對語言的理解能力也有了很大的提升。
對外界而言,GPT 還遠沒有爆發出潛在的能量。但是一群清華大學的頂尖學者迅速做了一個重大的決定:追趕 GPT3、投入大模型訓練中。
三年後,GPT-4 通過一款對話產品将大模型的風吹到全球各地。王慧文率先發起了 AI 大模型人才的招募令,緊接着,王小川、李開復等互聯網明星創業者紛紛登場。王慧文、王小川這對昔日的清華校友,因為大模型再次交匯于競技場上。只是這一次,他們離開舒适區後,還要面臨着更多來自 " 學術圈 " 的對手。
圖源:Unsplash
在百模大戰的核心風暴中,清華系毫無疑問地成為舉足輕重的一方勢力,他們如同一條奔騰的江河逐漸分流成各具特色的溪流,有的是在互聯網時代身經百戰的老法師,有的已經在大模型研究領網域中蟄伏多年。
" 如果你做大模型或者芯片,那你最好是清華的。" 一位芯片行業從業者向時代财經表示。諸多科研人才、創業公司與技術儲備,共同構建起一張叫做 " 清華系 " 的人脈之網,這似乎已經成為某種行業共識。
過去一年裡,大模型獨角獸企業技術人員每天熬夜,為了追趕 OpenAI 前仆後繼。
光年之外和智譜 AI 都把根據點選在了清華東門外的搜狐大廈;隔着一條街是賽爾大廈,王小川在此創立了百川智能;搜狐大廈南側的成府路上也有兩家清華系創業公司,分别是聆心智能和深言科技。
一場新的造富運動正轟轟烈烈開展," 清華系 " 成為繞不開的歷史鋼印。
1 位先鋒串起半部創業史
多年後,當外界追憶起這段烈火烹油的大模型創業潮時,智源研究所無疑會成為一個标志性的符号。這裡距離清華大學南門步行只要 5 分鍾,如今,清華主校區三公裡以内都是大模型創業的根據地。
2020 年,人工智能普遍陷入了進退兩難的困局,AI 四小龍市值跌落谷底,巨額的研發投入和低效的落地產出,使得一批投資人紛紛撤退。西南證券的一份研報顯示,AI 企業融資次數從 2019 年開始,出現了大幅下滑,九成 AI 公司處于虧損狀态。
與外界濃重的悲觀情緒相反,智源研究所正在默默醞釀着一場變革,該研究所齊聚了孫茂松、唐傑、劉知遠、楊植麟等一眾大模型先鋒人物,他們一致認為大模型訓練能夠帶來一場颠覆性的變革。
數百人将自己的熱情和精力投入大模型的煉丹爐中,開啟了一段漫長的開荒期。
2021 年初,命名為悟道 1.0 的大模型登場,該系列大模型呈現了 3000 萬圖文數據對訓練的多模态模型 BriVL 1.0、百億參數中英雙語大模型 GLM-10B 與多模态模型 CogView 1.0 等成果。
在此基礎上,身為帶隊老師的唐傑做了一個更大膽的嘗試,他調用外部資源,訓練了幾個百萬億級别的大模型。3 個月後,悟道 2.0 系列大模型亮相。作為對标 GPT-3 的國產大模型系統,悟道 2.0 以 1.75 萬億的參數量,創造了當時全球最高紀錄,超出了 GPT-3 近 10 倍,這也成為中國大模型初創階段标志性的裡程碑。
唐傑的另一個身份是智譜 AI 的創始人之一,公司成立于 2019 年 6 月,清華大學計算機系知識工程實驗室是其搖籃,團隊核心成員幾乎都是清華血脈。
悟道系列大模型一戰成名後,清華系創業的氛圍被推向了一個小高潮。一批清華校友逐漸從實驗室走出來,探究大模型商業化的路徑。
圖源:Unsplash
2021 年 11 月,黃民烈創立了聆心智能;2022 年 3 月,孫茂松的博士生豈凡超創立了深言科技;2022 年 8 月,劉知遠創立了面壁智能,專注于法律領網域;2023 年,同樣師從孫茂松的朱軍建立了生數科技。
此時,大模型創業團隊再次面臨一個困局:找不到大模型與市場的連接點,願意吃螃蟹的企業并不多,甚至不知道怎樣調度大模型的能力。
直到一個核爆點的出現,這批早期的開荒者才搶到了通向下一個技術變革的入場券。
學院派 VS 創業派
2022 年 11 月,OpenAI 推出的 ChatGPT 橫空出世,自動生成文字的功能震撼了全球科技圈,用戶規模在短短 2 個月内突破 1 億,大模型開始進入大眾視野。
如同一夜春風襲來,默默耕耘數載的清華系大模型收獲了資本的青睐,最先搶占了風口。時代财經整理發現,2023 年,清華系大模型的融資逐漸迎來了快車道,超過一半的清華系大模型第一筆上億級别的融資發生在 2023 年。
" 過去幾年,AI 投資基本為 0,在大家覺得滿眼霧霾的時候,突然 ChatGPT 出來了,給人帶來了光。" 瀾舟科技創始人周明發出了這樣的感嘆。
這是一場深不見底的資源投入,訓練一款高質量的大模型,需要數以萬計的芯片集群和雲計算調度,并且還要夜以繼日的追趕被 OpenAI 疊高的行業指标,一旦開啟,就意味着啟動了龐大的碎鈔機。
據國盛證券研報,GPT-3 僅訓練一次的成本就高達 140 萬美元,對于一些更大的 LLM,一次訓練成本介于 200 萬美元至 1200 萬美元之間。智譜 AI CEO 張鵬也曾在公開場合表示,25 億元的融資根本不夠,不管融多少、掙多少錢,都是通向 AGI 這條路上的盤纏。
2023 年 10 月,智譜 AI 宣布完成超 25 億元融資(估值過百億元);也在同一時期,百川智能迎來了新一輪的融資,金額超過 3 億美元;月之暗面則在去年接連完成了兩輪共計近 20 億元的融資。
相比學院派艱難低調的蟄伏,互聯網明星創業者通常更加果斷堅決,他們對應用產品和市場有更為敏銳的判斷力。2023 年年初,在見證 ChatGPT 的問世後,身為互聯網連續創業者的王小川嗅到了技術變革的氣息,他激動地發了一條朋友圈:"OpenAI 的勝利,是技術理想主義的勝利。"
先成立公司、再招募技術團隊的路徑,是創業者快速搶占市場目光的最佳方式。思考了兩周後,王小川便放下了手頭的智慧健康項目,轉而進攻大模型。
不到半年,百川智能的團隊便搭建起來了,王小川拿到 5000 萬美元啟動資金,正式宣布進入 AI 模型創業賽道。此外,他還拉來了舊部下——前搜狗 COO、清華 1998 級校友茹立雲,新的創業公司有一半成員來自原搜狗團隊。
經歷了長達半年的橫衝直撞,獨角獸大模型名單逐漸浮出水面——智譜 AI、月之暗面、百川智能、MiniMax 和零一萬物,其 2023 年公開披露的融資約為 100 億元,占全國 AI 投資的 40%,清華系大模型再次赢得了半壁江山。
圖源:Unsplash
然而,從整體的融資規模來看,大模型概念的火爆并沒有引發投資熱潮。根據晚點報道,2023 年 AI 領網域的總融資額同比減少 4.5%,為 257 億元,不到 2021 年的一半。
" 這個市場目前處在募資難、投資難、退出難的形勢下,所以對于大模型,大多數機構還都是看為主,真正出手的話,也不像以前我們經常說的 FOMO(fear of miss out),是出于‘擔心錯過’的情緒。" 梅花創投創始合夥人吳世春此前接受時代财經采訪時表示。
誰是清華系大模型一哥?
如果沒有智能助手 Kimi 的爆火,月之暗面可能不會快速站在聚光燈下。過去一年,創始人楊植麟幾乎隐匿于同門師兄聲勢浩大的追逐中,獲得的曝光度并不多。
2024 年開年,文生視頻應用 Sora、長文本概念走紅,短暫熄火的大模型投資得以再次回溫。月之暗面最先被資本抬高身價,傳出完成新一輪超 10 億美元的融資,這是 ChatGPT 出現後大模型賽道最大一筆融資,估值達到 25 億美元(約 180 億元),投資方包括阿裡、紅杉中國、小紅書、美團等。
1992 年出生的楊植麟成為整個大模型領網域的焦點人物,入局大模型之前,楊植麟已經構思了兩個問題,一是創業籌備的第一筆資本,二是構建創業的方向——通過與人類互動找到應用機會。
2023 年 10 月,月之暗面推出了智能助手 Kimi,成為大模型創業公司的首個爆款項目,3 月 19 日,月之暗面宣布把長文本能力從 20 萬字提升至 200 萬字,其當周訪問量達到了 394 萬次,略高于文心一言的 338 萬次,一度躍升為國内網頁端周度訪問量最高的 AI 應用。
在部分行業人士看來,月之暗面彎道超車的武器在于綁定了長文本的标籤,并且定位比較垂直。" 面向 C 端的產品更容易赢得市場關注,但同時也會因為缺乏技術壁壘容易被超越。"AI 創業者張維向時代财經說道,他認為,大模型的發展方向依然比較模糊,大家都在摸着石頭過河,面對的是一個完全未知的世界。
作為大模型行業的布道者,唐傑創立的智譜 AI 頻繁對外投資,出現在 13 家大模型公司的融資隊伍中,包括了算力、軟硬體、應用、醫藥、保險等多個方向。
圖源:Unsplash
不過,當技術像煙花一樣盛放光芒時,身在局中的人很難分清楚這是虛晃的幻術還是可以碰觸的真實世界。
" 以為得到一把萬能的錘子,看見什麼都覺得是釘子,但其實發現,業務場景很難切入。面向 B 端去做企業資源不夠,選擇做 C 端推廣和成本都是問題。" 張維向時代财經說道。
即便是生态較為成熟的百度,也尚未在大模型領網域找到光明的出口。根據公開披露的數據,2023 年最後一個季度,大模型為百度雲業務僅帶來 6.6 億元的增量收入。
" 掌握模型核心技術的團隊會在競争中脫穎而出,推出相應的應用產品,進行多次的迭代和優化,找到合适的路線。如果只單純開發應用產品,沒有自己掌握的核心技術,基本上只有一次試錯機會。" 啟明創投合夥人周志峰近日在公開場合表示,在他看來,具備大模型技術水平的公司終将會走向模型應用一體化的公司。
如果把視線放在清華系競技場的核心地帶," 三國殺 " 也開始步入正題。
智譜 AI、月之暗面和百川智能快速跻身 100 億美元估值俱樂部,只是三者使用的武器并不相同:擁有學院派背景的智譜 AI,在尋找企業與大模型的融合場景;月之暗面創始人楊植麟是極致的技術理想主義,他相信技術 " 暴力美學 " 能夠改變世界;而在兩種路線躊躇的王小川更想在理想主義和現實主義中找到另一種視角。
和大多數從業者一樣,混沌與彷徨幾乎貫穿了張維創業的一整年,不知道接下來行業走向何方的他,還在等待一個坐标系的出現。
(歡迎轉載,開白請添加微信,ID:rafe0101)