今天小編分享的科技經驗:搜狐大廈醞釀商業巨變:清華系大模型公司扎堆,真抱團還是假情誼?,歡迎閱讀。
本文來源:時代周報 作者:申謹睿
圖源:Unsplash
如果給中國大模型企業的創業圖譜建立一個坐标系,位于清華大學東門外十字路口一側的搜狐網絡大廈或許是最合适的坐标原點。張朝陽可能也沒想到,昔日互聯網風水寶地,如今承接了新的技術使命。
2023 年 4 月 6 日,美團聯合創始人王慧文在朋友圈發文稱:" 新辦公室第一天,切個蛋糕。" 事實上,距他廣發英雄帖招兵買馬到正式成立這家 AI 公司 " 光年之外 ",只不過短短兩月。而這條朋友圈也恰好曝光了辦公室的位置——光年之外就潛伏在搜狐網絡大廈的三樓。
4 天後,搜狗創始人王小川在搜狐網絡大廈的二樓創立了 " 百川智能 ",旗幟鮮明地對标 OpenAI。巧的是,大廈的 7 樓到 11 樓,是另一家人工智能公司 " 智譜 AI" 的大本營。大廈不遠處,分布着聆心智能、深言科技、瀾舟科技等一眾大模型先行者。
盡管成立的時間與契機各不相同,他們卻都共享着同一個标籤——清華系 AI 公司。
這些公司的主導者,都出自清華大學。論輩分,王小川算是王慧文的師兄,兩人分别畢業于清華的計算機和電子工程專業;智譜 AI 的當家人則是智源研究院學術副院長、清華大學教授唐傑;聆心智能由清華大學計算機系副教授黃民烈創辦;深言科技創始人兼 CEO 豈凡超為清華大學計算機系博士,聯合創始人兼 COO 李潇翔則是清華大學電子系博士……
清華大學人工智能研究院常務副院長、歐洲科學院外籍院士孫茂松同時擔任着深言科技的首席科學家,豈凡超曾說,想和教授交流時,只用走幾百米回學校。
作為中國人工智能教育的起點之一,清華大學為國内大模型行業培養了眾多中流砥柱。除上述企業,幂律智能、面壁智能、生數科技、月之暗面、銜遠科技、一流科技等公司也紛紛帶着清華血統,同樣具備着強大的技術基因和 " 產研投 " 一體化優勢。
新興技術一般存在兩種發展路徑,分别是 TPF(Technology Product Fit)和 PMF(Product Market Fit),TPF 注重發揮技術優勢,PMF 主張重視市場需求。" 大模型本身更傾向于 TPF,所以擁有雄厚研究資源的清華大學,在大模型理論創新和基礎研究上占據天然優勢。"AI 分析師張翊珺告訴時代周報記者。
國家知識產權局和全球科學引文數據庫數據顯示,出自清華大學的大模型相關論文數量位列前三。" 在大家公認擁有自研底座的企業裡,超過一半都有清華系學者的背景。一方面是因為他們本身在技術路線上積累深厚,另一方面也是因為從學者、創業者到投資者,清華系相對抱團。" 啟迪國際技術轉移有限公司副總經理衛冕表示。
雖說将某一群體冠以簡單化标籤不足以反映復雜的現實,但标籤往往強調着特殊性。對内而言,這種特殊性在發揮集群優勢的同時,也會階段性地呈現由 " 群體規範 "" 群體壓力 " 衍生的問題;對外來說,特殊性又代表着競争格局分化和大眾注意力的搶奪。
國内的人工智能研究晚于國外 20 年,不同于國外 Open AI、Anthropic 雙寡頭格局,國内大模型行業仍處于群雄割據時代,相互間緊密又割裂。
一方面,這些明星大模型公司背後站着重合的投資者;另一方面,攜帶不同基因的派别林立,大家在開源與生态、技術信仰等問題上喋喋不休,各執一詞。行業分散,時刻面臨洗牌," 清華系 " 這一标籤帶來的問題也呼之欲出:
他們之間能否實現有效、有序協同,在容錯率較低的行業中一榮俱榮?當下國内絕大多數大模型公司還未經受深度洗禮、無法明晰產品優劣,清華系一脈在有限的資源争奪中,是否會加劇市場的馬太效應?
抱團關鍵詞:技術、資金與人才
清華系大模型公司抱團,表現在稀缺資源的價值取舍裡,最直觀的就是 " 錢 "。
2024 年年初,來自月之暗面的 Kimi 智能助手高舉 "200 萬字長文本處理能力 " 大旗率先出圈,完成 10 億美元新一輪融資,投資人包括阿裡、美團、小紅書、紅杉等大廠和頂級機構。此番融資後,月之暗面估值超百億人民币,跻身 "AI 新五小龍 " 序列。
一位投資人士向時代周報記者稱,月之暗面的融資離不開前金沙江創投管理合夥人張予彤幫忙牽線搭橋。巧的是,作為金沙江創投主管合夥人的朱嘯虎曾不止一次公開表示對大模型的質疑:" 我就不看好大模型。"
該投資人告訴時代周報記者,目前張予彤已從金沙江創投離職,但并未像外界所傳的那樣加入了月之暗面。
與月之暗面創始人楊植麟一樣,張予彤也是清華學子,其最受關注的兩例投資是小紅書和深鑑科技。實際上,作為楊植麟的師姐,張予彤早在 2019 年就投資了楊植麟擔任 CTO 的 AI 銷售中台公司、智能銷售系統、AI 對話分析公司循環智能。
此次楊植麟的大模型創業,從組建團隊到尋找投資人,張予彤也在背後提供了諸多支持。有投資人評價:" 說服巨頭轉變戰略大手筆支持你,并想出一個理想的交易結構都不是一件容易的事。"
在這些大模型初創公司背後的投資方中," 清華系 " 的創投者也充當了重要角色。圖靈創投、卓源資本、清華控股、水木清華校友種子基金、無限基金 SEE Fund 等清華系創投機構頻頻出手,如圖靈創投投了聆心智能、智譜 AI,起源于清華大學 FIT 樓實驗室的卓源資本投了生數科技。
" 清華系大模型公司的抱團建立在信任基石上。" 北京信息化局專家庫信息化專家、工信部人工智能内容創作師認證主講人李桢告訴時代周報記者。
" 開源大模型并不意味着百分百開源,且這些開源的代碼背後都暗藏着模型公司自己的技術邏輯和訓練方法。而這些非公開信息會導致基座模型與嵌套模型間出現一些無法适配的情況,需要雙方配合在基座模型上進行調整,這是業内非常基礎的問題。"
" 解決這項難題需要開源團隊提供技術支持,但往往會面臨技術洩漏的風險。在清華系大模型公司間,這種相互幫扶卻很常見。" 李桢補充道。
" 可以想象到,未來清華系大模型公司間的抱團是更多維的。" 張翊珺稱,當各公司的業務逐漸跑起來,有關產品的調度與供給和交易賬期等問題會更加靈活。
巧妙化解 " 重復造輪子 "
清華系創業者似乎傾向于關注本質,對于競争的思考不多。
清華校友王興曾說:" 太多人關注邊界,而不關注核心。" 清華大模型創業者身上也有類似的氣質,他們将競合視作常态。
從 " 百模大戰 " 時期不難看出,國内大模型產品已陷入同質化。據時代周報不完全統計,截至 2023 年底,國内大模型數量不下 200 個。
百度 CEO 李彥宏曾公開表示:" 國内 200 多個大模型其實都沒有什麼調用量,要開發好用、可用的大模型,存在很高的技術和成本門檻。" 在他看來," 重復造輪子 " 是對社會資源的極大浪費。
" 李彥宏的擔憂不無道理,雖說對大模型的衡量标準很復雜,且各家產品落地場景也不同,但目前通用大模型在消費端的表現主要還是聚焦在内容問答、推理、總結上,并且模型能力的差異不大。" 張翊珺表示,由于語料庫的局限,模型提供的實時性内容太過幹癟,邏輯推理層面也并未達到預期。
2023 年 11 月,在新華社聯合北大發布的《人工智能大模型體驗報告 3.0》中,按照基礎能力指數、智商指數、情商指數、工具提效指數四大測評維度進行設計,測評出綜合能力排名第一的是科大訊飛旗下的星火大模型。
而基于語言理解與生成、知識理解與應用、專業能力、環境适應與安全性等标準的中文通用大模型綜合性評測基準 SuperCLUE,則在同期給出了以下排名:百度的文心一言 4.0 位居榜首,月之暗面的 Moonshot、零一萬物的 Yi-34B-Chat、vivo 的 BlueLM、騰訊的混元、阿裡雲的通義千問 2.0、智譜 AI 的 ChatGLM3 以及字節跳動的雲雀、訊飛星火紛紛緊随其後。
" 在測評标準一定重合的情況下出現并不統一的排名,說明在模型的實際表現中,大家沒有太大差距。" 張翊珺告訴時代周報記者。
事實上,國内大模型公司采用同樣的數據集,相似的訓練方法,對标同樣的對象,确實難以產生多樣化的競争優勢。這對于師承一脈的清華系大模型公司而言,按照常規路線發展無疑會使問題加劇。
" 目前來看,清華系大模型公司的格局是以智譜 AI 為中心,布局人工智能的上下遊。" 關注硬科技賽道的投資人張巍向時代周報記者稱。
時代周報注意到,2024 年 3 月底,致力于打造智能芯片系統的清程極智完成數千萬元人民币首輪融資,中金、中關村智友領投,智譜 AI、北京國管順禧基金、中關村科學城基金等跟投。智譜 AI 持股比例為 2.1673%。
此前,智譜 AI 還投資了清程極智的友商—— AI 大模型軟硬體協同優化平台公司無問芯穹。這兩家企業同屬清華系,清程極智出身清華計算機系,無問芯穹出身清華電子系。
" 行業競賽已經角逐到推理方向,大模型公司都很需要訓練與推理系統的國產化推進,以及技術自主與創新。" 張翊珺表示,智譜正在不斷完善自己的生态圈。
被稱作全線對标 Open AI 的獨角獸企業,智譜不僅在技術和產品上向其看齊,邊融資邊對外投資的思路也如出一轍。智譜 AI CEO 張鵬此前曾表示,希望打造一個大模型生态。把生态圈越做越大,實現更長遠的商業化目标。
據時代周報不完全統計,截至目前智譜 AI 已經投資了十多家 AI 相關創業公司。
會對 " 非清華系 " 造成排擠嗎
清華系大模型公司之所以形成圍繞智譜發展上下遊的有序格局,實則是被動的。張巍稱,各公司間資金實力懸殊,他們普遍囿于資本市場的投資邏輯和有限的資金中。
" 大模型的開發成本是十分昂貴的。主要開銷是人力成本、獲取數據以及清洗費用、電費和硬體費用。" 長期關注 AI 的投資人陳緯表示。
近日,斯坦福 HAI 研究所發布了第七個年度的 AI Index 報告。報告稱,人工智能性能的提高是有代價的。報告發現,前沿人工智能模型的開發成本正變得越來越高—— Gemini Ultra 消耗了價值 1.91 億美元的計算資源,而 GPT-4 的開發成本估計為 7800 萬美元。
該報告還顯示,過去一年 AI 行業吸引了 252 億美元的投資,幾乎是 2022 年投資的 9 倍,是 2019 年投資額的約 30 倍。
" 即便行業内聚集了巨額的資金,但對于大模型這項龐大的工程來說依舊捉襟見肘。" 陳緯補充道。她還表示,當大模型訓練完畢流向用戶,模型廠商還需要承擔用戶產生的算力成本。
" 技術巨頭可以依靠其他業務輸血,創業公司就相對危險了。但一般來看,資本市場能養活的公司往往只有 2 個,參照網約車、本地生活這些賽道,最後只能留下 2 家巨頭。這也是風投機構為什麼不願意廣撒網的原因,押注過多籌碼意味着未來難以退出。"
" 此外,由于行業發展太快,投資視窗期和投資門檻過高也是資金短缺的重要因素。當資本和技術巨頭們都已經選定了合作夥伴,留給其他公司的錢就不多了。" 陳緯補充道。
智譜與 MiniMax 因成立較早,在資金上拿下了先發優勢,随着其估值水漲船高,多位投資人向時代周報記者表示,等想要出手的時候,投資門檻已經相當高了,退出可能需要 5 年以上,大家都不敢冒着整支基金回報的風險去投大模型。
同樣成立較早,分别背靠微軟,Google 與亞馬遜的 OpenAl 和 Anthropic,前者當下估值超 800 億美元,後者估值為 150 億美元,而其他 AI 獨角獸的估值都在百億美元之下。
顯然,在有限的資源下,清華系的有序分工實則是聰明的做法。
一位苦融資久矣的大模型企業創始人向時代周報記者稱:" 在技術差距沒有那麼大的情況下,投資人在選擇标的的時候更看中背書、成功經驗。‘清華系’模型公司一直是投資人的優先選擇對象。" 他認為,有标籤,總歸比籍籍無名好。
" 對于‘清華系’大模型企業和其他企業的資金競争關系上來看,我認為應該站在更宏觀的角度。" 李桢表示," 清華系 " 大模型企業不會對 " 非清華系 " 企業造成擠壓。
他稱:" 國外大模型的開源比較徹底,國内企業在國外模型的基礎上自建模型也可以做出非常高質量的模型。" 他認為,國内大模型企業可以分為很多派别。一類是以阿裡,字節,百度為代表的技術公司系,一類是具備學術基礎學院派,還有具備獨特行業屬性的類似華為系等等。
" 事實上,每家公司都可以因為社會因素、市場因素被劃分至不同的派系,大家都擁有同等的發展機會,都面臨着與國外在數據質量和算力上的差距。" 李桢補充道。
面壁智能 CEO 李大海向時代周報記者稱:" 百花齊放才是春,相較于标籤或許會產生的‘群體規範’,企業更關注整體環境的競争壓力。"
實際上,市場上一直存在稱 " 清華系 " 大模型企業 " 象牙塔味兒 " 太重的聲音。這種聲音來自于各家企業抛開用戶增長與商業拓展,過度地在關鍵數據指标上掰手腕,過多地強調在某些參數和指标的全球排行榜名次,片面依賴論文等學術成果和開源社區表現。
" 判斷大模型企業的商業化是否有前景,要從其產品定價策略、客戶付費能力、產品營銷推廣、人員構成以及收入規模來判斷。" 張巍告訴時代周報記者。
據了解,智譜雙語千億級超大規模預訓練模型 ChatGLM-130B 定價 120 萬元 / 年,ChatGLM-66B 100 萬元 / 年,ChatGLM-32B 50 萬元 / 年,ChatGLM-12B 25 萬元 / 年。智譜 CEO 張鵬此前表示,截至 2023 年 11 月,公司研發相關人員大概占百分之六七十。研發人員裡包含數據、產品、解決方案等等。" 市場人員後續會增加多一些。銷售幾十個人,占比百分之十幾左右。整體上,還是保持研發人員占大比例。" 他稱。
張翊珺表示:"B 端用戶的付費意願要優于 C 端,智譜主要面向 B 端,預計會比 C 端產品更容易落地。大模型的競争力在于好用和便宜,美國解決了第一點,而國内目前兩個都沒有解決。"
但好在,競争壓力會時刻提醒駕馭着學術航母的清華系新秀們,商業的戰場不會優待文質彬彬的學者,此消彼長的參數最終還是要用人民币做計量。