今天小編分享的互聯網經驗:20年蟄伏,低調成就一位大模型領袖,歡迎閱讀。
文 | 第一新聲,作者 / 琳玉
在清華科技園内,國内某知名商業媒體,曾對 " 智譜 AI"CEO 張鵬進行了兩次專訪,值得注意的細節是:去年,張鵬權衡咖啡因的提神效果和劑量,選擇只喝一杯;而今年,一個小時的采訪中,他接連喝了兩杯咖啡……
這一微妙的變化,似乎也暗示着智譜 AI 正在步入更繁忙、更快節奏的階段。近期,整天排滿行程已經是張鵬的工作常态。
實際上,不僅忙,壓力也更大。近日有媒體爆料:大模型 " 六小虎 " 裡,已有至少兩家要放棄大模型!并且," 放棄通用基礎大模型的研發,主要做應用。" 也成為行業熱議的話題。
所有的趨勢都指向兩個字——生存。
當 " 技術浪漫 " 讓位 " 落地求生 ",大模型基座迭代速度越來越慢正在成為行業新的轉捩點,而智譜卻在近期對自研的基座大模型進行了更新。作為 " 技術流 " 出圈的學院派創業企業,張鵬和團隊既不想失了技術底色,又被市場 " 推 " 着不得不加速商業化……
張鵬不否認,在大模型商業化方面,行業有些着急了。但現實是:投入這麼大,結果和大家的預期有差距,所有人都很焦慮。
如今,互聯網大廠、科技大廠紛紛重倉壓注大模型,他們和學院派創業企業有着完全不同的商業化模式。在日益變化的市場環境中,如何一步一步地強化技術底座?解決資金困境?優化商業模式?張鵬不得不反復思考這些沒有标準答案的問題。
煩擾時,或許他也會懷念自己在清華園上學和科研時光。
01
初遇人工智能
1998 年,張鵬參加湖南高考,進入清華大學計算機系。當年計算機系同時入學的還有後來搜狗 COO、百川智能聯合創始人茹立雲等一眾 AI 知名人物。
大模型行業,遍地是天才。
在大模型五虎的幾位掌舵人中,王小川、楊植麟分别是 70 後、90 後天才少年,在學校時已經備受矚目;闫俊傑則從上一代 AI 四小龍商湯科技出走創業,成功接住兩波 AI 浪潮。相比那些年少成名的故事,張鵬創業前的 20 年科研經歷,顯得不那麼閃耀。
上世紀 90 年代末、00 年代初,互聯網已經行至爆發前夜,但人工智能的發展卻還處在理論為主的階段,尚未形成如今我們所理解的 " 大模型 " 概念。
在校期間,張鵬和王小川選擇了完全不同的道路。比張鵬大兩屆的王小川在本科階段成功設計出當時中國的第四大網站,還沒畢業就被張朝陽看中;張鵬則在本碩期間都專注科研,先後發表 10 餘篇頂會文章、設計了國内首個中英文平衡的跨語言知識圖譜系統。
剛進清華時,張鵬也驚嘆于天才們的鋒芒,即使現在提到王小川時,他依然保持着充滿敬意的口吻:" 師兄當年是系裡的風雲人物。"如今看來,當時張鵬默默堅持的科研技術道路,也成為了日後大模型牌桌上論資排輩的關鍵支撐。
1997 年,IBM 的 " 深藍 " 超級并行計算機戰勝國際象棋世界冠軍加裡 · 卡斯帕羅夫事件的出現,對人工智能的發展產生了深遠的影響,推動了計算機在更多領網域的應用和研究,也為行業研究人工智能的應用提供了很大的信心。
在世界人工智能發展氛圍漸濃的環境下,張鵬通過在清華大學深度參與實驗室課題項目很快找到了自己的研究方向—— " 文本數據挖掘和語義分析 "。這一領網域不僅是人工智能研究的核心方向之一,而且在當時被視為前沿且至關重要的研究議題,為後續人工智能技術的突破性進展提供了關鍵支撐。在此期間,他還結識了多位日後成為商業夥伴的重要人物,包括幂律智能的 CEO 塗存超和聆心智能的 CEO 黃民烈,他們均為清華計算機系的同窗。
2002 年,張鵬本科畢業,當時國外知名導師的水平高、條件好,很多人工智能方向的畢業生選擇出國深造,也不少清華畢業生選擇留在谷歌、微軟等互聯網大廠工作。而張鵬在就業和出國等眾多選項下,選擇了繼續在清華計算機系完成研究生學業。
也許是緣分使然,他人生中最重要的合作夥伴——唐傑,也在 2002 年進入清華計算機系攻讀博士學位,從此,兩位人工智能大模型領網域的重要人物,在清華成了同門師兄弟。
02 Aminer 土壤,孕育大模型萌芽
2006 年,唐傑在臨近博士畢業時,意識到科技情報大數據挖掘對于加速科技創新、建設世界科技強國具有重要意義。當時谷歌學術、WOS 數據庫等學術資源發揮了重要作用,而我國卻沒有完全自主知識產權的科技情報分析與挖掘平台……
後來,依托于清華大學計算機系知識工程實驗室(以下簡稱 "Keg" 實驗室)的大數據挖掘與知識圖譜研究,唐傑作為牽頭人,帶領團隊孵化出了 AMiner 系統。AMiner 正是智譜 AI 的前身,唐傑本人也成為智譜 AI 的幾位創始人之一。
唐傑在辦公室
巧合的是,2006 年前後也正是張鵬碩士畢業的時間點,在清華連續修完學士和碩士學位後,張鵬直接進入了 Keg 實驗室工作,也順勢成為 Aminer 項目的一員。此後,Keg 實驗室十餘年間一直是 AMiner 系統的研究陣地,也是張鵬科研陣地,為後續項目成果轉化及商業化提供了重要的支持。
随着内容的豐富度增加,AMiner 系統的影響越來越大。當時的研究工作在學術界獲得了一定的影響力,發表在 2008 年 KDD 上的論文在該會近 10 年所有論文中(約 1600 篇)排名前 5,這進一步激發了 AMiner 團隊的研究熱情。
數據顯示,AMiner 在 2010 年左右已經标記了 448470 個研究者檔案以供搜索。并在國家 863 計劃、973 計劃、國家自然科學基金,以及華為、搜狗、騰訊、阿裡等多個合作項目的支持下,取得了長足的進步,應用于科技部、中國工程院等 20 餘家企事業部門。
在 1998 年至 2018 年的二十年間,張鵬一直專注于學業與科研,深入研習人工智能及大模型相關的專業課程,依托 AMiner 在文本數據挖掘和語義分析領網域取得量顯著的成果。
在此期間,世界人工智能也在應用上實現了跨越式發展:2012 年,谷歌深度學習團隊開發 AlexNet 的深度神經網絡模型、無監督預訓練的語言模型開始出現和發展、GPU 架構實現了從早期的固定功能 GPU 到可編程 GPU,再到支持高級着色器模型和并行計算能力的現代 GPU 的轉變。
回憶起在學校和實驗室的經歷,張鵬最懷念的,除了實驗室中的同窗情誼,還有年輕人們沉浸在國際頂尖的科技中,雙眼因同樣的情懷而閃亮——希望學術成果可以走出實驗室,為國家、為社會解決實際的問題。
而張鵬也在很早的階段就意識到了理論和實際的結合:" 人工智能本身是門實踐性科學,講究理論和工程落地結合。"2013 年,AMiner 平台的商業化應用便提上了日程。
2018 年,國家部委發文鼓勵科研人員将知識成果轉化落地,并提出了指導意見,這為清華大學的科研人員們提供了新的思路,也鼓勵他們做出嘗試。借此契機,張鵬和創始團隊希望 AMiner 能夠在他們手裡發揮出更大的潛力。
此時,一個大模型龍頭公司正在醞釀,張鵬也将迎來人生中最重要的轉捩點……
03 掌舵中國最像 OpenAI 的公司
或許,留在實驗室作為一位專注于科研的 " 謝耳朵 ",本是一條光明且安穩的道路。但對于張鵬而言,從研究室邁向商業世界的決定,卻無疑是一場更具挑戰意義的冒險。
2018 年,大模型舞台上的一個裡程碑時刻悄然降臨—— Open AI 發布第一代 GPT。立即激發了業界的合作熱情與交流活力。其他 AI 公司和研究機構紛紛跟進,推出了自己的預訓練語言模型。
在此背景下,Aminer 系統的商業化意願也更加強烈。2019 年 6 月,在清華一眾資深教授和 Keg 實驗室的支持下,明星產品 AMiner 單獨拆分,清華大學教授李涓子、唐傑等人,共同成立了新公司——智譜 .AI。清華大學計算機系教授、中國科學院院士張钹擔任首席顧問,中科院計算所博士、清華數據科學研究院科技大數據研究中心副主任劉德兵擔任董事長。
強大的創始團隊,奠定了後來智譜 AI 在行業的地位。當時許多曾經在清華學習過的同學紛紛選擇加入智譜 AI,有人甚至為此辭掉了國外頂級公司的工作。創立時候的 30 人團隊,在後來頂峰時期甚至超過了 700 人。
公司成立之初,智譜 AI 的資源有限,主要還是清華圈子裡的政界、投資界、創業界的清華校友。那個時候,有一點可以确認:他們擁有國内最先進的技術。正如張鵬講到:" 核心的技術是求不來也買不來的,當時大家焦慮的是,‘ AI 四小龍’已經把上一代人工智能技術落地的路徑,‘蹚’得差不多,下一代突破口在哪?"
彼時,張鵬的職位是智譜 .AI 的 CTO,還不屬于核心創始團隊的成員,後來随着公司的發展,張鵬走向前台,成為公司 CEO,逐漸轉變為掌舵人。
也許冥冥之中自有巧合,2020 年 OpenAI 的 GPT-3 發布日期和智譜 AI 成一周年的司慶日剛好同期。司慶日當天,張钹院士作為受邀嘉賓來到智譜 AI 座談。張鵬建議,與借此機會深入探讨新發布的 GPT-3。受 GPT-3 的 1750 億參數規模啟發,智譜 AI 更加堅定了研發稠密基座模型的決心。
自同年起,智譜 AI 把 OpenAI 作為自己的對标對象,開始規劃自己的超大規模預訓練模型。也許是保留了學者時期的 " 技術浪漫 " 和 " 科研潔癖 ",在研究了市面上主流的幾種預訓練框架後,張鵬和團隊還是選擇了自研預訓練架構。
" 主流的幾種預訓練框架,BERT、GPT 和 T5,都來自國外公司。不同的訓練框架,在不同維度上擅長的能力不同,各自有适合的任務和場景。把它們各自的優點結合起來,泛化出更多能力,是自研 GLM 預訓練架構的出發點。" 張鵬解釋說。
2021 年,智譜 AI 團隊開始訓練千億參數模型 GLM-130B。國内當時少有企業涉及這項業務,國外的可借鑑資源又不足,能不能做成,張鵬也沒有底。但可喜的是," 在許多具有百萬參數甚至更少訓練步驟的基準測試中,GLM 在自然語言理解方面,實現了比 BERT 和 T5 更好的性能。這給了我們信心。" 張鵬說到。
後來,智譜 AI 使用了一些其他模型架構,成功訓練出了一個萬億參數模型。慢慢的也讓智譜成為 " 中國最像 OpenAI 的公司。"
04 融資超 50 億,破解 " 資金難題 "
模型問題解決後,智譜又遇到另一個非常棘手的問題——資金。
對于創業公司而言,模型訓練工程層面上涉及到的資源、團隊、訓練數據等每一項都需要非常大的投入。巨大的成本消耗之下,數據不足、算力不夠與模型實用有效性之間,陷入權衡困境。
當時,已有 AI 公司尋求與《衛報》等新聞集團等媒體合作,用其授權文章訓練模型,年合作費甚至可達數千萬美元。也有公司用現成的大模型生成内容再訓練,但效果不一。要想把模型做出來,成本巨大,張鵬和團隊在當時下了很大的決心。
2020 至 2022 年階段,資本市場對大模型并未展現出顯著的興趣,後來的 " 大模型五虎 " 也都是在 2022 年之後才獲得巨額融資。智譜同樣如此,在擁有主導金錢流向的能力之前,公司與資本的關系曾一度緊張,這也讓張鵬感到非常焦慮。
公司發展初期,曾獲得中科創新的早期投資。然而,在大模型興起之前,但在大模型爆火前,中科創星退出了持有的 25% 股份,這對本就資金拮據的智譜 AI 來說無疑是一記重創。中科創新此舉除了因基金到期外,更深層的原因是機構高層對智譜 AI 乃至整個 AI 市場前景持悲觀态度。彼時,中科創星甚至從 2021 年起就撤掉了 AI 投資組,雙方因此產生了嫌隙。
回憶起資金困難的時候,張鵬笑談到:" 當初一個有趣場景是,公司一只眼看着訓練的數據量輸入越來越少,另一只眼看着銀行賬戶上的儲備現金輸出越來越多。"
好在很快,便迎來了轉機。
在大的轉折面前,很難說是英雄造實勢,還是實勢造英雄。當時智譜 AI 為匹配 " 千億規模模型 " 算力需求,多次尋找談判無果,最終碰巧發現一家國内雲服務供應商閒置了一批 2020 年采購的 GPU 芯片。這批低價算力恰好滿足智譜 AI 的急需,後續公司又結合模型壓縮、量化、加速等技術,成功降低了大概 90% 的成本,順利度過難關。
所謂好事成雙。不久後,2022 年 11 月,斯坦福大學大模型中心對全球 30 個主流大模型進行全方位評測。智譜 AI 的 GLM-130B 成為 2022 年亞洲唯一入選斯坦福評測的全球主流大模型。
至此,智譜 AI 被推向了行業最前端,智譜 AI 的名字,出現在百度、字節、360、有道等企業的合作名單中。
緊接着,2023 年初,ChatGPT 火爆之後,投資圈也敏銳地捕捉到了大模型訊号。之前融資時,張鵬團隊和投資人聊,需要把大模型的方方面面解釋得非常清楚,才會有一些機構感興趣。" 但(那年)過完春節,大家對大模型的态度,跟之前比有 180 度的大掉頭。" 張鵬說到,熱度最高的時候,每天要接待三波投資人,還有不少前來學習的大模型團隊。
2023 年,智譜 AI 成功融資超過 25 億人民币,僅用一兩年的時間便成功扭轉了資金困境的局面。回過頭去看,張鵬一直在總結,他認為智譜 AI 被投資人認可主要有三點原因:一是大模型認知深刻,擁有核心技術,二是團隊長期合作,技術產品轉化快;三是團隊商業化在當時相對成熟。
張鵬曾談及在科研圈和創業圈的最大區别就是 " 算賬 ",在學校做科研的時候,更多的是憑興趣、意義、價值、創新性來考慮問題,很少去看錢。但到了公司後,學會了精打細算,所有成本的投入轉化成收益的賬也要算清楚。
到 2024 年,智譜已經累計融資 50 億 +,估值超過 200 億。資金不再是張鵬的焦慮點,真正的挑戰在于如何在這場沒有終點的馬拉松中,持續領跑。在他的心中,還有無數本待解的 " 賬 ",每一筆都書寫着對未來的深思熟慮……
05 站高望遠,為行業造夢
随着行業的火爆,随之而來的必然是入局者的增多與競争的加劇。在國内,尤其在資本湧入和互聯網大廠、科技大廠加入後,大模型發展速度和行業格局都發生了非常明顯的改變。
張鵬發現在 2023 年初的時候,行業對大模型的應用都幾乎沒有預期,到這一兩年,預期變得超級高,特别是關于 Super APP 的讨論。" 很多紀錄都是在這兩三年被打破了——最快達到 1 億用戶的 APP,(ChatGPT)單體應用日活已經快趕上 Google 了,我覺得這個很恐怖。"
但更恐怖的是,在所有大模型企業都尚未盈利時,行業又打起了價格戰。今年五月份的一場大模型價格戰幾乎讓所有主流大模型企業無一幸免。阿裡、字節、百度、騰訊、科大訊飛相繼官宣大幅降價,大模型價格一夜之間下降了 90% 左右。
這場價格戰對創業公司非常不友好。
創業公司和大廠的容虧率存在天然的差異,也是因此,當時幾乎所有的創業公司都不願意參與其中。鋒芒畢露的王小川甚至用 " 吃瓜看熱鬧 " 的心态對待這輪價格戰。但實際上,後來智譜、月之暗面、mini Max 都有不同程度的降價。甚至開始态度最堅定的王小川後來也發生了轉變。
這場價格戰到現在仍在持續,單純降價如何實現長足的發展?行業開始進行商業模式的創新思考。
2023 是 " 大模型爆發元年 ",2024 是 " 大模型應用爆發元年 " 行業如此總結。正如本文開頭所言,大模型公司正逐漸将重心轉向應用開發,相應地減少了對基礎大模型的投入。商業化提速、再提速成為行業底色,幾乎所有的企業都在被 " 推 " 着往前跑。
2023 年,智譜的合同銷售額上億,成為行業天花板。但在今年,智譜在訂單獲取方面同樣遭遇了挑戰。張鵬和團隊意識到,純粹的技術研發和傳統的商業化模式已經難以讓創業公司實現可持續發展發展。2024 年,在張鵬的帶領下,智譜 AI 進行了多次調整策略、團隊擴張,實施融資優化和商業化提速後,最終," 構建大模型生态 " 成為智譜在 2024 年的重要主題。
張鵬認為,僅僅只有強大基座模型是不夠的,只有打通大模型產業生态圈上下遊,與客戶、不同生态位的合作夥伴一道,才能推動中國人工智能產業全面發展。
以構建大模型生态為更長遠的商業化目标,智譜在 2024 年主要開啟了兩個重要項目:" 開源開放的大模型開源基金 " 和 "Z 計劃 "。
" 開源開放的大模型開源基金 "包括三個 "1000":為大模型開源社區提供 1000 張計算卡助力開源開發;提供 1000 萬元現金用支持開源項目;為優秀開源開發者提供 1000 億免費 API tokens。
"Z 計劃 "則面對全球大模型創業者,聯合生态夥伴發起總額 10 億元的大模型創業基金用于支持原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等方向。目前共鏈接 1200+ 大模型賽道初創企業 / 開發者團隊,前後累計投資與孵化有 50+ 家。
8 月 4 日,張鵬親自參加了 "Z 計劃 " 企業的路演日。當天,25 家 Z 計劃企業逐一進行了五分鍾的路演,一時間," 拿融資的标的項目 " 和 " 眾多 AI 項目的金主 " 兩種截然不同的身份同時存在于一家初創企業身上。台下張鵬的角色也悄然發生了變化,從昔日的 " 被選擇者 " 轉變為了今日的 " 選擇方 "。這種獨特的現象,在當前國内創投界除了智譜 AI 也是絕無僅有。
" 智譜做好 L0 的層面,賦能夥伴和客戶做好 L1 和 L2。而中國的人工智能事業要繁榮、要發展,需要所有的參與者、產業鏈上下遊合作夥伴、開發者社區和學術界的共同努力。" 張鵬為大模型行業編織了一個美好的夢。
誰願攜手入夢,國產大模型能否締造一個美麗新世界,我們拭目以待。