今天小編分享的互聯網經驗:這個清華學霸,邊玩搖滾邊搞了一家180億估值的AI公司,歡迎閲讀。
圖片來源 @視覺中國
文 | 藍鲨硬科技
自 2023 年 3 月成立起,中國通用人工智能(AGI)公司 " 月之暗面 "(MoonShot AI)便不斷憑借優秀的大模型產品及獲得的巨額市場融資引發廣泛關注。
成立後,月之暗面就迅速完成首輪融資,獲得紅杉中國、真格基金等一線 VC 的押注。2023 年 10 月,成立僅半年的月之暗面宣布在 " 長文本 " 領網域實現了突破,推出了首個支持輸入 20 萬漢字的智能助手產品 Kimi Chat。這是目前全球市場上能夠產品化使用的大模型服務中所能支持的最長上下文輸入長度,标志着月之暗面在這一重要技術上達到了世界領先水平。
近日,月之暗面又完成了超 10 億美元新一輪融資,投資方包括紅杉中國、小紅書、美團、阿裏,老股東跟投。這是國内 AI 大模型公司迄今獲得的單輪最大金額融資。成立不到一年,月之暗面估值已達約 25 億美金,已成為國内大模型領網域的頭部企業之一。
而締造這個傳奇故事的傳奇人物,正是這家公司的主要創始人——楊植麟。他是年輕的學院派創業者,創業的同時,也是清華大學交叉信息學院助理教授、智源青年科學家。2015 年從清華計算機系畢業後,楊植麟前往美國卡内基梅隆大學攻讀博士,師從蘋果 AI 研究負責人 Ruslan Salakhutdinov 和谷歌首席科學家 William Cohen。其學術論文在華人學者引用排名中位居前 10,在 40 歲以下排名第一。
楊植麟
據傳,去年三四月份,字節跳動創始人張一鳴頻繁約人補課 AI,其中最為矚目的就是他頻頻請教 " 後生 " 楊植麟。而去年 6 月,科技媒體 The Information 盤點了中國 AI 初創企業 Top5,分别為 MiniMax、瀾舟科技、智譜 AI、光年之外(已被美團收購)以及楊植麟。作為唯一一位以個人身份入榜的選手,可見楊植麟在自研語言處理(NLP)領網域有相當大的影響力。
如今才 31 歲的楊植麟,是如何一路走出開挂般的生涯的?
01 獨立自主成長,初顯編程天賦
出生于 1993 年的楊植麟是廣東汕頭人。得益于父母開放的教育理念,楊植麟的成長環境一直擁有很大的自主性。從小到大,幾乎所有重要選擇,都是他自己決定的。沒有學業分數枷鎖的楊植麟,曾一度夢想成為搖滾明星或是流浪詩人,玩便痛快玩、學便認真學是他一貫的作風。
汕頭金山中學
楊植麟高中就讀于汕頭金山中學。金山中學的學習方式相對人性化,擁有豐富多元的社團活動,也寬容學生個性的存在,給了楊植麟許多自由成長的空間。高中期間,楊植麟就展露出自己的天分,在沒有任何編程基礎的情況下,被選拔入信息學奧林匹克競賽培訓班,并在全國青少年信息學奧林匹克聯賽中奪得廣東賽區一等獎,因此獲得了清華大學保送生資格。
02 深耕學術界,青年科學家的誕生,入讀清華,追求極致
進入清華大學後,為了探索更多可能性,楊植麟一開始學的并不是計算機專業。大二時,楊植麟發覺自己對計算機的興趣更為濃厚,随後轉入計算機系。
清華時期的楊植麟
村上春樹一本小説中有一個程式員的角色,楊植麟對深夜寫代碼讓技術落地這件事印象深刻,并充滿憧憬。在當時的他看來,計算機領網域特别是人工智能技術,是發展最活躍的領網域之一,具有重要的現實意義,用寫代碼改變世界、行俠仗義也很酷。而後來發生的一切,讓他覺得轉到計算機系是生命中最正确和重要的決定。
在清華園裏,楊植麟一直被光環籠罩,許多院系的師生都耳聞他的大名。在校期間,楊植麟成績保持年級第一,10 門專業課取得滿分,所有專業課成績在 90 分以上;獲邀在國際頂級期刊發表論文,并以一作身份在國際頂級會議 WSDM 和 CIKM 發表論文,提出的算法被騰訊、華為等企業應用;在 DREAM9 全球癌症預測大賽獲得第一名,為提升癌症治愈率做出了貢獻。
指導楊植麟創造這段輝煌歷史的,是清華大學計算機系的唐傑教授。唐教授是中國人工智能和大模型領網域頗具話語權和聲量的學術領軍人物,彼時全球最大的萬億級超大規模預訓練模型悟道 2.0 正是由唐教授主導開發的。對于楊植麟而言,唐教授不僅是學術領路人,還是自己人生的精神導師。他一直記得唐教授常常強調的 " 咖啡 " 精神:" 做學問要像喝咖啡一樣上瘾。" 他們對做學問都飽含着帶有終極價值色彩的純粹熱愛。
而另一位恩師,大多數時候則在鎂光燈之外。她是清華大學計算機系教學辦主任馬昱春教授。在楊植麟轉系初期,有一段比較迷茫的時光,馬教授為他分析了情況、提出了建議,并将他推薦給了唐傑教授。馬教授始終關心着楊植麟的工作生活,在許多關鍵時間點都給了他十分重要的幫助。
在計算機系,楊植麟不僅擁有領路的恩師,還結識了很多志同道合的摯友,在研究生涯中并肩戰鬥、互相打氣。楊植麟回憶當時在學校參加的比賽,最有趣的一次是阿裏巴巴天池平台組織的一個數據挖掘比賽。比賽結束前的最後一個晚上,楊植麟團隊在 public leaderboard 上是第二名,和第一名只差了千分之幾。當天晚上,楊植麟團隊加了很多 feature 并優化了模型,然而,因為沒控制好内存,凌晨進行的一個實驗導致伺服器崩潰,許多檔案丢失,時間緊迫搶救失敗,沒能拿下第一。雖然有遺憾,但每個比賽的過程,對于楊植麟都很有意義。
清華大學對楊植麟最深的影響就是追求極致的理念和行勝于言的精神。高手雲集的賽場,容易遇到強者,楊植麟的應對方式正是找準一個方向做深度探索,而不是一味追求廣度;同時,他認為要着重探索從做研究的 " 言 " 到實際應用的 " 行 " 的轉化,将理論和技術相結合。這成為他後續研究學習和創業歷程中的精神引領。
繁重的學業之餘,楊植麟沒有放棄自小對音樂的熱愛,組建了校園搖滾樂隊 Splay,當起了鼓手和詞曲作者。樂隊名字取自數據結構 Splay Tree,樂隊不僅參加了校内大型演出,還晉級了校園歌手大賽復賽。
當時的楊植麟和夥伴們感受着來自現實的壓力和來自大環境的荒誕感,音樂成為他們表達情緒的出口。他們的一首原創歌曲描寫了一個創業成功、一夜暴富的白日夢,雖是與圈子裏很多做着階級跨越努力的人們共情,但也想表達對自己不要成為過于功利的人的希望。
清華大學 2014 大學生特等獎學金答辯現場,楊植麟的親友團
楊植麟打破了世俗中對 " 學神 " 标籤化的刻板認識,在學術研究的沉靜和搖滾音樂的活力間切換自如,積極投身不同文化、不同領網域的交流活動,書寫了優秀的成績單。在清華大學 2014 大學生特等獎學金答辯現場,他的親友團拉出助力橫幅:" 計原網原積本求原,滾奏壓奏鸾鳴鳳奏 ",正是他清華生涯的生動寫照。
赴美深造,一路 " 開挂 "
完成本科階段學業後,楊植麟前往美國卡内基梅隆大學攻讀博士,師從蘋果首任 AI 總監 Ruslan Salakhutdinov 和谷歌首席科學家 William W. Cohen,并曾經效力于谷歌大腦研究院和 Facebook 人工智能研究院,與多位圖靈獎得主合作發表論文。
博士期間,楊植麟取得了一系列令人驚嘆的科研成果:在 ICLR、NeurIPS、ICML 等頂級會議發表論文二十餘篇,2017、2018 年連續入選機器學習和自然語言處理領網域的論文發表統計數據一作全球排行榜(全球僅有三名學者兩年皆入選);先後以一作身份,發表 Transformer-XL 和 XLNet 兩項工作,谷歌學術被引次數近兩萬;Transformer-XL 成為首個全面超越 RNN 的注意力語言模型,XLNet 則在 20 項任務上超越谷歌 BERT 模型;榮獲 Nvidia 先鋒研究獎、Facebook ParlAI 研究獎、Nvidia 獎學金等。楊植麟以及團隊的研究曾經在半監督學習、自然語言理解的十餘個标準數據集上取得世界第一,并同時在所有六個主流語言建模數據集上保持世界紀錄(State-of-the-Art, SotA),產生了廣泛的影響力。
楊植麟的谷歌學術論文被引主頁
這些戰果背後,是日積月累的沉澱和細水長流的付出。許多科研人員或許都和楊植麟一樣,經歷過睡覺、走路時都在思考如何解決實驗問題的情形。楊植麟經常與同學朋友探讨相關研究,而很多靈感會在這些讨論中閃現,比如 HotpotQA 就是他和朋友在紐約的一家火鍋店迸發出的想法。
楊植麟博士期間的兩位導師都是 " 科學家加盟大廠 " 的典型。導師之一的 Ruslan Salakhutdinov 和楊植麟一樣,在年輕時便展露出了在機器學習領網域的天才,就讀博士期間便成為深度學習歷史上最重要的标志性論文之一——發布在 Nature 雜志上的《Reducing the Dimensionality of Data with Neural Networks》的第二作者。
另一位導師 William W. Cohen 曾是國際機器學習學會主席,憑借優秀的論文成果獲得 2008 the SIGMOD "Test of Time" Award 和 the 2014 SIGIR "Test of Time" Award,持有七項關于信息集成和機器學習的專利,并發表了 200 多篇論文。
博導 Ruslan Salakhutdinov(右)、楊(中)、博導 William Cohen(左)
兩位導師一直活躍在科技前沿領網域,與楊植麟一起完成了多項研究,共同提出了瞄準 softmax 瓶頸問題的新方法 Mixtape 等,是優秀的技術貢獻者。而在與導師研學的過程中,他意識到兩位老師更多的是在做基礎研究工作、賦能大廠業務,而不是推動 AI 落地,引發了他後續進行創業的想法。
2019 年,楊植麟僅花費 4 年時間便從卡内基梅隆大學博士畢業,而這所大學計算機專業的博士生往往要經過六年才能畢業。在他看來,能夠在如此短的時間内畢業,最重要的是快速迭代。科研工作中,不可能每個想法都正确,他説:" 我之前有個規律,就是把我的所有結果都寫到 Google Spreadsheet 裏面,然後就發現每當寫四五百行或者 1000 行,就會有一個 positive 的結果。所以這就意味着,產出結果的速度,取決于你迭代的速度,你要迭代得足夠快,才有可能快速地出結果。"
03 逐鹿大模型,打破學術與工業的壁壘
博士畢業後,楊植麟放棄了任教美國斯坦福和普林斯頓的可能和 Google、Facebook、華為等大廠的高薪 offer,毅然選擇回國創業。
他説:" 我最喜歡的一句話就是‘下君盡人之能,中君盡人之力,上君盡人之智’。創業你可以通過招很多很厲害的人,并且有一個組織化的方式讓他們各盡其才,以此來實現指數增長。"
首次創業,創立 " 循環智能 "(Recurrent.AI)
2016 年,楊植麟尚在博士二年級,就開啓了他的第一次創業,與幾位朋友聯合創立了自然語言處理領網域的 AI 獨角獸企業—— " 循環智能 "(Recurrent.AI)。公司主要業務是運用 NLP、語音、多模态、大模型等 AI 技術打造 " 銷售科技 " 方案,2020 年獲得了由紅杉中國領投的 1200 萬美元融資。
循環智能致力于分析企業與客户的溝通數據,判斷客户的成單意向,歸納出最有效的溝通話術,提升整個企業銷售流程的轉化率。與大廠產品相比,大廠一般都是通用的接口,不會對客户產生直接的價值,而循環智能使用了 Transformer-XL 算法,提供了一個端到端的解決方案。
2021 年,循環智能與華為雲合作開發了千億級 NLP 大模型盤古大模型,涉及 NLP、CV 等多個方向,在部分實際場景中達到了優于 Bert 與 GPT 系列的效果。同時,楊植麟還抽身主導了智譜 AI、智源研究院、清華研究團隊的多個 AI 項目。此外,楊植麟入選了北京智源人工智能研究院公布的 2019 年度 " 智源青年科學家 " 名單,在所有入選者中,他是最年輕的、也是唯一的 "90 後 "。
楊植麟參加北京智源人工智能研究院分享會
在參與華為雲盤古大模型開發和智源研究院悟道大模型研發的過程中,楊植麟更加确定了創業的想法:" 這兩段經歷,讓我了解了大模型研發過程中各種可能的問題,并且積累了經驗。但是這種合作方式也讓我意識到,你可能只有自己創建一家公司才能真正意義上去實現這個目标。"
再次創業,創立 " 月之暗面 "(MoonShot AI)
2023 年 3 月,楊植麟最喜歡的一張專輯——英國搖滾樂隊平克 · 弗洛伊德的《The Dark Side of the Moon(月之暗面)》,發布 50 周年;同月,楊植麟創辦的第二家同名公司 " 月之暗面 "(MoonShot AI)成立。月球的暗面在地球人的目光難以企及之處,象征着神秘與未知,而這家公司的願景就是探索人工智能領網域的未知。
月之暗面吸納了許多出色的人才:除了楊植麟,兩位聯合創始人周昕宇和吳育昕也出身清華。團隊包括來自 Google、Meta、Amazon 等巨頭的海外人才,許多團隊成員有訓練超大模型的經驗,參與了 Google 人工智能模型 Gemini 、國内最早的大模型悟道、盤古等系統的開發工作;此外,還有擁有幾億 DAU 產品經驗的成員加入。
楊植麟希望通過高密度的人才環境和高水平的組織力量,打造出一個快速迭代的組織機器,能夠快速基于現有開發能力和未來發展出的技術,創造出更好的產品。憑借楊植麟團隊的學術能力和創業實踐背景,月之暗面成為了投資機構競相追逐的明星項目。
而楊植麟也沒有讓人工智能行業和資本市場失望,月之暗面成立半年後推出的 Kimi Chat,在文本處理長度上遙遙領先,成為全球市場上最具競争力的大模型服務之一。
04 初心向未來,期待 " 登月 " 革新成果
成立月之暗面,楊植麟的初心是探索未知、與用户共創通用化的應用場景以及創造個性化的普惠 AI。月之暗面希望比 OpenAI 更關心用户,注重客户體驗,跨越信任障礙,通過用户的互動過程以及用户數據的 scale up 超越 base model 自身。
楊植麟認為,随着 AI 技術的成熟,未來的 AI 產品将不再依賴于微調,而是通過強大的上下文一致性和指令跟随能力來實現個性化。他相信,用户跟模型的互動歷史就是最好的個性化過程。