今天小編分享的科學經驗:李開復麾下大模型公司零一萬物上線,數十位核心成員就位,歡迎閲讀。
誰是中國最具競争力的大模型創業夢之隊?
零一萬物。
沒錯,至少從今天開始,這個名字将開啓被關注、被讨論、被追蹤的新階段。
原因無他——這就是李開復博士 " 撸起袖子 " 親自帶隊,塔尖孵化的 AI2.0 公司。今年 3 月下旬,創新工場董事長兼 CEO 李開復正式宣布以 Project AI2.0 之名入局大模型……而零一萬物,正是這家創業公司的正式公司名,官網 01.AI 也在今日一并上線。
量子位獲悉,在近 3 個月的籌辦後,零一萬物也有了一系列進展,包括:
公司:總部注冊于北京,但面向全球招募頂尖人才。
路線:自研大模型。自建平台,構建數千卡 GPU 集群進行訓練、調優和推理,提高數據有效參數量,以及使用的高質量數據的密度,以構建連續、可控、科學化的訓練能力。
進展:三個月内已經實現百億參數規模的模型内測,正往 300 到 700 億參數規模擴大。
據悉,短短 3 個月内,零一萬物已經聚集起了數十名核心成員的團隊,集中在大模型技術、人工智能算法、自然語言處理、系統架構、算力架構、數據安全、產品研發等領網域。其中已加入的聯創團隊成員包含前阿裏巴巴副總裁、前百度副總裁、前滴滴 / 百度首席算法負責人、前谷歌中國高管、前微軟 /SAP/Cisco/ 副總裁,算法和產品團隊背景均來自國内外大廠。
從 25 年前回國創辦微軟亞洲研究院開始,開復老師就成為中國計算機產業裏最知名的導師和伯樂,客觀上助推了中國互聯網和 AI 的發展歷程。
現如今,站在大模型洶湧關口、AI2.0 潮頭,曾經的學生、舊部和仰慕者再次追随集結。
零一萬物是李開復創辦的創新工場 AI 工程院塔尖孵化的第七家公司。這種特殊打法将用基金投資和塔尖孵化兩個途徑結合,加速打造 AI 2.0 的全新創業生态。
零一萬物,自研通用大模型
公開工商資料顯示,北京零一萬物科技有限公司 (以下簡稱零一萬物)于 5 月 16 日成立,彼時距離李開復朋友圈官宣親自入局大模型創業,恰是 2 個月時間。
" 零一萬物 " 作何解釋?
零一不難理解,計算機的底層規則二進制,01 就是工程師的母語。但量子位進一步聽聞,在開復看來,零一—— 01 還代表的是整個數字世界,從零到一,乃至宇宙萬物,所謂道生一……生萬物,寓意 " 零一智能,萬物賦能 " 的雄心。
工商信息還顯示,零一萬物的經營範圍涵蓋人工智能雙創服務平台、人工智能基礎資源與技術平台、工程和技術研究和試驗發展、數據處理服務等。
這個範圍也與開復關于 AI2.0 的思考判斷一以貫之,在 ChatGPT 帶動大模型熱潮之後,李開復就公開表示過,以基座大模型為突破的 AI 2.0 時代,将掀起技術、平台到應用多個層面的革命。如同 Windows 帶動了 PC 普及,Android 催生了移動互聯網的生态,AI2.0 将誕生比移動互聯網大十倍的平台機會,将把既有的軟體、使用界面和應用重寫一次,也将誕生新一批 AI-first 的應用,并催生由 AI 主導的商業模式。
更多零一萬物的業務細節也對外披露:
理念就是AI-first,驅動力是技術願景,背靠卓越的中國工程底藴,突破點是基座大模型,覆蓋範圍包含技術、平台到應用多個層面。
更具體的,零一萬物選擇的大模型創業路線,是自研大模型。
并且已經拉開序幕——這家公司已經開始搭建實驗平台,構建了個數千卡 GPU 集群,進行訓練、調優和推理。在數據方面,主打一個提高有效參數量和使用的高質量數據密度。
從喊話到露面,這 3 個月裏,零一萬物已經實現了百億參數規模的模型内測,正往 300-700 億參數規模擴大,未來還計劃推出開源的模型版本。
據悉,通用大模型後,零一萬物的下一步是推出結合圖片、視頻、3D 的多模态模型。
入口級的 Super App 也是計劃中的一部分,平台中間件和開發者工具也将逐步對外發布。
同時曝出的,還有零一萬物在 AI 2.0 時代的" 七大模塊技術路線 "。
簡而言之,零一萬物認為要做出大模型平台,需要招募七大方向的頂級科學家和工程師,分别是:
定義模型能力天花板的預訓練框架(Pre-train)技術
精進模型實現能力的 Post-train 技術
支撐模型高效訓練的 AI Infra 技術
更多元化多介質的多模态模型技術
實踐訓練規模化技術
平台中間件及工具鏈技術
推理和服務部署技術
基于這 7 個技術模塊,零一萬物針對性招募了技術團隊。
量子位獲悉,該團隊目前已經有數十名核心成員就位,算法和產品團隊背景均來自國内外大廠,集中在大模型技術、人工智能算法、自然語言處理、系統架構、算力架構、數據安全、產品研發等領網域。
有精兵也有強将,從已确認加入的聯創團隊陣容來看,頗有 "AI 2.0 夢之隊 " 的味道:
前阿裏巴巴副總裁、前百度副總裁、前滴滴 / 百度首席算法負責人、前谷歌中國高管、前微軟 /SAP/Cisco/ 副總裁……
可以説,核心團隊深度參與過世界最大幾家軟體平台的構建。
中國大模型演進帳 3 階段,塔尖視野才能人盡其用
自開啓零一萬物的塔尖孵化後,開復老師也開啓了緊鑼密鼓的籌備模式,十足忙碌,也十足低調。
但量子位也獲知了其對于大模型演進的最新思考判斷。在李開復看來,中國大語言模型的演進不會一步到位,而是會經歷 L1 到 L3 三個階段。
現階段,中國大多數公司處于 L1 階段,下一步需要跨越 " 湧現 " 門檻,成為 L2 級主流大語言模型,最後追趕 L3 全球一線公司,成為強大的 AI 2.0" 技術基礎設施 ",實現高質量、高性能的目标。
而零一萬物之所以選擇自研大模型之路,核心原因還在于開源模型和小模型的技術實現,絕對無法達到與海外大廠自研模型的性能。
從現階段實際體驗看,許多聲稱效果類似 ChatGPT 的開源模型,都只局限于簡單對話,在長文本生成和推理等任務上受到模型本身結構和大小的限制,無法适應稍微泛化或復雜的任務。
此外在零一萬物内部,還認定從中長期發展看,過度依賴模型意味着只能知道結果,不掌握過程," 知其然不知其所以然 "。自身能力天花板和邊界被他人定義,很快會碰到實現多種多樣任務的能力天花板。海内外國情、文化、用户習慣、法律法規也不盡相同,海外開源技術随時有關停、切換高額收費或限制地區訪問等風險。
只有充分結合中文語言數據,才能實現 AI2.0 發展自主可控。
不過,零一萬物方面也透露,未來也計劃推出開源的模型版本,吸引優秀人才共同提升模型,推動全球 AI 2.0 的開發者生态。因此,大模型創業公司應該擁抱開源,但不能過度依賴于開源模型。只有盡快建立自己的技術優勢,構建起強大的生态護城河,才能真正抓住 AI2.0 的歷史機遇。
李開復認為,大模型公司的多元化,會催生一波從 AI 2.0 模型、AI 2.0 基礎設施、到 AI 2.0 全新應用的創新生态," 我們預測一旦中國有了真正原生、高質量的大模型推出,高質量和有創意的應用會百花齊放——就宛如移動互聯網和 AI 1.0 時代一樣。"
全球市場上将出現少數幾家具有豐沛資源支撐算力需求的大模型公司,帶動各種下遊應用的繁榮發展,逐步完善中國 AI 2.0 的全新生态,探索嶄新的商業模式,進而創造巨大的經濟價值及社會價值。" 如果市場風平浪靜或只有少數玩家,那我們才真的需要擔心落于人後。"
李開復還認為,AI2.0 市場規模巨大,容納得下巨頭、中小企業、初創公司在三個層級的公司賽馬。
但 " 大模型的技術門檻很高,非常需要整合一個兼具科研能力和開發實力的高效團隊,制定貫徹公司的技術和產品戰略,從上到下一致執行。"
客觀來看,中國現在研發突破也許落後幾年,但擅長技術迭代且具極其優異的工程能力和執行速度,未來可期。和大廠相比,技術頂尖、能專注掌握大模型打法的創業公司有着集中資源、策略靈活、能打硬仗、落地執行力強等優點,反而更有機會領跑行業,正如 ChatGPT 背後的 OpenAI 公司一樣。
而這或許也是李開復選擇親自入局、塔尖孵化零一萬物的最核心原因——自研大模型底座的創業,不僅需要技術、人才,更需要塔尖資源整合和塔尖認知視野。
也只有李開復本人躬身入局,零一萬物才顯得如此不同。在眾多的創新梯隊中,零一萬物具有顯著優勢和競争特色。李開復擁有逾 40 年國際 AI 經驗,親自牽頭籌組,全球範圍的頂級 AI 專家陸續加入,目前組成的核心團隊深度參與過世界最大幾家軟體平台的構建,深度理解平台成功的方法論。
"AI 是對人類學習歷程的闡釋,對人類思維過程的量化,對人類行為的澄清,以及對人類智能的理解… AI 是人類認識并理解自己的最後一裏路,我希望加入到這個全新綻放、充滿前景的未來科學領網域 "。
這是 1983 年李開復攻讀卡内基梅隆大學博士學位的申請信。作為人工智能領網域的先驅者之一,40 年來,他始終活躍在人工智能科研和產業一線。
1998 年,李開復創立微軟中國研究院(微軟亞研 MSRA 前身),已成為中國培養人工智能人才最多、輸出人才質量最高的 "AI 學府 "。當時的青年才俊們,如今仍在人工智能大潮中熠熠生輝。
也正是這種經歷時間檢驗的成績,讓李開復博士逐漸成為了口口相傳的AI 先導,也正是這種經歷時間檢驗的成績,讓更多對 AI 2.0 和 AGI 充滿信仰的年輕工程師響應号召,在技術時代浪潮中抓住機遇,改變世界。
根據最新消息,零一萬物對全球人才的招攬仍在繼續,官網 01.AI 上簡歷通道顯示:
>