今天小編分享的科學經驗:微軟全球合夥人姜大昕被曝大模型創業,歡迎閱讀。
大模型比武場戰火紛飛了半年有餘,左有 OpenAI 動作頻頻,右有 Meta 開源 Llama2,開閉源方面,均被巨鳄占領山頭,創業投資也已經進入了新階段。
現在再下場,會不會晚了?
會者不晚。
因為就在最近,又一重量級大牛入局創業。量子位獲悉,微軟全球合夥人、副總裁、前微軟亞洲研究院首席科學家姜大昕出現在最新名單中。
這位在微軟工作 16 年有餘、曾作為微軟必應搜索引擎和 Cortana 智能助手自然語言理解負責人,近期被曝已經從老東家離職,下一站,自己創業,劍指大模型領網域。
而且據說姜大昕還不是一個人戰鬥,他背後還有兩位 MSRA 故舊,一位是地位卓然、微軟華人旗幟的 AI 大牛,另一位則是年少有為、知名 AI 獨角獸的 CEO。
他們,将在 AI 高地上海的助推下集結。
姜大昕是誰?
姜大昕,2005 年獲紐約布法羅州紐約州立大學計算機科學博士,在機器學習、數據挖掘、自然語言處理、生物信息等領網域有豐富的經驗和工程經驗。
迄今為止,他發表論文 100 餘篇,被引用次數接近 1 萬次。
現在的領英網站上,姜大昕的職業動态還停留在年初的更新。
"2023 年 3 月起,擔任微軟副總裁 ",所在部門為 STCA(微軟亞洲互聯網工程院)。
從 2007 年 3 月加入微軟到 2023 年,姜大昕已經和這家公司攜手度過了 16 個年頭。
姜大昕本碩分别畢業于中國科學技術大學和中國科學院軟體研究所,當他遠赴美國攻讀計算機博士學位,做生物信息領網域的數據挖掘研究時,恰逢深度學習方興未艾。
博士畢業後,他選擇了前往南洋理工大學擔任助理教授,為研究生和大學生教授數據挖掘和生物信息學課程。
2006 年 12 月,他從南洋理工離職,并在次年 3 月成為 MSRA(微軟亞研院)的副研究員。
他在 MSRA 工作了四年,負責數據挖掘、機器學習和信息檢索等領網域的應用研究,從事着個性化和上下文感知搜索等工作,一路從副研究員做到研究員再到首席科學家。
此期間,他在 SIGKDD、SIGIR,WWW 和 WSDM 等會議上發表了多篇文章,獲得 SIGKDD 2008 最佳應用論文獎,還擔任多個期刊和會議的副主編和 PC 成員。
2011 年開始,姜大昕轉入 STCA 工作。
STCA 主要負責微軟全球產品的研發工作,包括必應搜索引擎、智能語音助手 Cortana、Azure 認知服務以及 Microsoft 365 的自然語言理解系統等。
6 年後,姜大昕的 title 已經升為了微軟全球合夥人,STCA 副院長、首席科學家。
2023 年 3 月,姜大昕正式升任為微軟副總裁,同時兼任亞洲軟體技術中心 WebXT S+D(網絡體驗、搜索和分銷)集團總經理。
此時,姜大昕的工作重點是帶領 400 多名應用科學家和工程師,為微軟必應開發算法和基礎結構。
同時,姜大昕團隊還為各種 Microsoft 產品(如 Office,Xbox 和 Microsoft 認知服務)提供 NLP 模型和算法。
大模型創業進程中的微軟系
姜大昕并不是第一位出身微軟的大模型創業者,細數起來,不少頭部玩家都有微軟背景。
李開復,前微軟全球副總裁,也是 MSRA 的創辦者之一。
3 月底,李開復開始籌備、塔尖孵化創業公司零一萬物,走自研大模型路線,核心業務集中在大模型技術、人工智能算法、自然語言處理、系統架構、算力架構、數據安全、產品研發等領網域。
已加入的聯創團隊成員,包含前阿裡副總裁、前百度副總裁、前滴滴 / 百度首席算法負責人、前谷歌中國高管、前微軟 /SAP/Cisco/ 副總裁,算法和產品團隊背景均來自國内外大廠。
目前,零一萬物正自建平台,構建數千卡 GPU 集群進行訓練、調優和推理,提高數據有效參數量,以及使用的高質量數據的密度,以構建連續、可控、科學化的訓練能力。
籌備至今,該公司已經實現百億參數規模的模型内測,正往 300 到 700 億參數規模擴大。
周明,MSRA 前常務副院長,旗下創業公司名為瀾舟科技,于 2021 年 6 月成立。
公司選擇了大模型的輕量化路徑,并且瞄準 To B 賽道,聚焦于金融、營銷、文化創意、機器翻譯等場景。
今年 3 月,瀾舟科技完成了 Pre-A+ 輪融資,融資金額數億人民币。由北京中關村科學城公司領投,斯道資本和創新工場跟投。
同時,瀾舟發布了語言生成模型——孟子 MChat 可控大模型,具有類 ChatGPT 能力,加上原來瀾舟科技孟子大模型 N 個項目功能引擎,既有對話能力,又具備翻譯、生成、信息搜索等能力。
MChat 背後依托的孟子大模型,是瀾舟科技自研技術研發的大規模預訓練語言模型,于 2021 年 7 月推出。
李笛,微軟亞洲互聯網工程院(STCA)前副院長、前微軟全球資深合夥人,目前是小冰公司的 CEO。
小冰公司前身是微軟亞洲互聯網工程院的人工智能小冰團隊,于 2013 年 12 月在北京組建。2020 年 5 月,小冰公司 " 單飛 ",微軟将小冰分拆為獨立實體。
早在 2014 年,小冰就發布過一款名叫 " 小冰 " 的 AI 聊天機器人。并且一直沿着生成式 AI 的框架和路徑前進。
今年 2 月,小冰一度短暫上線了内測版本的小冰鏈(X-CoTA,X-Chain of Thought & Action)。
小冰鏈同樣是個大語言模型,通過對話的方式幫人們解答問題。其核心,是利用大模型技術,實現下一代的控制中樞。
與 ChatGPT 等不同,小冰鏈的數據來源是實時的,并且僅僅用 GPT-3 參數量 2% 的模型,就實現了思維鏈,能夠把 AI 的思考過程完整、透明地呈現出來。
5 月 16 日,小冰公司宣布啟動 "GPT 克隆人計劃 ",基于小冰框架大模型、神經網絡渲染及超級自然語音技術,進行實時情感互動、提供 AIGC 能力。
聶再清,MSRA 前首席研究員,現為清華大學國強教授、AIR(智能產業研究院)首席研究員。
其在 AIR 主導的項目,在今年 7 月孵化出了初創公司水木分子。
水木分子專注生物醫藥垂直行業大模型的研發與應用,以及構建新一代對話式生物醫藥研發助手。
7 月初,公司宣布完成千萬級種子輪融資。同時宣布了聯合創始人、CTO 的人選,喬木。
3 個月前,團隊開源了輕量科研版 BioMedGPT-1.6B。
BioMedGPT1.6B 從研究層面驗證了将文獻、分子、蛋白、測序、知識圖譜等數據,壓縮到統一的多模态大模型框架内,可使模型在分子性質預測、藥物 - 靶點親和力預測等方面,具備 " 融匯貫通 " 的能力,
梅濤,MSRA 前資深研究員,今年 3 月成立 AI 創業公司HiDream.ai 。
公司走多模态路線,尤其專注視覺與語言多模态互動與生成。
HiDream.ai 在今年 4 月完成種子輪融資,投資方包括阿爾法公社和中喝大種子一号基金。
官方解釋稱,HiDream.ai 的目标,是要在基礎模型上超越 Stable Diffusion 最新版本,在產品上則要趕超 Midjourney。
公司目前正在開發一個生成式視覺多模态基礎模型,該模型不僅能夠支持文生圖,還能支持文生視頻、圖生視頻以及文生 3D 等功能。
袁進輝,MSRA 前主管研究員。
其公司一流科技,在 2017 年 1 月成立,立足于通用性深度學習标準框架的研發和推廣使用。
公司從事大模型的研發業務,主要圍繞數據處理、執行體、分布式數據、決策系統、拓撲圖等技術領網域展開。
今年 3 月,一流科技與王慧文創立的光年之外達成并購意向,交易以換股形式進行。
4 月中旬,一流科技完成工商變更,光年之外成為一流科技的最大股東,持有約 46.52% 股權。
後來,王慧文因病辭任,美團于 6 月 29 日發布公告稱,已完成光年之外境内外主體 100% 股權的收購,一流科技也一并轉歸美團麾下。
張家興,MSRA 前研究員,公司據傳代号深度空間,IDEA 研究院理事長沈向洋擔任公司顧問。
大方向是打造大模型底座,希望瞄準 B 端市場打造企業級應用。
今年 4 月即有消息稱,該公司首輪估值在數億美元左右。據悉,該公司的融資進程仍在持續。
不難發現,在清華系創業公司占據國内大模型頭部梯隊半壁江山時,微軟系也是不容小觑的一股力量。
而姜大昕此番從微軟出走,入局大模型創業,要錨定領網域中的具體什麼方向?除了背後的兩位 AI 大牛,有哪些技術或商業骨幹選擇加盟?迎來新一名重磅玩家的大模型戰事,又會發生怎樣的變局?
大約只有假以時日,才能知道答案。
— 聯系作者 —
>