今天小編分享的科技經驗:AIGC領網域最大收購:Databricks 13億美元買下MosaicML,成立僅2年員工60人,歡迎閲讀。
美西時間今天早間,大數據巨頭 Databricks 宣布已籤署最終協定,将以 13 億美元的價格,收購位于舊金山的人工智能初創公司 MosaicML 。
該收購之後,MosaicML 将成為 Databricks Lakehouse 平台的一部分,MosaicML 的整個團隊和技術都将納入 Databricks 旗下,為企業提供統一的平台來管理數據資產,并且能夠使用自己的專有數據來構建、擁有和保護自己的生成式 AI 模型。
值得注意的是,MosaicML 是一家非常年輕的生成式 AI 公司,它于 2021 年成立于舊金山,目前只公開披露過一輪融資,員工僅 62 人。在上一輪的融資中,其估值為 2.2 億美元,也就是説,此次收購 MosaicML 的估值直接躍升了 6 倍。
此筆交易是截至目前今年生成式 AI 領網域内所公布的最大一筆收購案。就在不久前,雲計算巨頭 Snowflake 剛剛宣布收購了另一家生成式 AI 公司 Neeva。在經歷了幾個月的投資熱之後,大型企業對生成式 AI 初創公司的大規模并購潮似乎正在開啓。
MosaicML 是誰?
MosaicML 由曾在 Intel 擔任人工智能產品負責人、Nervana Systems 的聯合創始人 Naveen Rao 以及英特爾 AI 實驗室的高級主管 Hanlin Tang 創立。
MosaicML 的創始人,Hanlin Tang(左一)、Naveen Rao(左二),圖片來自 MosaicML
Naveen Rao 1997 年畢業于杜克大學的計算機科學專業,後取得布朗大學神經科學的博士學位,長期致力于人工智能神經網絡的學習和開發。他曾在高通擔任過神經形态機器的研究員,并曾在 2014 年創立了人工智能公司 Nervana Systems。
或許現在很多人并不熟悉 Nervana Systems,但在深度學習和 AI 芯片領網域,Nervana 可以説曾經風頭無兩。Nervana 的目标是通過其雲服務和硬體產品來改善深度學習的計算效率,它在 2015 年推出了超強性能的深度學習底層框架 Neon 在業界一炮而紅,緊接着在 2016 年推出了 Nervana Cloud 深度學習雲平台,以及 Nervana Engine 專用硬體加速器。
Nervana 表示,在 Nervana Cloud 中把 Neon 框架運行在 Nervana Engine 芯片上後,該組合能夠比英偉達 Titan X 的性能高出 10 倍。Nervana 的強勁表現在當時也引起了芯片霸主英特爾的注意,而英特爾在 AI 領網域所邁出的第一個大動作就是——花 4 億美元收購 Nervana。
2016 年關于英特爾收購 Nervana 的報道,圖片截自于 Vox
被收購之後,Naveen Rao 成為了英特爾人工智能產品的負責人,Neon 架構和 Nervana 的相關產品也被整合到英特爾的產品線中,Nervana Engine 被定名為 Crest 系列。
此後,在 2017 年 -2019 年間,英特爾多次發布 Nervana Lake Crest 的進展,并多次公布包括 Nervana NNP-T 系列等相關芯片產品。但就在大家等待着該系列芯片量產時,2020 年,英特爾突然宣布将用自己後來花 20 億美元收購的以色列公司 Habana 系列產品取代原定的 Nervana 伺服器端 AI 加速芯片。當時業界分析的原因是 Habana 的技術和設計更具可擴展性,并且已經具有量產交付能力。
而在英特爾決定 " 抛棄 " Nervana 後,Naveen Rao 和 Nervana 的前核心員工 Hanlin Tang 也離開了英特爾,兩人另立門户創立了 MosaicML。根據 LinkedIn 的信息,Hanlin Tang 應該是一名華裔,曾在哈佛大學取得生物物理學博士學位,目前擔任 MosaicML 的 CTO。
那麼,從英特爾 " 出走:後的 MosaicML 主要做什麼業務呢?
MosaicML 仍然致力于幫助企業提高 AI 效率上,只是這次他們不再在硬體上投入過多精力,而是專注于生成式 AI。簡單來説,MosaicML 提供了一個平台,讓各類型企業都可以輕松地在安全的環境中訓練和部署 AI 模型,并且幫助企業降低 AI 系統的開銷。
他們的產品組合產品組合包括開源的、商業授權的 MPT Foundation 系列模型和 MosaicML 推理和訓練服務,為企業提供了一系列的工具。
比如,MosaicML Explorer 可以幫助開發人員探索和理解不同的雲服務和硬體選項之間的時間、性能和成本,以簡化和評估實施選項。推出 MosaicML Composer 開源的深度學習庫,提供 20 種用于計算機視覺和自然語言處理的方法,包括模型、數據集和基準。推出 MosaicML AI 開發平台,提供了成本效益高的模型部署和定制訓練,同時保證數據安全,使用户能夠擁有模型的所有權等。
圖片來自 MosaicML 官網瞄準企業服務,Databricks 也要用生成式 AI 出招
回看 MosaicML 的創始團隊,可以説他們的業務選擇一直都比潮流領先了一步。在大家都還在觀望時做 AI 芯片,在 AI 行業的谷底中做率先探索生成式 AI 的商業化。
憑借着強大的團隊技術背景和行業經驗,MosaicML 剛成立不久就得到了知名風投 DCVC、Lux Capital、Future Ventures 等投資者 3700 萬美元的融資,之後的融資總額攀升到了 6400 萬美元。據了解,Databricks 收購 MosaicML,主要還是看中其生成式 AI 模型在企業端的商業化能力。
MosaicML 的 CEO Naveen Rao 此前曾表示,自 2018 年以來,使用大量數據進行 " 訓練 " 的人工智能模型的復雜度急劇上升,訓練一個模型現在至少要花費數百萬美元,除了大公司之外,其他中小型企業普遍都無法承受。
而此次收購之後,Databricks 的 Lakehouse 平台和 MosaicML 技術的聯合產品将能夠讓企業可以使用自己的專有數據來簡單、快速、低成本進行生成式 AI 模型的訓練和構建,在讓用户擁有數據的控制權和所有權的情況下,可以進行自定義 AI 模型開發。
圖片來自 MosaicML 官網
MosaicML 的模型訓練自動優化承諾比傳統方法快 2 – 7 倍的訓練速度,資源的近線性可伸縮性确保了具有數十億參數的模型可以在幾小時内訓練,而不是過去的幾天。根據 Databricks 的相關説法,在 Databricks 和 MosaicML 的平台和技術支持下,企業訓練和使用 LLMs 的成本将顯著降低,預計可以降至數千美元左右。
值得注意的是,在 MosaicML 加入之前, Databricks 曾基于 EleutherAI 的 Pythia-12b 開發了一個名為 Dolly-2 的 120 億參數語言模型,而伴随着此次 MosiacML 的加入,Databricks 未來将提供 Dolly-2 和 MosaicML MPT 兩個領先的大語言模型。
" 每個組織都應該能夠從人工智能革命中受益,并對其數據的使用方式有更多的控制。Databricks 和 MosaicML 有一個難以置信的機會來實現人工智能的民主化,并使 Lakehouse 成為構建生成式人工智能的最佳場所。"Databricks 聯合創始人兼首席執行官 Ali Ghodsi 在新聞稿中表示。
60 名員工喜提 " 大禮包 ",AIGC 并購潮拉開帷幕
MosaicML 收購是目前生成式 AI 領網域裏目前公開披露的最大交易,高達 13 億的收購額對于目前僅有 62 員工的 MosaicML 來説也無疑是天降 " 大禮包 "。
根據 Levels.fyi 的數據,此前 MosaicML 的軟體工程師的薪資平均水平在 75 萬美元到 85 萬美元之間。員工的期權會以現金折現或是轉成 Databricks 的期權目前還尚不清楚,但而此次收購之後,MosaicML 的整個團隊都将加入 Databricks。
圖片來自 Levels.fyi
在當前的 AI 熱潮下,大型公司對于生成式 AI 初創公司的并購或許才剛剛拉開帷幕。
不久前,雲數據管理領軍企業 Snowflake 剛宣布收購了由兩位前 Google 員工創立的生成式 AI 搜索初創公司 Neeva,交易額并未向外公布。Neeva 主要業務是利用生成性 AI 進行搜索,并且主要聚焦在企業搜索領網域。加入 Snowflake 之後,Neeva 将幫助服務企業客户利用 AI 去快速搜索和分析數據點、數據資產,獲得數據洞察的能力。
從 Snowflake 和 Databricks 接連的收購步伐中我們可以看到,大型科技公司對于生成式 AI 技術正在從自主研發、戰略投資逐步邁向兼并收購階段。這也給一些初創型生成式 AI 公司提供了更多的機會,不出意外的話,我們還會在今年下半年看到更多類似的收購案出現。
此外,無論是這兩筆大型收購的應用方向,還是Cohere、Anthropic 等近期高歌猛進的獨角獸,其業務重點都主要是在生成式 AI 技術的企業級應用方面。
在消費端熱鬧了大半年之後,生成式 AI 技術開始大舉朝着企業用户進軍。
* 參考資料:
注:封面圖來自于 Pexels,版權屬于原作者。如果不同意使用,請盡快聯系我們,我們會立即删除。