今天小編分享的科技經驗:創業1年半,賣了94億,歡迎閲讀。
AIGC 領網域最大收購誕生了。
生成式 AI 的投資熱還在蔓延,而這一旺盛需求也正在推動大公司對這一領網域初創企業的收購。
國内,美團斥資 20.65 億收購光年之外。海外,數據存儲管理公 Databricks 最近以 13 億美元的高價收購了 OpenAI 競争對手MosaicML 。
MosaicML 是一家總部位于美國舊金山的生成式 AI 初創公司,目前只有 60 餘名員工。自 2021 年 10 月成立以來迄今已籌集 6400 萬美元,其投資者包括 Frontline Ventures、DCVC、AME Cloud Ventures、Lux Capital、Atlas、Playground Global 和 Samsung Next 等。
其中,Samsung Next 是三星旗下的投資公司,專注于區塊鏈和 AI 等領網域的投資,AME Cloud Ventures 是由雅虎聯合創始人楊致遠領導的風投基金,Frontline Ventures 是一家愛爾蘭風投機構。
值得注意的是,MosaicML 的上一輪融資在 2023 年 1 月,當時估值為 2.22 億美元,13 億美元的收購價意味着不到一年時間其估值躍升了 6 倍。
收購方 Databricks 是一家數據存儲和分析領網域的獨角獸,幫助 AT&T、殼牌、Walgreens 等大型公司處理數據。2021 年,MosaicML 拿到摩根士丹利旗下 Counterpoint Global 領投 16 億美元 H 輪融資,估值高達 380 億美元。收購 MosaicML 的交易可能是這家獨角獸公司向 IPO 之路邁出的又一步。通過它們的聯合產品,Databricks 和 MosaicML 将能夠使用自己的數據來訓練和運行私人定制模型,從而保留對數據的控制權。
這并不是生成式 AI 領網域今年的唯一一起收購。3 月,Stable Diffusion 背後的 Stability AI 收購了 AI 照片編輯應用 ClipDrop 背後的開發商 Init ML,希望可以将自身的模型與應用場景更緊密的結合起來。5 月,Databricks 競争對手 Snowflake 宣布收購生成式 AI 搜索初創公司 Neeva,意在将生成式 AI 的專業知識構建到數據基礎設施產品中。
企業級生成式 AI
生成式 AI 算是今年為數不多的投資熱點。1 月,微軟向 OpenAI 投資了 100 億美元。3 月,總部位于舊金山的Adept AI 在 B 輪融資中籌集了 3.5 億美元,投後估值至少為 10 億美元。5 月,Anthropic(人工智能助手 Claude)籌集了 4.5 億美元的 C 輪融資,估值達到 50 億美元。
市場分析公司 PitchBook Data 的數據顯示,到今年年底,全球生成式 AI 市場的支出預計将達到 426 億美元,并以 32% 的復合年增長率增長,到 2026 年将達到 981 億美元。投向生成式 AI 初創公司的風險投資也從 2022 年全年的 48 億美元增至 2023 年前 5 個月的 127 億美元。
生成式 AI 市場急劇擴張,為 MosaicML 這樣的初創公司創造了機會。使用大語言系統等工具來開發和訓練公司自己的 AI 系統正在成為一些大公司的流行策略選擇,MosaicML 這樣的公司可以提供和 OpenAI 類似的人工智能模型,但成本更低,并可以根據公司的數據進行定制。
上個月,法國生成式 AI 初創公司 Mistral AI 獲得了創紀錄的 1.13 億美元種子輪資金投資。這筆融資和 Databricks 對 MosaicML 的收購都屬于企業級生成式 AI 領網域的推動事件。
MosaicML 的兩位創始人都曾在英特爾任職。
Naveen Rao 曾在杜克大學就讀計算機專業,後又拿下布朗大學神經科學的博士學位,研究人工智能神經網絡的學習和開發。2014 年創立了深度學習平台 Nervana Systems。成立兩年後,Nervana 即被英特爾以約 4.08 億美元的價格收購,他自己也加入英特爾擔任 AI 產品組的副總裁兼總經理。但 Nervana 後被英特爾抛棄,Naveen Rao 遂在 2021 年離職再創業。
另一位創始人兼 CTO Hanlin Tang 是哈佛大學博士,研究人類視覺循環神經網絡。他領導過英特爾實驗室的人工智能實驗室,重點研究領網域為應用深度強化學習、自然語言處理和擴展大型模型。他是在英特爾收購 Nervana Systems 後加入的。更早之前,他曾在國防部、蘭德公司工作,有着數據安全領網域的經驗。
MosaicML 的首席科學家 Jonathan Frankle 是 MIT 計算機科學與人工智能實驗室的博士後研究員,也是哈佛 Kempner 研究所的附屬教員。他的研究方向是神經網絡的學習動力學和訓練算法,旨在提高大型語言模型(LLM)的效率同時降低訓練成本。他的研究方向也正是 MosaicML 的競争力所在。
大語言模型的開源路線
MosaicML 提供了一個生成式 AI 平台和一套完整的解決方案,包括 MPT 基礎模型系列、MosaicML 推理和 MosaicML 訓練,讓用户能夠在自己的數據和安全環境中訓練和部署生成式 AI 模型。
其中,MPT 基礎模型系列是 MosaicML 提供的一系列開源、商業可用的大型語言模型,它們可以作為用户構建自己的生成式 AI 應用的基礎。MPT 基礎模型系列包括 MPT-7B 和 MPT-30B 兩個模型,分别有 70 億和 300 億個參數。
和 OpenAI 的大語言模型相比,MosaicML 的訓練成本更低。MosaicML 首席執行官兼聯合創始人 Naveen Rao 曾在采訪中表示,MPT-30B 的訓練成本為 70 萬美元,遠低于訓練 GPT-3 所需的數千萬美元。
當然,這不是它唯一的優點。
今年 5 月,MosaicML 推出面向企業的 MosaicML 推理。MosaicML 首席執行官 Naveen Rao 曾表示,MosaicML 對企業客户的價值主張是雙重的:保持客户數據的私密性和降低成本。
當前許多企業傾向于定制人工智能模型,這些模型依賴于編碼、法律工作、醫療保健等領網域的特定訓練集,其中許多行業都對本領網域數據有着嚴格的合規和控制。企業客户需要能夠高效執行特定任務的模型,這正是 MosaicML 相對于 OpenAI 這類通用模型所具備的優勢。
一些初創公司已經在使用 MosaicML 的模型和工具來構建自然語言前端和搜索系統。MosaicML 允許企業使用公司的模型架構根據自己的數據訓練模型,然後通過其推理 API 部署模型。" 如果客户訓練了一個模型,他們可以放心,他們擁有該模型的所有迭代,該模型就是他們的。我們對此不擁有所有權。"Naveen Rao 表示。
使用 MosaicML 的新推理產品,企業客户可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用 OpenAI 的 LLM 低 4 倍,而影像生成的成本比使用 OpenAI 的 DALL-E 2 便宜 15 倍。
除了讓人工智能技術變得更容易使用之外,MosaicML 還專注于提高數據質量,以實現更好的模型性能。它正開發工具來幫助用户在預訓練過程中分層輸入特定領網域的數據,這确保了多樣化和高質量的數據組合,對于構建有效的人工智能模型至關重要。
作為開源模型的可用性以及完整的模型調整和部署服務,或使這家初創公司能夠挑戰 OpenAI 在大語言模型技術市場的主導地位。
" 我們希望讓盡可能多的人了解和使用這項技術,這就是我們的目标。這并不是排他性的。這不是精英主義。"Naveen Rao 表示。