今天小編分享的科技經驗:94億,AIGC最大并購案誕生,歡迎閱讀。
近日,大數據巨頭公司 Databricks 宣布億 13 億美元的價格(約合 94 億人民币)收購生成式 AI 初創公司 MosaicML。該筆發生在美國矽谷的收購案,為年内生成式 AI 領網域内公布的最大一筆。引來業界高度關注。
MosaicML 于 2021 年成立于美國舊金山,其剛成立不久便成功完成了第一輪融資,知名風投 DCVC、Lux Capital、Future Ventures 等投資機構參與,MosaicML 共獲得 3700 萬美元的融資。
第一輪融資時,MosaicML 公司估值為 2.2 億美元,但在此次收購中,MosaicML 的估值直接提高近 6 倍,令業界感到驚嘆。
成立不到兩年,估值便如此之高,這家生成式 AI 初創公司到底有何 " 看家本領 "?
01
AI 模型服務企業端
產品質優價廉
根據公開資料顯示,MosaicML 的產品組合包括開源的、商業授權的 MPT Foundation 系列模型和 MosaicML 推理和訓練服務。
其推出的 MosaicML Composer 開源的深度學習庫,提供 20 種用于計算機視覺和自然語言處理的方法,包括模型、數據集和基準。推出的 MosaicML Explorer 可以幫助開發人員探索和理解不同的雲服務和硬體選項之間的時間、性能和成本,以簡化和評估實施選項。推出的 MosaicML AI 開發平台,提供了成本效益高的模型部署和定制訓練,同時保證數據安全,使用戶能夠擁有模型的所有權等。
值得一體的是,MPT 基礎模型系列是 MosaicML 提供的一系列開源、商業可用的大型語言模型,它們可以作為用戶構建自己的生成式 AI 應用的基礎。
MosaicML 的 MPT 基礎模型系列包括 MPT-7B 和 MPT-30B 兩個模型,分别有 70 億和 300 億個參數。
MPT-7B 是 MosaicML 在今年 5 月 5 日發布的類 ChatGPT 開源大語言模型。MPT-7B 在 MosaicML 平台上進行了 9.5 天的訓練,零人工幹預,成本僅用了 20 萬美元。該模型具備可商業化、高性能、資源消耗低、1T 訓練數據、可生成代碼等技術優勢。
AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs 等知名廠商皆使用 MPT-7B 開發各種生成式 AI 產品。
截至目前,MPT-7B 開源項目的下載量超過 300 萬次。收購方 Databricks 表示,這也是其收購 MosaicML 的重要原因之一。
另一款模型 MPT-30B 推出之後,同樣引來業界關注,十分受歡迎。其訓練成本遠低于其他競争對手,有望推動 AI 模型在更廣泛領網域的應用并逐步降低訓練成本。
MosaicML 首席執行官兼聯合創始人 Naveen Rao 表示,MPT-30B 的訓練成本僅為 70 萬美元,遠遠低于類似產品如 GPT-3 所需的數千萬美元訓練成本。該模型由于成本低、體積小,可以更快速地進行訓練,并且更适合在本地硬體上部署。
MosaicML 還介紹稱,公司用 2 個月的時間訓練了 MPT-30B,通過數據混合進行預訓練,從 10 個不同的開源文本語料庫中收集了 1T 個預訓練數據 token,并使用 EleutherAI GPT-NeoX-20B 分詞器對文本進行分詞,并根據上述比率進行采樣。
需要注意的是,開發者可以從 Hugging Face 下載并使用開源的 MPT-30B 基礎模型,還可以使用自己的數據在本地硬體上進行微調。
MosaicML 同時表示,将模型參數擴展到 300 億只是第一步,随後他們将以降低更低成本推出更大體積、更高質量的模型。
MosaicML 另一個比較有亮點的產品是今年推出的面向企業的 MosaicML 推理。
MosaicML 首席執行官兼聯合創始人 Naveen Rao 表示:" 一些初創公司已經在使用 MosaicML 的模型和工具來構建自然語言前端和搜索系統。MosaicML 允許企業使用公司的模型架構根據自己的數據訓練模型,然後通過其推理 API 部署模型。如果客戶訓練了一個模型,他們可以放心,他們擁有該模型的所有迭代,該模型就是他們的。我們對此不擁有所有權。使用 MosaicML 的新推理產品,企業客戶可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用 OpenAI 的 LLM 低 4 倍,而影像生成的成本比使用 OpenAI 的 DALL-E 2 便宜 15 倍。"
" 我們希望讓盡可能多的人了解和使用這項技術,這就是我們的目标。這并不是排他性的。這不是精英主義。"Naveen Rao 同時表示。
02
由英特爾前高管創立
MosaicML 起點不低
作為初創公司的 MosaicML,為何會連續推出爆款產品,這當然很其創始人有很大關系。
MosaicML 是由曾在英特爾擔任 AI 產品負責人、Nervana Systems 的聯合創始人 Naveen Rao ,以及英特爾 AI 實驗室的高級主管 Hanlin Tang 創立。
MosaicML 的創始人 Naveen Rao ,1997 年畢業于杜克大學的計算機科學專業,後取得布朗大學神經科學的博士學位。Naveen Rao 長期致力于人工智能神經網絡的學習和開發,曾在高通擔任過神經形态機器的研究員,并在 2014 年創立了人工智能公司 Nervana Systems。後來這家公司在 2016 年以 4.08 億美元被英特爾收購。
Hanlin Tang 畢業于哈佛大學,研究人類視覺中的遞歸神經網絡。他在普林斯頓大學取得物理學學士學位,随後在哈佛大學取得生物物理學的博士學位,研究人類視覺中的遞歸神經網絡,Hanlin Tang 少年時代在台北度過。後來加入英特爾後,在英特爾 AI 實驗室擔任高級主管,在此期間 Hanlin Tang 負責算法工程和深度學習研究,并參與了 MLPerf 基準測試的開發。
Hanlin Tang 在國際頂級期刊和會議上發表了多篇論文,涉及計算神經科學、計算機視覺、自然語言處理和強化學習等領網域。
還有一位值得一提的團隊成員是 MosaicML 的首席科學家 Jonathan Frankle,他是 MIT 計算機科學與人工智能實驗室的博士後研究員,也是哈佛 Kempner 研究所的附屬教員。Jonathan Frankle 的研究方向是神經網絡的學習動力學和訓練算法,旨在提高大型語言模型(LLM)的效率同時降低訓練成本。這一研究方向也正是 MosaicML 的核心競争力所在,可以說 Jonathan Frankle 是 MosaicML 能賣到 94 億的關鍵人物。
Naveen Rao 和 Hanlin Tang 之所以能在英特爾任職,是因為 Nervana Systems 開發了 Neon 這一高性能的深度學習框架,以及後來推出的 Nervana Cloud 深度學雲平台、Nervana Engine 專用硬體加速器,英特爾認為這些產品非常有價值,就把 Nervana Systems 收購了。Naveen Rao 和 Hanlin Tang 也一起加入英特爾,一位成為了 AI 產品集團的負責人,一位成為了 AI 實驗室高級主管。
不過,2020 年英特爾宣布放棄原計劃的 Nervana 伺服器端 AI 加速芯片,去耗資 20 億美元收購以色列公司 Habana 的產品。
在英特爾決定 " 抛棄 " Nervana 後,Naveen Rao 和 Nervana 的前核心員工 Hanlin Tang 也一起離開了英特爾,兩人另立門戶創立了今天的 MosaicML。根據 LinkedIn 的信息,目前 Hanlin Tang 擔任 MosaicML 的 CTO。
03
Databricks 收購 MosaicML
強強聯合?
Databricks 收購 MosaicML 不僅僅是因為商業價值,更是為了兩個公司可以強強聯合,實現技術上的突破,加碼 AI 大模型。
先來看看收購方 Databricks,這是一家數據存儲和分析領網域的巨頭公司,由美國加州大學伯克利 AMP 實驗室的 Spark 大數據處理系統多位創始人聯合創立。Databricks 的客戶遍及大中小企業,以及各個行業。截至 2023 年 03 月,其全球已有超過 9000 家企業用戶。包括 AT&T、殼牌、巴寶莉、豐田、Walgreens、Adobe、康泰納仕和再生元制藥等。
2021 年,Databricks 拿下了摩根士丹利旗下 Counterpoint Global 領投的 16 億美元 H 輪融資。2023 年 4 月 18 日,Databricks 以 298 億美元億的估值入選《2023 · 胡潤全球獨角獸榜》,名列第七。
業内專家表示,收購完成之後,MosaicML 将成為 Databricks Lakehouse 平台的一部分,MosaicML 的整個團隊和技術都将納入 Databricks 旗下,為公司提供統一的平台來管理數據資產,助力 Databricks 更好的開發生成式 AI 技術。同時能夠使用自己的專有數據來構建、擁有和保護自己的生成式 AI 模型。
DataBricks 的 CEO Ali Ghodsi 也表示,收購 MosaicML 将進一步增強 DataBricks 的數據分析平台。
DataBricks 收購 MosaicML 是為加碼 AI 大模型是主流觀點,原因是 MosaicML 因其尖端的 MPT 大語言模型而受到認可,MPT-7B 和 MPT-30B 都是今年開發的爆款產品,下載量均突破百萬。
值得一提的是,MosaicML 的模型訓練自動優化使得訓練速度比标準方法快 2-7 倍,而資源的近線性擴展允許在幾小時内訓練多十億參數的模型。
借助于雙方的聯合產品,Databricks 和 MosaicML 的目标是将訓練和使用 LLMs 的成本從數百萬美元降低到數千美元。
由此可見,Databricks 正試圖加碼 AI 大模型,去挑戰 OpenAI、微軟、谷歌等大公司的市場地位,為行業帶來新的選擇。
但也有反對觀點認為 Databricks 整合 LLM 的價值主張是不太明确,因為 Databricks 主營 Lakehouse,主要是用 Spark 來處理大規模集群數據,因此其整合大語言的價值并不明确。還有業内人士認為,Databricks 是在借當前大模型熱度進行炒作,收購對技術方面不會有明顯的突破,MosaicML 遲早會被 Databricks 放棄。
這起收購案能否能獲得良好的效果,在實現商業價值的同時,也能有技術突破,可能仍需要等待時間去驗證。
财經方面專家認為,收購 MosaicML 的交易可能是這家 AI 獨角獸公司為 IPO 之路打下基礎。
04
AI 大模型并購潮拉開大幕
去年末 ChatGPT 的橫空出世,拉開了 AI 競賽的大幕,半年之後,又出現了 AI 并購潮。
原因無外乎是生成式 AI 經過一段時間的野蠻生長,然後大型企業取得一定的進展,同時也發現了現有技術和人才的不足,而那些 AI 初創公司,相對來說要專業一些,既有人才也有技術,但存在資金不足、資源稀缺等問題。所以 AI 并購潮現在出現是必然的,對于整個行業來講也是正向的、有利的。
除了本文介紹的 Databricks 收購 MosaicML 之外,今年 5 月,雲計算巨頭 Snowflake 宣布收購了由兩位前 Google 員工創立的生成式 AI 搜索初創公司 Neeva。業内專家認為,此次收購将使 Snowflake 能夠利用尖端的搜索技術,并将其注入到數據雲中,充分客戶、合作夥伴和開發者的需求。
值得一提的是,Neeva 的領導團隊成員在創建 YouTube 貨币化和 Google 的搜索廣告等產品時,起到了非常重要的作用。不出意外的話,此次收購将把 Snowflake 中的搜索和對話提升到一個新水平。不過此次收購的金額并沒有對外公布。
6 月 26 日,全球最大的專業信息服務提供商湯森路透宣布,以 6.5 億美元現金收購 AI 初創公司 Casetext,該公司主營業務是為法律人士提供 AI 助理服務。
公開資料顯示,Casetext 員工數為 104 名,客戶包括 1 萬多家律師事務所和企業法務部門。其主要產品 CoCounsel 是一款于今年推出的人工智能法律助理,由 GPT-4 提供支持。該筆收購将有效補充湯森路透現有的 AI 路線圖。
6 月 29 日,AI 初創公司 Inflection 宣布完成 13 億美元融資,該輪融資由微軟、英偉達等牽頭投資,其融資總額達到 15.25 億美元。
再看中國的 AI 市場,6 月 29 日,美團發布公告,宣布已完成光年之外境内外主體 100% 的股權收購,耗資 20.65 億人民币。
對于此次并購,美團在公告表示,光年之外是中國領先的 AGI 創新者,其目前的管理與技術團隊具有開發深度學習框架的高水平經驗。公司通過收購事項可以獲得領先的 AGI 技術及人才,有機會加強其于快速增長的人工智能行業中的競争力。
美團方面表示,并購完成後,将支持光年團隊繼續在 AI 大模型領網域進行研究和探索。
無獨有偶,今年 6 月 16 日,昆侖萬維發布公告稱,旗下控股子公司 Star Group 拟發股收購 Singularity AI 全部股權。
Singularity AI 致力于實現通用人工智能,目前聚焦于自然語言大型預訓練模型及開發者 API 的研發工作,主要產品及服務包括通用開發者 API、聊天機器人和知識抽取。
國外出現 AI 并購潮,釋放出了一個強烈的行業信号,意味着國外 AIGC 的發展已經開始更新,無論是技術、業務、場景還是商業化,都随時可能出現颠覆性的創新。
對于國内 AI 市場,投資人持謹慎樂觀态度。總的來說是 B 端應用面臨企業端數字化緩慢,軟體付費意願不強,商業化緩慢等問題,對比國外 AI 市場依然差距不小。
不過我們也要看到,中國是美國市場之外唯一一個擁有完整的 AIGC 產業鏈的國家,在這場第四次工業革命之中,大家都沒有退路。