今天小编分享的科技经验:94亿,AIGC最大并购案诞生,欢迎阅读。
近日,大数据巨头公司 Databricks 宣布亿 13 亿美元的价格(约合 94 亿人民币)收购生成式 AI 初创公司 MosaicML。该笔发生在美国硅谷的收购案,为年内生成式 AI 领網域内公布的最大一笔。引来业界高度关注。
MosaicML 于 2021 年成立于美国旧金山,其刚成立不久便成功完成了第一轮融资,知名风投 DCVC、Lux Capital、Future Ventures 等投资机构参与,MosaicML 共获得 3700 万美元的融资。
第一轮融资时,MosaicML 公司估值为 2.2 亿美元,但在此次收购中,MosaicML 的估值直接提高近 6 倍,令业界感到惊叹。
成立不到两年,估值便如此之高,这家生成式 AI 初创公司到底有何 " 看家本领 "?
01
AI 模型服务企业端
产品质优价廉
根据公开资料显示,MosaicML 的产品组合包括开源的、商业授权的 MPT Foundation 系列模型和 MosaicML 推理和训练服务。
其推出的 MosaicML Composer 开源的深度学习库,提供 20 种用于计算机视觉和自然语言处理的方法,包括模型、数据集和基准。推出的 MosaicML Explorer 可以帮助开发人员探索和理解不同的云服务和硬體选项之间的时间、性能和成本,以简化和评估实施选项。推出的 MosaicML AI 开发平台,提供了成本效益高的模型部署和定制训练,同时保证数据安全,使用户能够拥有模型的所有权等。
值得一体的是,MPT 基础模型系列是 MosaicML 提供的一系列开源、商业可用的大型语言模型,它们可以作为用户构建自己的生成式 AI 应用的基础。
MosaicML 的 MPT 基础模型系列包括 MPT-7B 和 MPT-30B 两个模型,分别有 70 亿和 300 亿个参数。
MPT-7B 是 MosaicML 在今年 5 月 5 日发布的类 ChatGPT 开源大语言模型。MPT-7B 在 MosaicML 平台上进行了 9.5 天的训练,零人工干预,成本仅用了 20 万美元。该模型具备可商业化、高性能、资源消耗低、1T 训练数据、可生成代码等技术优势。
AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs 等知名厂商皆使用 MPT-7B 开发各种生成式 AI 产品。
截至目前,MPT-7B 开源项目的下载量超过 300 万次。收购方 Databricks 表示,这也是其收购 MosaicML 的重要原因之一。
另一款模型 MPT-30B 推出之后,同样引来业界关注,十分受欢迎。其训练成本远低于其他竞争对手,有望推动 AI 模型在更广泛领網域的应用并逐步降低训练成本。
MosaicML 首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本仅为 70 万美元,远远低于类似产品如 GPT-3 所需的数千万美元训练成本。该模型由于成本低、体积小,可以更快速地进行训练,并且更适合在本地硬體上部署。
MosaicML 还介绍称,公司用 2 个月的时间训练了 MPT-30B,通过数据混合进行预训练,从 10 个不同的开源文本语料库中收集了 1T 个预训练数据 token,并使用 EleutherAI GPT-NeoX-20B 分词器对文本进行分词,并根据上述比率进行采样。
需要注意的是,开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,还可以使用自己的数据在本地硬體上进行微调。
MosaicML 同时表示,将模型参数扩展到 300 亿只是第一步,随后他们将以降低更低成本推出更大体积、更高质量的模型。
MosaicML 另一个比较有亮点的产品是今年推出的面向企业的 MosaicML 推理。
MosaicML 首席执行官兼联合创始人 Naveen Rao 表示:" 一些初创公司已经在使用 MosaicML 的模型和工具来构建自然语言前端和搜索系统。MosaicML 允许企业使用公司的模型架构根据自己的数据训练模型,然后通过其推理 API 部署模型。如果客户训练了一个模型,他们可以放心,他们拥有该模型的所有迭代,该模型就是他们的。我们对此不拥有所有权。使用 MosaicML 的新推理产品,企业客户可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用 OpenAI 的 LLM 低 4 倍,而影像生成的成本比使用 OpenAI 的 DALL-E 2 便宜 15 倍。"
" 我们希望让尽可能多的人了解和使用这项技术,这就是我们的目标。这并不是排他性的。这不是精英主义。"Naveen Rao 同时表示。
02
由英特尔前高管创立
MosaicML 起点不低
作为初创公司的 MosaicML,为何会连续推出爆款产品,这当然很其创始人有很大关系。
MosaicML 是由曾在英特尔担任 AI 产品负责人、Nervana Systems 的联合创始人 Naveen Rao ,以及英特尔 AI 实验室的高级主管 Hanlin Tang 创立。
MosaicML 的创始人 Naveen Rao ,1997 年毕业于杜克大学的计算机科学专业,后取得布朗大学神经科学的博士学位。Naveen Rao 长期致力于人工智能神经网络的学习和开发,曾在高通担任过神经形态机器的研究员,并在 2014 年创立了人工智能公司 Nervana Systems。后来这家公司在 2016 年以 4.08 亿美元被英特尔收购。
Hanlin Tang 毕业于哈佛大学,研究人类视觉中的递归神经网络。他在普林斯顿大学取得物理学学士学位,随后在哈佛大学取得生物物理学的博士学位,研究人类视觉中的递归神经网络,Hanlin Tang 少年时代在台北度过。后来加入英特尔后,在英特尔 AI 实验室担任高级主管,在此期间 Hanlin Tang 负责算法工程和深度学习研究,并参与了 MLPerf 基准测试的开发。
Hanlin Tang 在国际顶级期刊和会议上发表了多篇论文,涉及计算神经科学、计算机视觉、自然语言处理和强化学习等领網域。
还有一位值得一提的团队成员是 MosaicML 的首席科学家 Jonathan Frankle,他是 MIT 计算机科学与人工智能实验室的博士后研究员,也是哈佛 Kempner 研究所的附属教员。Jonathan Frankle 的研究方向是神经网络的学习动力学和训练算法,旨在提高大型语言模型(LLM)的效率同时降低训练成本。这一研究方向也正是 MosaicML 的核心竞争力所在,可以说 Jonathan Frankle 是 MosaicML 能卖到 94 亿的关键人物。
Naveen Rao 和 Hanlin Tang 之所以能在英特尔任职,是因为 Nervana Systems 开发了 Neon 这一高性能的深度学习框架,以及后来推出的 Nervana Cloud 深度学云平台、Nervana Engine 专用硬體加速器,英特尔认为这些产品非常有价值,就把 Nervana Systems 收购了。Naveen Rao 和 Hanlin Tang 也一起加入英特尔,一位成为了 AI 产品集团的负责人,一位成为了 AI 实验室高级主管。
不过,2020 年英特尔宣布放弃原计划的 Nervana 伺服器端 AI 加速芯片,去耗资 20 亿美元收购以色列公司 Habana 的产品。
在英特尔决定 " 抛弃 " Nervana 后,Naveen Rao 和 Nervana 的前核心员工 Hanlin Tang 也一起离开了英特尔,两人另立门户创立了今天的 MosaicML。根据 LinkedIn 的信息,目前 Hanlin Tang 担任 MosaicML 的 CTO。
03
Databricks 收购 MosaicML
强强联合?
Databricks 收购 MosaicML 不仅仅是因为商业价值,更是为了两个公司可以强强联合,实现技术上的突破,加码 AI 大模型。
先来看看收购方 Databricks,这是一家数据存储和分析领網域的巨头公司,由美国加州大学伯克利 AMP 实验室的 Spark 大数据处理系统多位创始人联合创立。Databricks 的客户遍及大中小企业,以及各个行业。截至 2023 年 03 月,其全球已有超过 9000 家企业用户。包括 AT&T、壳牌、巴宝莉、丰田、Walgreens、Adobe、康泰纳仕和再生元制药等。
2021 年,Databricks 拿下了摩根士丹利旗下 Counterpoint Global 领投的 16 亿美元 H 轮融资。2023 年 4 月 18 日,Databricks 以 298 亿美元亿的估值入选《2023 · 胡润全球独角兽榜》,名列第七。
业内专家表示,收购完成之后,MosaicML 将成为 Databricks Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入 Databricks 旗下,为公司提供统一的平台来管理数据资产,助力 Databricks 更好的开发生成式 AI 技术。同时能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。
DataBricks 的 CEO Ali Ghodsi 也表示,收购 MosaicML 将进一步增强 DataBricks 的数据分析平台。
DataBricks 收购 MosaicML 是为加码 AI 大模型是主流观点,原因是 MosaicML 因其尖端的 MPT 大语言模型而受到认可,MPT-7B 和 MPT-30B 都是今年开发的爆款产品,下载量均突破百万。
值得一提的是,MosaicML 的模型训练自动优化使得训练速度比标准方法快 2-7 倍,而资源的近线性扩展允许在几小时内训练多十亿参数的模型。
借助于双方的联合产品,Databricks 和 MosaicML 的目标是将训练和使用 LLMs 的成本从数百万美元降低到数千美元。
由此可见,Databricks 正试图加码 AI 大模型,去挑战 OpenAI、微软、谷歌等大公司的市场地位,为行业带来新的选择。
但也有反对观点认为 Databricks 整合 LLM 的价值主张是不太明确,因为 Databricks 主营 Lakehouse,主要是用 Spark 来处理大规模集群数据,因此其整合大语言的价值并不明确。还有业内人士认为,Databricks 是在借当前大模型热度进行炒作,收购对技术方面不会有明显的突破,MosaicML 迟早会被 Databricks 放弃。
这起收购案能否能获得良好的效果,在实现商业价值的同时,也能有技术突破,可能仍需要等待时间去验证。
财经方面专家认为,收购 MosaicML 的交易可能是这家 AI 独角兽公司为 IPO 之路打下基础。
04
AI 大模型并购潮拉开大幕
去年末 ChatGPT 的横空出世,拉开了 AI 竞赛的大幕,半年之后,又出现了 AI 并购潮。
原因无外乎是生成式 AI 经过一段时间的野蛮生长,然后大型企业取得一定的进展,同时也发现了现有技术和人才的不足,而那些 AI 初创公司,相对来说要专业一些,既有人才也有技术,但存在资金不足、资源稀缺等问题。所以 AI 并购潮现在出现是必然的,对于整个行业来讲也是正向的、有利的。
除了本文介绍的 Databricks 收购 MosaicML 之外,今年 5 月,云计算巨头 Snowflake 宣布收购了由两位前 Google 员工创立的生成式 AI 搜索初创公司 Neeva。业内专家认为,此次收购将使 Snowflake 能够利用尖端的搜索技术,并将其注入到数据云中,充分客户、合作伙伴和开发者的需求。
值得一提的是,Neeva 的领导团队成员在创建 YouTube 货币化和 Google 的搜索广告等产品时,起到了非常重要的作用。不出意外的话,此次收购将把 Snowflake 中的搜索和对话提升到一个新水平。不过此次收购的金额并没有对外公布。
6 月 26 日,全球最大的专业信息服务提供商汤森路透宣布,以 6.5 亿美元现金收购 AI 初创公司 Casetext,该公司主营业务是为法律人士提供 AI 助理服务。
公开资料显示,Casetext 员工数为 104 名,客户包括 1 万多家律师事务所和企业法务部门。其主要产品 CoCounsel 是一款于今年推出的人工智能法律助理,由 GPT-4 提供支持。该笔收购将有效补充汤森路透现有的 AI 路线图。
6 月 29 日,AI 初创公司 Inflection 宣布完成 13 亿美元融资,该轮融资由微软、英伟达等牵头投资,其融资总额达到 15.25 亿美元。
再看中国的 AI 市场,6 月 29 日,美团发布公告,宣布已完成光年之外境内外主体 100% 的股权收购,耗资 20.65 亿人民币。
对于此次并购,美团在公告表示,光年之外是中国领先的 AGI 创新者,其目前的管理与技术团队具有开发深度学习框架的高水平经验。公司通过收购事项可以获得领先的 AGI 技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。
美团方面表示,并购完成后,将支持光年团队继续在 AI 大模型领網域进行研究和探索。
无独有偶,今年 6 月 16 日,昆仑万维发布公告称,旗下控股子公司 Star Group 拟发股收购 Singularity AI 全部股权。
Singularity AI 致力于实现通用人工智能,目前聚焦于自然语言大型预训练模型及开发者 API 的研发工作,主要产品及服务包括通用开发者 API、聊天机器人和知识抽取。
国外出现 AI 并购潮,释放出了一个强烈的行业信号,意味着国外 AIGC 的发展已经开始更新,无论是技术、业务、场景还是商业化,都随时可能出现颠覆性的创新。
对于国内 AI 市场,投资人持谨慎乐观态度。总的来说是 B 端应用面临企业端数字化缓慢,軟體付费意愿不强,商业化缓慢等问题,对比国外 AI 市场依然差距不小。
不过我们也要看到,中国是美国市场之外唯一一个拥有完整的 AIGC 产业链的国家,在这场第四次工业革命之中,大家都没有退路。