今天小编分享的财经经验:Meta内讧!大模型团队人员流失大半 算力紧缺竟成导火索,欢迎阅读。
《科创板日报》9 月 6 日讯(编辑 邱思雨) 据 The Information 报道,消息人士表示,Meta 参与 LLaMA 项目的人员大半都已辞职,原因是 Meta 另一研究团队(OPT 团队)与 LLaMA 团队就算力资源展开了一场内部斗争。
LLaMA 是 Meta 在今年 2 月发布的一款开源的人工智能大型语言模型。在今年 7 月,Meta 发布了其最新版本 LLaMA 2。相较上一代,LLaMA 2 训练所用的 token 翻了一倍至 2 万亿。
而在 2 月发布的初代 LLaMA 模型的 14 位核心原作者中,已有超过一半的人全部离职,包括 Timoth é e Lacroix、Guillaume Lample、Marie-Anne Lachaux、Gautier Izacard 等。
论文地址:https://arxiv.org/pdf/2302.13971.pdf
另一 OPT 团队则在 2022 年 5 月发布了开源大模型 OPT-175B,并在几个月后着手开发与谷歌 PaLM 竞争的竞品,准备开发出第二个更大的模型。
而 LLaMA 团队开发的模型则比 OPT 要小。知情人士透露,LLaMA 研究团队认为较小的模型在推理时会高效。但由于 LLaMA 模型小,因此获取的算力资源比 OPT 团队要少,这或许让 LLaMA 团队的研究人员感受到不被重视。
Meta AI 相关负责人 Joelle Pineau 也在采访中承认,LLaMA 和 OPT 团队之间在算力分配上有些紧张。
另外,算力资源内斗不仅导致了 LLaMA 团队半数研究人员的出走,OPT 团队同样也面临人员流失的问题。OPT 模型的 19 位原作者中,也有半数已离职 Meta。
论文地址:https://arxiv.org/pdf/2205.01068.pdf
原因主要系 OPT 团队正在开发的与谷歌 PaLM 竞争的竞品,已被 Meta 放弃。Pineau 无奈地表示:" 所有研究团队都想更新自己的模型,这时要么选择其中一个,要么让他们合作。"Meta AI 的一些高管也表达过质疑称,OPT 和 LLaMA 两个团队项目的相似度过高,却要竞争有限的算力资源。
最终,Meta AI 的领导人决定进行团队重组,将 LLaMA 和 OPT 团队的部分研究成员聚集起来,成立了生成式 AI 团队。
在 AI 算力竞赛中,科技巨头往往拥有比大多数公司更加充裕的算力资源。而 Meta 大模型研究人员因算力斗争而相继离职愈发印证了,目前业内算力紧缺程度比想象中还要严重,科技巨头或许也不例外。