今天小编分享的互联网经验:李开复的新AI公司登陆大模型战场,百亿级模型已内测,欢迎阅读。
文 | 周鑫雨
编辑 | 邓咏仪
距李开复发出 AI 英雄帖,过去了整整 106 天。
2023 年 3 月 19 日,创新工场董事长兼 CEO 李开复在朋友圈宣布 " 亲自筹组 Project AI 2.0,一个致力打造 AI 2.0 全新平台和 AI-first 生产力应用的全球化公司 "。
3 个月后,7 月 3 日,Project AI 2.0 终于揭开了业务和团队画像的一角。创新工厂官宣 Project AI 2.0 新公司 " 零一万物 ",并上线官网(01.AI)。
创新工场表示,零一万物是其 " 塔尖孵化 " 的第 7 家公司。
所谓的 " 塔尖孵化 ",是创新工场投资具有短板的初期公司的战略,特点是在创业者和学术圈之间建立紧密的人才、技术等方面的联系,涵盖甄别技术趋势、设定技术主题、挖掘技术人才、跟踪行业最新动态等环节。3 月,宣布完成亿元人民币 Pre-A 轮融资的澜舟科技,就是创新工场采取塔尖孵化模式的公司。
自研大模型,是零一万物切入 AI 赛道的方向。为此,零一万物搭建了专供大模型训练、调优和推理的实验平台,资源储备包括数千卡 GPU 集群。
面对 " 重复造轮子 " 的质疑,零一万物用目前国内大模型赛道存在的两个问题做出了回应:一,许多声称效果类似 ChatGPT 的开源模型,都只局限于简单对话,无法适应稍微泛化或复杂的任务;二,依赖开源生态不利于对大模型技术原理的研究,自身能力天花板容易被他人定义。
为了提高模型能力,零一万物采取了拆解技术路线、分步攻克的策略,包括 7 大模块:
1、定义模型能力天花板的预训练框架(Pre-train)技术;
2、精进模型实现能力的 Post-train(训练后)技术;
3、支撑模型高效训练的 AI Infra 技术;
4、更多元化多介质的多模态模型技;
5、平台中间件及工具链技术;
6、推理部署技术;
7、服务部署技术。
据官方介绍,遵循模块化的技术路线后,零一万物在 3 个月内已经实现百亿参数规模的模型内测,且参数正往 300-700 亿的规模扩大。与此同时,零一万物也表示,未来不排除大模型开源的可能。
创新工场表示,目前 " 零一万物 " 已经有数十名核心成员,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发能领網域。
从创新工场披露的团队成员背景来看," 顶尖大厂 "" 一把手 " 是最显著的标签。官方表示,已加入的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴 / 百度首席算法负责人、前谷歌中国高管、前微软 /SAP/Cisco/ 副总裁,包括 36 氪此前独家报道的前百度副总裁马杰。与此同时,零一万物算法和产品团队背景均来自国内外大厂。
将模型训练技术路线拆分为 7 个模块后,零一万物的野心是为每一个模块配备顶尖的技术专家,这也意味着人才焦虑仍在持续。官宣公司成立时,零一万物特意强调,简历投递通道已在官网(01.AI)开启。
作为国内 AI 界的标志性人物,李开复已经撸起袖子亲自入局。不过,创新工场对 36 氪表示:塔尖孵化是投入很重的模式,但开复不是全部 ALL-IN 到新公司去了,后续还会平衡基金和新公司。
欢迎交流!
>