今天小编分享的科学经验:又双叒一清华系团队入局大模型创业!蚂蚁领投,主打多模态,欢迎阅读。
清华计算机系教授朱军,终于正式站在了大模型创业赛的擂台上。
多方消息证实,他带领新团队成立新的 AI 公司,冲进大模型混战场——这是朱军继瑞莱智慧后,带领的第二支创业团队。
新公司生数科技,基于底层多模态通用大模型,面向影像创作、3D 资产创建等场景打造垂类应用。
量子位进一步获悉,它刚刚曝出完成了近亿元天使轮投资,目前市场估值达1 亿美金。
蚂蚁集团是这次融资的领投方,BV 百度风投和清华系专看 AI 的 VC 卓源资本紧随其后。
这是 ChatGPT 诞生后,蚂蚁集团第一次下手投资大模型公司,也是自今年 1 月 7 日阿里从蚂蚁集团实际控制人 " 身退 " 之后,蚂蚁集团对外曝光出的与 AI 初创公司第一次亲密接触。
(哪怕阿里和蚂蚁集团刚刚合作提出了 VideoComposer,通过组合式生成范式,在视频领網域同时实现时间和空间双维度的可控性,狗头 .jpg)
打造可控多模态通用大模型
量子位进一步获悉,生数科技这家公司,由蚂蚁、BV 百度风投,以及朱军第一次创业时成立的瑞莱智慧 RealAI联合孵化而来。
目标是 " 致力于成为全球领先的生成式人工智能基础设施及应用建设者 "。
据悉,生数科技研究团队主要来自清华大学人工智能研究院,主要来自朱军带领的课题组。
该课题组致力于贝叶斯机器学习的理论和算法研究,是国际上最早研究深度概率生成模型的团队之一
工作主要面向针对深度生成式模型的骨干网络、高速采样、可控生成、大模型训练等全栈底层原创研发。
而目前推进中的业务,是聚焦 AIGC,打造可控的多模态通用大模型,覆盖文本、影像、3D 模型、音视频等多个模态。
要覆盖的商业场景,包括艺术设计、游戏制作、影视后期、内容社交等。
生数科技大模型目前已处于迭代中,现阶段已经开始落地实践影像生成、3D 内容生成和视频生成等业务。
业务水平究竟怎样?
面对量子位的上门追问,生数科技给出如下回答:
论视频生成,团队目前聚焦于文本的视频自动化编辑。
△生数科技视频生成效果(中)和 Runway 生成效果(右)
论3D 生成,团队提出新算法ProlifcDreamer,从贝叶斯建模和变分推断的角度,重新形式化了 text-to-3D 问题。
该技术能够在无需任何 3D 训练数据的前提下,通过文本描述,自动生成高质量带纹理的三维网格与 NeRF 图。
包括生成复杂效果和 360 ° 场景、根据同样的描述生成不同形式的 3D 内容。
以及首个实现了基于三视图自动生成高质量的 3D 内容," 是目前业内最接近产业级应用的 3D 生成效果 "。
论影像生成,团队旗下多模态大模型UniDiffuser,今年 3 月开源,是首个基于 Transformer 的多模态扩散大模型。
能够很好地在构图、风格、画面精准度等方面把握用户意图。
现状,是 " 正自研新一版的产业级模型,其中,影像生成效果已超过 Stable Diffusion 最新版基础模型水平 ";
计划,是 " 将于年内赶超 Midjourney 最新版本 "。
并且透露道,过去两年,生数科技团队在 ICML、NeurIPS、ICLR 等计算机顶会发了 20 多篇相关论文,扩散模型是团队的主要发力阵地。
先后提出的采样算法 Analytic-DPM、DPM-Solver 等成果,被 DALL · E、Stable Diffusion 等应用。
论文成果颇丰,生数科技接下来的任务,就是把基础科研推向应用市场。
生数科技背后团队
生数科技领兵冲刺的带头人朱军,IEEE Fellow,现任清华大学计算机系教授。
同时也是清华人工智能研究院副院长,清华智能技术与系统国家重点实验室主任,智源首席科学家。
求学期间,他在清华计算机系拿下本科和博士学位,师从中国科学院院士、清华计算机系教授张钹。
△朱军
2011 年,在张钹的邀请下,朱军回到清华计算机系任教。
去年,师徒二人围绕扩散概率模型合作的工作《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》,拿下 ICLR 2022 杰出论文奖。
朱军长期从事机器学习、贝叶斯方法、深度学习、数据挖掘等方面的研究,在顶会 ICML、NIPS、IJCAI、AAAI、 JMLR、PAMI 等发表论文 100 余篇,连续多年担任 ICML、NeurIPS 领網域主席。
(贝叶斯方法是自然语言处理、机器学习、影像识别等 AI 领網域的重要基础。)
2020 年,朱军团队发布深度强化学习平台Tianshou 天授。
这是一个针对强化学习的灵活可靠的基础设施,能够以极简代码极速实现强化学习的诸多算法和功能,在 GitHub 上有用 6.4k+ 星星。
话说回来,生数科技不是朱军在科研和产业之间的第一次尝试。
他的首次创业要回溯到 2018 年。当时,他支持自己的学生田天创办了公司瑞莱智慧 RealAI,专注提升人工智能的安全性。
并且和张钹共同担任该公司的首席科学家。
这一次正式入局大模型,朱军再次选择站在新公司 " 运筹帷幄 " 的位置上。
而根据企查查 App 资料,成立于 3 月的生数科技,在 4 月时进行了一次法人变动,从 " 田天 " 变更为 " 唐家渝 "。
唐家渝其人,现在是生数科技的联合创始人兼 CEO。
他同样毕业自清华大学计算机系,师从 NLP 组教授孙茂松。
此前,对唐家渝外界的主要公开身份是瑞莱智慧的副总裁,先后负责公司产品团队、AI 安全产研团队及业务。
而从再往前的简历可以看到,唐家渝曾在腾讯优图实验室工作。
△唐家渝
最新能公开的消息是,生数科技团队近期在扩散模型工作上,提出了一种新的训练策略,能够尽可能用较少的标注,持续优化多模态生成效果。
如此看来,生数科技的多模态大模型可能武力值要再 +1 了?
以及不得不感慨一句,清华系 AI 初创公司在这一波大模型创业中,真的是风头无两。
哪怕单纯从数量上说,生数科技也已经是又双叒叕一个了~
参考链接:
[ 1 ] https://github.com/thu-ml/tianshou
[ 2 ] https://www.cs.tsinghua.edu.cn/info/1121/3551.htm
[ 3 ] https://www.qcc.com/firm/3903aa13076b2df3918d75f504bb9395.html
— 联系作者 —
>