今天小编分享的科技经验:引爆科技圈,Sora背靠什么团队?,欢迎阅读。
【环球时报特约记者 任重 环球时报驻美国特约记者 冯亚仁】美国人工智能公司 OpenAI 近日推出的生成式人工智能模型 Sora,震动全球科技界,其背后的研究团队也浮出水面。根据 OpenAI 官网介绍,Sora 团队包括两名研发负责人威廉 · 皮伯斯和蒂姆 · 布鲁克斯,系统负责人康纳 · 霍姆斯,以及 12 名核心成员。而这支团队十分年轻,成立时间尚未超过一年。
OpenAI 人工智能文生视频大模型 Sora 资料图 图源:视觉中国
两名 2023 年毕业的博士
皮伯斯和布鲁克斯二人就读于加州大学伯克利人工智能研究所,都是 2023 年才毕业,博士导师同为该所教授阿廖沙 · 埃夫罗斯。
根据相关信息,皮伯斯在麻省理工学院读本科,主修计算机科学,曾参与 GAN(生成式对抗网络)和 Text2Video 的研究。他和纽约大学的华人学者谢赛宁一起合著的论文《基于 Transformer 架构探索一种新的扩散模型》被认为是 Sora 背后的重要技术基础之一。
威廉 · 皮伯斯
Meta 首席人工智能科学家杨立昆此前曾转发谢赛宁的推文,认为 Sora 基本上是基于上述被 2023 国际计算机视觉大会收录的论文提出的框架设计而成。而该论文曾因 " 缺乏创新 ",被国际计算机视觉与模式识别会议拒绝。
Sora 被推出之后,谢赛宁在社交媒体上表示:"Sora 是皮伯斯等在 OpenAI 的呕心之作,我虽然不知道细节,但是皮伯斯告诉我,他们每天基本不睡觉,高强度工作了一年。跟我的关系是什么呢,只能说是一点关系都没有。"
团队另一名主要负责人布鲁克斯研究领網域是模拟物理世界的大规模生成模型。他本科毕业于埃夫罗斯曾经执教的卡内基梅隆大学,主修逻辑与计算,辅修计算机科学。2017 年,本科毕业的布鲁克斯先到谷歌工作了近两年,之后到伯克利人工智能研究所攻读博士。在伯克利读博期间,他的主要研究方向就是图片与视频生成,与导师埃夫罗斯教授和同组博士后一起开发人工智能图片编辑工具 InstructPix2Pix。布鲁克斯毕业后加入 OpenAI,成为影像生成系统 DALL-E 的主要研究人员。
蒂姆 · 布鲁克斯
布鲁克斯还是个多才多艺的人,喜欢摄影和音乐。他高中时的摄影作品曾获得国家地理最佳摄影和国家野生动物联合会的奖项,他还曾在纽约百老汇的灯塔剧院演出。
艺术生、"00 后 "、多名华人
Sora 的系统负责人是康纳 · 霍姆斯,他本科和研究生都就读于科罗拉多矿业大学,后来获得了高性能计算博士学位。毕业后,霍姆斯到微软工作,并致力于解决在推理和训练深度学习任务时遇到的系统效率问题,在大语言模型、循环神经网络等领網域都拥有丰富的经验。去年 12 月,霍姆斯加入 OpenAI,参与 Sora、DALL-E 等项目。
在 Sora 团队中,也有 OpenAI 的 " 老人 ",阿迪蒂亚 · 拉梅什便是其中一位。他是 DALL-E 的创造者,主导了 3 代 DALL-E 的研究。阿迪蒂亚曾就读于纽约大学,并在杨立昆实验室参与过一些项目。其间阿迪蒂亚已经在研究生成式模型,并和杨立昆共同发表论文。杨立昆在社交媒体上写道,阿迪蒂亚本来毕业后要读博士,但在 OpenAI 实习后,就直接留下了。
此外,团队成员大卫 · 施努尔和乔 · 泰勒都没有博士学位。前者毕业于加州大学圣塔芭芭拉分校,后者毕业于美国旧金山艺术大学,在包括用户界面设计、网页设计、艺术指导等多方面拥有很强的专业技能。
Sora 团队成员甚至还有 "00 后 "。团队中的威尔 · 德普生于 2003 年,2022 年刚从密歇根大学计算机系毕业,2023 年 7 月入职 OpenAI,并于今年 1 月加入 Sora 项目小组。
此外,Sora 团队中还有多名华人。其中,靖礼 2014 年毕业于北京大学物理系,2019 年获得美国麻省理工学院物理学博士学位,2022 年加入 OpenAI,曾参与 DALL-E 3 的开发。里基 · 王则是今年 1 月刚从 Meta 跳槽到 OpenAI。高中时期,他在中国的一所学校就读,本科毕业于加州大学伯克利分校。加入 OpenAI 前,他曾在 Meta 和 Instagram 工作过。还有名为郭宇飞(音)的华人团队成员尚未有太多公开信息介绍,不过在 OpenAI 两大主要项目—— GPT-4 和 Sora 中,都有此人名字。
团队还将扩大
OpenAI 在 Sora 视频公布时称,Sora 是能够理解和模拟现实世界的模型基础,相信这一功能将成为实现通用人工智能的重要里程碑。
Sora 团队正在持续扩张。施努尔 17 日在 X 平台发布招聘广告,寻找有视频基础设施相关经验的人员。
显然,Sora 推出后,该团队的研发工作并未停止。美国《麻省理工科技评论》报道称,OpenAI 表示,它还在调整为 DALL-E 3 开发的假影像检测器,以便与 Sora 一起使用。阿迪蒂亚说," 在我们发布视频之前,我们肯定需要得到更多的反馈,了解更多需要解决的风险类型。"