今天小编分享的财经经验:OpenAI发布首个视频生成模型Sora,周鸿祎:意味着AGI实现将从10年缩短到1年,欢迎阅读。
"Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。"
2 月 16 日,360 创始人周鸿祎发布微博提到自己对 Sora 的看法,周鸿祎认为,Sora 的诞生意味着 AGI(通用人工智能)实现可能从 10 年缩短至一两年。
周鸿祎认为,科技竞争最终比拼的是让人才密度和深厚积累," 很多人说 Sora 的效果吊打 Pika 和 Runway。这很正常,和创业者团队比,OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI 以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。"
此外,AI 不一定那么快颠覆所有行业,但它能激发更多人的创作力。周鸿祎表示,很多人担心 Sora 对影视工业的打击,在他看来,机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。一个视频或者电影是由无数个 60 秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok 的创作工具。
谈到 Sora 最大的优势,周鸿祎表示,以往文生视频軟體都是在 2D 平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。但 Sora 产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况," 这次 OpenAI 利用它的大语言模型优势,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。"
周鸿祎提到,有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领網域的超级工具,例如在生物医学、蛋白质、基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。
" 一旦人工智能接上摄像头,把所有的电影都看一遍,把 YouTube 上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离 AGI 真的就不远了,不是 10 年 20 年的问题,可能一两年很快就可以实现。" 周鸿祎感慨。
他还提到,尽管国内大模型发展水平表面看已经接近 GPT-3.5,但实际上跟 4.0 比还有一年半的差距。OpenAl 手里应该还有一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容," 奥特曼(OpenAI CEO)是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。"
2 月 16 日,OpenAI 宣布推出全新的生成式人工智能模型 "Sora"。据了解,通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
据介绍,Sora 是基于过去对 DALL · E 和 GPT 的研究基础构建,利用 DALL · E 3 的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。同时,该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。
运用 Sora 也可以生成高清影像。 图片来源:OpenAI 官网
这意味着,继文本、影像之后,OpenAI 将其先进的 AI 技术拓展到了视频领網域。OpenAI 亦表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。
对于 OpenAI 视频生成模型的出现,业内其实早有预期,但仍有人评价称 " 比想象中来得更快 ",亦有人振奋地表示 " 我们真的看到新工业革命来临 "。
2 月 16 日,业内分析人士对《每日经济新闻》记者表示,Sora 无疑是人工智能领網域的一次重大突破,该技术不仅展示了 AI 在理解和创造复杂视觉内容方面的先进能力,而且对内容创作、娱乐和影视制作行业带来了前所未有的挑战和机遇。
每日经济新闻综合周鸿祎微博、每日经济新闻(记者:熊嘉楠、可杨)
每日经济新闻