今天小编分享的互联网经验:谷歌DeepMind发布Genie 2模型:一键生成3D游戏,欢迎阅读。
美国当地时间周三,谷歌旗下人工智能研究机构 DeepMind 推出了一款新模型 Genie 2。作为今年初推出的 Genie 模型的更新版,Genie 2 标志着人工智能在虚拟世界生成领網域的一次重大突破。
作为一种基础世界生成模型,Genie 2 能够凭借一张图生成无限多样的、可操控且可玩的 3D 环境,用于训练和评估具身智能体。
DeepMind 宣称,Genie 2 能够生成 " 丰富多样的 3D 世界 ",用户可通过滑鼠或键盘在这些世界中自由跳跃、游泳等。经过视频训练,该模型能够精准模拟物体的互動、动画效果、照明、物理现象、反射效果以及 "NPC"(非玩家角色)的行为。
DeepMind 发布的演示视频,就生动展示了用户与 Genie 2 的互动过程。
首先,系统使用 Imagen 3 根据文字描述生成初始图片。然后,Genie 2 就能基于这张图片创造出一个完整的互动世界。最后,用户可以用键盘滑鼠在这个世界里自由探索,而 Genie 2 会实时模拟生成你看到的每一帧画面。
更重要的是,DeepMind 透露,Genie 2 具备从不同视角(如第一人称视角与等距视角)生成连贯世界的能力,这些生成的世界可持续时间长达一分钟,尽管多数情况下维持在 10 到 20 秒之间。
事实上,谷歌对世界模型研究的投入正在持续扩大。今年 10 月,DeepMind 聘请了 OpenAI 前视频生成项目负责人 Tim Brooks,同时两年前从 Meta 挖来了以开放式实验闻名的 Tim Rockt ä schel。