一句话生成一分钟视频？元宇宙的救星果然是AI

今天小编分享的科技经验：一句话生成一分钟视频？元宇宙的救星果然是AI，欢迎阅读。

图片来源 @视觉中国

文 | 元宇宙新声，编辑｜高乐

作为一个在公众视野中起起落落的概念，元宇宙所承载的对未来虚拟世界无限的想象总让人感觉若即若离：

构建一个生动、丰富且充满互动的虚拟环境是元宇宙概念诞生起就面临的挑战，成本、技术、创意等诸多因素都在限制着元宇宙的发展。

虽然最近一年多以来 AI 技术突飞猛进，但在协助元宇宙虚拟世界的构建上，一直没有太大突破。

但 OpenAI 最新发布的视频生成模型 Sora 展现出了前所未有的潜力，不论是构建虚拟视频还是虚拟空间，Sora 都有了巨大飞跃。

AI，这次真的一夜之间成为了元宇宙世界的救星。

01 能视频生成，就构建元宇宙场景？

对于这样一个颠覆性创新，先不做过多赘述，直接看疗效：

这段视频的提示词为：" 几只巨大的猛犸象踏着白雪皑皑的草地走来，它们长长的毛毛在风中轻轻飘动，远处覆盖着白雪的树木和引人注目的雪山，午后的阳光洒满了缕缕云彩，远处的太阳发出温暖的光芒，低相机视角令人惊叹地捕捉到了大型毛茸茸的哺乳动物，并具有美丽的摄影和景深。"

这段视频的提示词为：" 美丽的雪城东京很繁华。镜头穿过熙熙攘攘的城市街道，跟随几个人享受美丽的雪天并在附近的摊位购物。美丽的樱花花瓣随着雪花在风中飞舞。"

这段视频的提示词为：" 动画场景的特写是一个毛茸茸的小怪物跪在一根融化的红色蜡烛旁边。艺术风格是 3D 和现实的，重点是灯光和纹理。这幅画的气氛是一种惊奇和好奇，怪物睁大眼睛、张开嘴巴凝视着火焰。它的姿势和表情传达出一种天真和俏皮的感觉，就好像它第一次探索周围的世界一样。暖色调和戏剧性灯光的使用进一步增强了影像的舒适氛围。"

几条视频展示出的 AI 视频能力已经很明显：

Sora 能够基于文本描述准确生成高度逼真的场景，同时融入丰富的想象元素，打破了以往 AI 视频内容创造的限制。

首先是长时间、一镜到底的视频生成。与当前市面上的其他 AI 视频生成工具相比，Sora 能够生成长达一分钟的视频，且在整个视频过程中保持高度的一致性和连贯性，克服了此前同类工具的最大缺陷。

同时 Sora 还能实现复杂场景和角色的准确描绘。在创造包含多个角色复杂场景的同时，Sora 能够较为精确地描绘出动作类型、对象和背景的详细信息，甚至一定程度上实现角色的情感表达。

去年，这些问题还是 AI 视频内容生成领網域面临的最大挑战。然而，今年开年不到两个月的时间，Sora 就已经证明了自己克服这些挑战的能力。

此外，Sora 还有许多令人颇感意外的亮点：

首先是其展示出了对电影拍摄语法的自发理解，能够在不同镜头之间自然过渡，推进故事的发展；同时，其对于动物毛发等细节的逼真表现，也显示出其在视频生成技术上的细致入微。

既然 Sora 可以生成这么多风格不同的连贯视频，那么更进一步的虚拟空间、虚拟世界构建自然也存在可能。

事实也确实如此，而且 AI 生成虚拟世界这一天的到来，或许会比想象中更快——正如去年的许多人也不曾预想到 AI 视频内容生成的发展会如此迅速一样。

02 元宇宙场景搭建，不再遥远

就在发布 Sora 的同一时间，OpenAI 发表了一篇名为《Video generation models as world simulators》（视频生成模型作为世界模拟器）的论文。

论文揭秘了有关 Sora 的更多关键信息，例如 Sora 可以生成任意分辨率和长宽比的视频（高达 1080p）。此外 Sora 还能够执行一系列影像和视频编辑任务，从创建循环视频到及时向前或向后延伸视频，再到更改现有视频中的背景。

其中 Sora 的 " 模拟数字世界 " 能力对于元宇宙的发展将起到关键性作用。

目前，Sora 已经能够在像《我的世界》这样的游戏中渲染世界及其动态，并控制玩家角色，在此类虚拟空间构建平台中，Sora 几乎像一个数据驱动的物理引擎，而非仅仅是一个创意生成工具。

这表明，通过 Sora 驱动虚拟空间的全自动搭建已经在逐步成为现实。

从目前的情况来看，Sora 对元宇宙的颠覆性影响主要体现在两个方面：首先，它能够直接根据需求生成虚拟视频，迅速构建元宇宙所需的场景；其次，它展现出生成可供深入探索的虚拟空间的潜力。另一方面，其有望直接生成可以深入探索的虚拟空间。

这意味着不论从技术层面、社会层面还是文化层面，元宇宙都将进入全新的发展阶段。

在技术层面，对于元宇宙的建设者来说，快速搭建丰富多样的虚拟场景变得前所未有地容易。传统上，创建逼真的虚拟环境需要大量的时间、人力和资源投入，而 Sora 的技术可以大大简化这一过程，使得元宇宙的扩展和多样化成为可能。

这不仅能够加速元宇宙的构建进程，还能够降低进入门槛，让更多的创作者和开发者有机会参与到元宇宙的构建中来。

同时，在未来此类技术将不仅能够生成静态的虚拟场景，还有望直接生成可深入探索的动态虚拟空间。这些空间不仅仅是视觉上的呈现，而是可以与之互动、探索和体验的完整虚拟世界。

元宇宙中的空间将不再是简单的背景或設定，而是充满了物理规则、动态事件和互动元素的生动世界。这将极大地丰富用户在元宇宙中的体验，使其不仅仅是观察者，而是能够实际参与和影响虚拟世界的发展。

社会层面，AI 技术的进步将使元宇宙能够提供高度个性化的体验，根据每个用户的偏好、历史行为和社互動动来定制内容和互动。这种个性化不仅限于内容推荐，也扩展到元宇宙中的角色、环境和故事情节的定制。

同时这样的变化还会催生出新的社互動动形式，如 AI 驱动的虚拟角色与人类用户之间的互动，或者通过如在线演唱会、教育课程、社交聚会等虚拟活动连接全球用户。

文化层面，就像自媒体、短视频时代对传统传媒形成冲击一样，虚拟内容创作门槛的降低，无疑会进一步冲击传统影视业的发展，同时，更多个体和文化背景的人们能够创作和分享自己的故事，促进全球文化的多样性和交流。

此外，元宇宙社群的真正兴起也会带动全新的虚拟文化兴起，这种文化将完全从元宇宙中诞生、发展和传播，形成独特的文化标识和社区归属感。

03 未来已来，但挑战依然

当然，在关于未来的畅想越来越具体的同时，对于 AI 构建元宇宙时要面临的种种问题与挑战，也到了亟待解决的时刻。

首先是技术准确性的问题，Sora 在渲染复杂场景和细节（如食物的咬痕或玻璃破碎的细节）时依然存在局限。这种局限性不仅影响生成内容的真实性，也可能限制其在某些应用场景（如法医分析或科学研究）中的有效性。

此外模拟现实世界中的物理规则对于 AI 来说仍然是一个挑战，这反映了当前 AI 技术在理解和模拟复杂自然现象方面的限制。

而除了技术上的问题外，个人形象滥用对肖像权、隐私权的侵犯；现实与虚构界限的模糊，逐步侵蚀公众对信息真实性的信任；传统的安全防护和欺诈检测方难以应对更加精细和逼真的虚假内容，从而导致诈骗等案件更加频发等，都要求政府、教育机构和技术公司共同努力，提高公众对这类技术的理解和鉴别能力。

这些问题虽然已经是老生常谈，但面对技术的突飞猛进，如何更好地用规则来规范技术的发展，已经变得迫在眉睫。

该如何面对这些进步对社会、文化和伦理带来的深刻影响？如何吸取上一轮元宇宙发展的失败教训，借助 AI 真正营造一个开放、包容且充满多样性的虚拟世界？

这都需要元宇宙的各个相关主体负责任地探索与创新，以确保共同打造出一个既丰富又充满互动，同时安全的元宇宙，赋予其更深层的意义。

AI，这次确实成为了元宇宙的救星，但元宇宙发展中要解决的问题，却并没有减少。