克苏鲁高清AI视频爆火，背后模型已开源，Demo在线可玩，前特斯拉AI总监也来围观 - 大酷樂

今天小编分享的科学经验：克苏鲁高清AI视频爆火，背后模型已开源，Demo在线可玩，前特斯拉AI总监也来围观，欢迎阅读。

可生成1024 × 576高清分辨率视频的大模型，开源了！

无论是在海草间游动的小鱼：

还是精细到眼珠子的神秘克苏鲁影像：

全部以前所未有的清晰感呈现出来，让网友直呼 "san 值狂掉 "。

这个视频生成模型开源即爆火，不仅在推特和 Reddit 上收获一众热度，就连前特斯拉 AI 总监Andrej Karpathy 也来围观了一波：

现在，Hugging Face 工程师已经搞出了试玩 demo，不少网友直接线上开炫，例如生成《星球大战》达斯 · 维德在水上冲浪的珍贵影像：

效果看起来也不错，所以它究竟是怎么训练的？

基于 17 亿参数大模型改造

Zeroscope 的 " 原型 "，是达摩院 ModelScope（魔搭）社区开源的 17 亿参数文生视频大模型。

这一版大模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间 3 个子网络组成。

其中，扩散模型采用 Unet3D 结构，通过从纯高斯噪声视频中迭代去噪过程，最终实现视频生成。

不过在 ModelScope 社区中开源的这版大模型，生成视频的效果还不能说是高清：

为此，ZeroScope 设计了两个阶段，先通过文生视频、再通过视频生视频提升分辨率，最终生成 1024 × 576 分辨率的视频：

第一步，文生视频，基于 ZeroScope_v2_576w 来生成 576 × 320 分辨率的视频；

第二步，视频生视频，基于 ZeroScope_v2_XL 来生成 1024 × 576 分辨率的视频片段。

训练上，ZeroScope 采用了 9923 个 1024 × 576 分辨率的视频片段，每个片段包含 24 帧画面，其中有 3 帧被打上标记，加起来一个是 29769 个标记帧（tagged frames）。

不过，生成高清视频，需要的硬體要求也会更高一些。

要想生成 576 × 320 分辨率、帧率 30 的视频，至少需要 7.9GB 的 VRam（显存的一种）；如果要生成 1024 × 576 分辨率、帧率 30 的视频，则至少需要 15.3GB 的 VRam。

有网友感到高兴：

又一个足以与 Gen-2 竞争的文生视频模型出现了！

甚至有网友认为，这个模型的出现已经说明，人们没必要为了 Runway 搞出来的 Gen-2 付钱了，毕竟后者效果也没有那么好。

无论如何，文生视频 AI 领網域的 " 新搅局者 " 都已经出现。

在线试玩 Demo 已出

模型一开源，Hugging Face 上就已经出现了试玩 Demo。

这里我们试着生成 " 和爱因斯坦打高尔夫球 "。

效果还不错，虽然不知道为什么爱因斯坦打着打着蹲下了（手动狗头）

从提示词类型来看，不仅可以输入比较精细的描述：

例如 " 一个男人在行驶的火车上睡觉，窗外物体飞速移动 "（A man is sleeping in his seat, inside a train running, background behind the window is moving fast）

也可以只输入简单的一句话，像是 " 巨型皮卡丘大战哥斯拉 "（Giant Pikachu versus Godzilla fight）

除此之外，也有不少网友分享了自己的作品。

例如这是 " 爱因斯坦大笑着开星球大战里的飞梭赛车 "：

还有网友 @Callimiya 生成了 " 达斯维德在课室跳舞 " 的神奇视频，似乎还有小孩子在陪他一起跳：

不过，由于试玩人数比较多，导致它有时会出 bug。这时候只要不停地提交，还是可以冲进队列中的。

当然，如果你觉得这一版的 Demo 可控性不够好，还可以尝试另一版，无论是seed （便于生成相似内容）还是推理次数都可手动调整：

怎么样，想好用它生成什么新视频了吗？

简单版试玩：

https://huggingface.co/spaces/fffiloni/zeroscope

可控版进阶试玩：

https://huggingface.co/spaces/hysts/zeroscope-v2

参考链接：

[ 1 ] https://twitter.com/_akhaliq/status/1672650155743408133

[ 2 ] https://www.reddit.com/r/aivideo/comments/14hbiql/announcing_zeroscope_v2_xl_a_new_1024x576_video/

[ 3 ] https://twitter.com/fffiloni/status/1673644193967747072

熱門排行

王治郅：杨瀚森主要的问题是速度他的速度跟郟君昊 | 2025-05-05
贸易战烧进电影院：特朗普拟重税打击外国电影習又夏 | 2025-05-05
贷款追高炒黄金的人后悔了！有人一天亏掉6年寸飛蘭 | 2025-05-05
手机电池突破8000mAh？硅碳技术的回旋镖：「折衛青柏 | 2025-05-05
贷款追高炒黄金的人后悔了！有人一天亏掉6年繁綺文 | 2025-05-05
任天堂对Genki提起Switch 2商标侵权诉讼，后郜萌運 | 2025-05-05
哪吒汽车APP和官网恢复正常知情人士：之前断袁曼雁 | 2025-05-05
极越汽车 CEO 夏一平名下青岛/义乌两家公司集玲琳 | 2025-05-05
全国经济第一大省明确，推动组建农商联合银行佼昌翰 | 2025-05-05
桑保利：亚马尔有配合意识&有点像梅西姆巴佩甄正浩 | 2025-05-05
高露现身上海虹桥机场黑色外套点缀亮色爱惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表賁芳蕤 | 2023-05-02
曹操墓，里面都有啥？衛青柏 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露賁芳蕤 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花謝飛揚 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖集玲琳 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 — 袁曼雁 | 2023-05-02
解除资格！停止一切合作佼昌翰 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
3699起联想小新mini主机上架 13代酷睿标压習又夏 | 2023-05-05
前董事长被免，天山生物全面进入“中植系”时惠惠君 | 2023-05-02
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
事关农村土地承包和农民权益，《农村土地承包郟君昊 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
200户连夜疏散，原因让人愤怒！“损失超一亿”，袁曼雁 | 2023-05-03
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《惠惠君 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊嬴覓晴 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02