今天小编分享的科学经验:Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群,欢迎阅读。
白交 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
Stable Diffusion 要王者归来了?
Stability AI CEO Emad Mostaque 最新推文,四段视频引人无数遐想。
不少网友怀疑,这是 Stable Video Diffusion 新版本的演示 Demo。
因为从效果上看,不管是画面清晰度、一致性还是流畅度都十分惊人。
比如这只毛绒熊带着泳镜潜水。
毛绒熊动作十分流畅,甚至还眨眼睛。而背后也有丰富的海水细节。
再加上 Emad Mostaque 本人,自今年 1 月 1 日开始就消失了几星期,始终未曾在社交网络上露面。
网友觉得,这一波更像是憋了个大新闻。Stability AI is back?
(一度以为 Stability AI 已经在竞争中落后)
Stable Diffusion 杀回来了?
从释出的四秒 Demo 来看,应该是针对 SVD 视频生成功能的更新。
不过基于文本还是影像生成尚不能断定,直接来感受一下效果。
还有这种动漫风夜晚的街道。
去年 11 月,Stable Video Diffusion(SVD)正式问世,当时除了支持影像、文本到视频之外,还支持物体 3D 合成。
按照当时透露的计划, SVD 只是作为基础模型,接下来还将继续拓展,建立起整个 Stable Diffusion 的生态系统。
当时网友对 Demo 的反馈包括光影不对、而且整体不连贯(视频帧与帧之间闪烁)。
而从现在 Demo 看,以一个类似视频作对比:绿色机器人躺在床上。
可以看到,机器人,以及旁边的杯子灯盏,甚至床被枕头的褶皱细节都更为丰富了。
而且在机器人脸上也有明显的光影映射。
不过更多更新信息还得等官方版本发布才能知晓。
值得一提的是,在这条推文之后,Emad Mostaque 还发了条类似的。
没有文字,四张静图。
网友们表示了期待。" 希望这个模型能全方位地超越 SDXL,并更好地及时迭代。"" 这是 SD3?"
不过这个地球西红柿是什么鬼???
又是同一天,他们的 StableLM2 1.6B 发布,一个只有 16 亿参数的小语言模型。它经过了英语、西班牙语、德语、法语、葡萄牙语和荷兰语等多语种训练。
几天前,他们刚发布新年以来第一个大语言模型 Stable Code 3B。
如此频繁的进展,Stability AI 莫不是真的要翻身了?
决战视频生成
之所以要说翻身,因为 Stability AI 在上一波文生图赛道里的确备受瞩目,Stable Diffusion 的爆火,让它一度成为全球最受关注的 AI 独角兽。
但随着 Midjourney 的出现,以及 OpenAI 谷歌在内的频繁进展,而内部也不安生,包括 CEO 疑似剽窃成果、挪用公款,公司商业模式不明晰、拖欠工资等情况爆雷,Stability AI 一度陷入风波之中。
去年 11 月官宣进军视频生成赛道,彼时已经有 runway 和 pika 这样的热门玩家出现了。
如今 SVD 新版本疑似亮相,之所以受到众人关注,除了本身企业之外, 还同当下正在高能爆发的视频生成赛道密切相关。
不少网友直言:真是一波又一波的卷,一家比一家更卷。
要么是比版本发布迭代,这段时间国内大厂阿里字节等新进展频出。要么是从生成效果,清晰度、流畅性,前段时间,Moonvalley 横空出世,惊呆不少人。
又或者在可控性等上面去卷……
这不就在前几天,runway 的 Gen-2 再进化——
只需 5 个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
那么在视频生成这个赛道,你看好 Stability AI 吗?
参考链接:
[ 1 ] https://twitter.com/StabilityAI/status/1747352719487054105
[ 2 ] https://x.com/emostaque/status/1748405750907457548?s=46&t=HBob6gxh8cOfZTIbieKeSA
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>