大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

靠Scaling Laws炼出4D版视频生成模型,多伦多大学北交大等携手开源81K高质量数据集

2024-06-30 简体 HK SG TW

今天小编分享的科学经验:靠Scaling Laws炼出4D版视频生成模型,多伦多大学北交大等携手开源81K高质量数据集,欢迎阅读。

只需几分钟、一张图或一句话,就能完成时空一致的 4D 内容生成。

注意看,这些生成的 3D 物体,是带有动作变化的那种。也就是在 3D 物体的基础之上,增加了时间维度的运动变化。

这一成果,名为Diffusion4D,来自多伦多大学、北京交通大学、德克萨斯大学奥斯汀分校和剑桥大学团队。

具体而言,Diffusion4D 整理筛选了约 81K 个 4D assets,利用 8 卡 GPU 共 16 线程,花费超 30 天渲染得到了约 400 万张图片,包括静态 3D 物体环拍、动态 3D 物体环拍,以及动态 3D 物体前景视频。

作者表示,该方法是首个利用大规模数据集,训练视频生成模型生成 4D 内容的框架,目前项目已经开源所有渲染的 4D 数据集以及渲染脚本。

研究背景

过去的方法采用了 2D、3D 预训练模型在 4D(动态 3D)内容生成上取得了一定的突破,但这些方法主要依赖于分数蒸馏采样(SDS)或者生成的伪标签进行优化,同时利用多个预训练模型获得监督不可避免的导致时空上的不一致性以及优化速度慢的问题。

4D 内容生成的一致性包含了时间上和空间上的一致性,它们分别在视频生成模型和多视图生成模型中被探索过。基于这个洞见,Diffusion4D 将时空的一致性嵌入在一个模型中,并且一次性获得多时间戳的跨视角监督。

具体来说,使用仔细收集筛选的高质量 4D 数据集,Diffusion4D 训练了一个可以生成动态 3D 物体环拍视图的扩散模型,而后利用已有的 4DGS 算法得到显性的 4D 表征,该方法实现了基于文本、单张影像、3D 到 4D 内容的生成。

△Text-to-4D4D 数据集

为了训练 4D 视频扩散模型,Diffusion4D 收集筛选了高质量的 4D 数据集。

已开源的 Objaverse-1.0 包含了 42K 运动的 3D 物体,在 Objaverse-xl 中包含 323K 动态 3D 物体。然而这些数据包含着大量低质量的样本。对此,研究者们设计了运动程度检测、边界溢出检查等筛选方法,选取了共81K 的高质量 4D 资产。

对于每一个 4D 资产,渲染得到了 24 个静态视角的图(上图第一行),24 个动态视角的环拍图(上图第二行),以及 24 个正面动态图(上图第三行)。总计得到了超过四百万张图片,总渲染消耗约300 GPU 天。

其他数据集细节可以参考项目主页(文末附上),目前所有渲染完的数据集和原始渲染脚本已开源。

方法

有了 4D 数据集之后,Diffusion4D 训练具有 4D 感知的视频扩散模型(4D-aware video diffusion model)。

过去的视频生成模型通常不具备 3D 几何先验信息,但近期工作如 SV3D,VideoMV 等探索了利用视频生成模型得到静态 3D 物体的多视图,因此 Diffusion4D 选用了 VideoMV 作为基础模型进行微调训练,使得模型能够输出动态环拍视频。此外设计了如运动强度(motion magnitude)控制模块、3D-aware classifier-free guidance 等模块增强运动程度和几何质量。得益于视频模态具备更强的连贯性优势,输出的结果具有很强的时空一致性。

输出得到动态视角环拍视频后,Diffusion4D 借助已有的 4D 重建算法将视频建模得到 4D 表达。具体来说采用了 4DGS 的表征形式,以及使用粗粒度、细粒度的两阶段优化策略得到最终的 4D 内容。从生产环拍视频到重建 4D 内容的两个步骤仅需花费数分钟时间,显著快于过去需要数小时的借助 SDS 的优化式方法。

结果

根据提示信息的模态,Diffusion4D 可以实现从文本、影像、3D 到 4D 内容的生成,在定量指标和 user study 上显著优于过往方法。

在生成质量上,Diffusion4D 有着更好的细节,更为合理的几何信息以及更丰富的动作。更多可视化结果可以参考项目主页。

总结

Diffusion4D 是首个利用视频生成模型来实现 4D 内容生成的框架,通过使用超 81K 的数据集、以及精心设计的模型架构实现了快速且高质量的 4D 内容。未来,如何最大程度发挥 4D 数据集价值,如何生成多物体、复杂场景的 4D 内容仍有很大的探索空间!

项目地址:

https://vita-group.github.io/Diffusion4D/

论文地址:

https://arxiv.org/abs/2405.16645

—  完  —

投稿请发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容‍

附上论文 / 项目主页链接,以及联系方式哦

我们会(尽量)及时回复你

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們