大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law

2024-09-21 简体 HK SG TW

今天小编分享的科学经验:AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law,欢迎阅读。

《黑神话 · 悟空》的火爆,带火的不仅是 3D 游戏本身,还有背后暗潮汹涌的AI 3D 生成技术。

一直以来,外界对 3D 大模型赛道的关注度都稍逊于语言模型和视频模型。然而,全球 3D 大模型选手们则都在暗中较量、默默发力,从 a16z 押注的 Yellow,到李飞飞的 World Labs,3D 大模型的迭代速度是没落下一点。

就在刚刚,国内 3D 大模型头部玩家VAST更新了旗下的大模型 Tripo,是基于千万级高质量原生自有数据库训出来的那种超强版本。

而 3D 生成新工具的玩法也更进一步,文字、单图、多图都能作为输入。

至于几何精细度和图片还原度等方面的效果嘛,先小放一段用新工具生成 3D 模型的视频,大家直观感受一下:

在官宣新品之余,VAST 又带来另一则重磅消息,即公司连续完成了数亿元融资,这也是 3D 大模型赛道的最大融资金额。

当然,融资方面的引领,也只是技术实力的展现。因为 VAST 的技术和应用场景,确实够顶。

再次拉升 AI 3D 天花板的模型叫做Tripo 2.0。

Tripo 2.0 先在几秒内生成形状几何预览,再接着几秒内为其 " 贴上皮肤 ",⽣成纹理及 PBR。

目前 Tripo 2.0 已正式上线,大批网友已经开启了实测。

量子位也在第一时间凑上了热闹。

Tripo 2.0 支持文生 3D、单图生 3D;Tripo 1.4 版本也支持多图生 3D。

输入一个 prompt,一次能生成 4 个 3D 模型。

根据输入的不同,量子位的上手实测结果在下面分为两个部分,即:

文生 3D模型

图生3D 模型

Tripo 2.0 文生 3D 模型实测

话不多说,直接先来看一波文生 3D 效果。

第一步,生成几何形状「动漫少女的半身形象」。

就复杂结构生成效果来看,细节还是很足的:

接下来给它贴好皮肤。

在不超过 20 秒的生成时间里获得精细的纹理和层次;普通水平的人工建模要达到这种细节,耗时可能要上千倍。

换一道题!用 Tripo 2.0 生成卡通形象的全身形象试试看。

先生成个卡通小矮人试试~

出来的效果,那是相当可爱(发出宋丹丹的声音),belike:

我们又生成了一个小怪物,并且把单个生成的模型放大来看。

360 度旋转,肉眼没有发现 bug 和瑕疵。要知道,怪物后背密密麻麻的尖刺细节,是人工建模师的噩梦,一般都会规避这种繁复的设计,但是对 tripo 来说毫无压力。

加大难度,再复杂一些 3D 模型生成任务也同样能驾驭。

透视结构理解过去一直是生成式 AI 的卡点,以生图模型的手指问题为代表。3D 模型空间结构极为重要,我们可以看到 Tripo 强大的透视结构理解能力,完美生成了复杂结构的模型任务。

最后再放个厉害的,下面这个购物车什么难度都不用多说了:

Tripo 2.0 图生 3D 模型实测

再来看一波图生 3D 的效果。

单图生 3D 模型的算法最考察对图片的空间信息理解和还原度,这次我们横向对比一些市场的其他玩家效果。

友情提示,下面每张展示图中的最后一个 3D 模型,都由 Tripo 2.0 生成。

来,上一支玫瑰花的图生模型对比展示!

对比可以清晰看到,只有它生成的几何形状 360 度无死角,花朵和枝叶完整度最高:

贴图之后,在还原原图的颜色、质感这一块,也是效果最好的:

测完植物生成效果,我们又测试了无生命物体的图生模型。

丢给模型一个俄罗斯复活节彩蛋图片作为输入,Tripo 2.0 的输出效果最有 " 浮雕感 ",对比来看,纹理细节都是最精致的:

进行多次测试后,不难发现 Tripo 2.0 在全方位的生成表现上都有显著差异。

比如生成的 PBR 材质具有⾼保真度,保留了原图表⾯属性和视觉效果:

再比如,不管侧面、背面,每个面都能捕捉复杂的原图特征:

Tripo 2.0 不仅生成质量让人眼前一亮,更高的可控性也是一大特点。

输入不仅支持多模态,当选择文生 3D 模型模式时,还支持输入负向 prompt(就是不让生成模型中带有什么元素)。

对输出模型姿态的控制性也很绝。

既能自定义所生成 3D 模型头、腿、手臂等比例。

还能 "A-pose""T-pose" 两个姿势随便选,秒秒钟设定大长腿:

生成好的 3D 模型还可以一键绑定骨骼、风格化。

3D 模型人拥有自己的乐高!

更多玩法大家可以慢慢探索,欢迎大家评论区共创~

Tripo 2.0 效果如此哇塞,所以——

Tripo 2.0 如何炼成?

从技术上层层解剖,Tripo 2.0 在实现过程中打满了一个词:3D Scaling Law。

首先,Tripo 2.0 基于海量千万级 3D ⾼质量数据库,采⽤概率性的⽣成式建模⽅法,通过学习捕捉⼤规模数据中的⼏何和材质分布。

由此,Tripo 2.0 更好地保证了输出的质量、增强了模型的鲁棒性和泛化能⼒。

其次,它采用了DiT 和 U-Net 模型的复杂混合架构。

DiT 擅⻓捕捉 3D 结构中的全局上下⽂和⻓距离依赖关系,而 U-Net 精于保留精细的细节和局部特征,Tripo 2.0 正是融合了这两种架构的优势。

再者,采⽤最先进的训练算法,Tripo 2.0 ⼏何和材质⽣成模型均基于最先进的⼤规模流模型,拥有数⼗亿参数。

同时采⽤了 guidance distillation 和 step distillation,通过蒸馏提⾼效率,在不牺牲质量的前提下⼤幅优化了性能。

种种技术加持下,在 3D 生成形状、纹理质量、细节表现、输⼊条件的遵循性以及输出多样性⽅⾯,Tripo 2.0 拿下新 SOTA,成为新晋 " 五边形 " 战士:

之前,Tripo 2.0 背后团队还与其他团队合作,推出了一箩筐学术成果,被 Siggraph、CVPR、ICLR、ECCV 等顶会接收。

比如Wonder3D,通过一个跨網域扩散模型生成一致性的多视图法线贴图和相应的彩色影像,然后利用一种新颖的法线融合算法快速、高质量地重建 3D 几何体。

与现有的基于分数蒸馏采样(SDS)的方法相比,Wonder3D 在效率、一致性和细节上都有显著提升,能够在 2-3 分钟内完成重建。

再比如TGS:Triplane Meets Gaussian Splatting,同样被 CVPR 2024 收录。

这项技术利用 Transformer 网络和一种新颖的 Triplane-Gaussian 混合表示,使得从单张图片中重建 3D 模型变得更加高效和精确。

更多细节,感兴趣的童鞋可以自行查阅。

总之,Tripo 2.0 并非一蹴而就,背后有众多技术积累。

3D 世界的 Scaling Law

最后,我们来正式认识一下 Tripo 2.0 背后的公司。

VAST,去年 3 月成立,是一家专注于在 3D 大模型研发的 AI 公司。

公司目标是 " 通过打造⼤众级别的 3D 内容创作⼯具,建⽴ 3D 的 UGC 内容平台,让基于 3D 的空间成为用户体验、内容表达、提升新质⽣产⼒的关键要素。"

公开资料显示,该公司的 CEO、CTO 都是商汤出身:

创始人兼 CEO 宋亚宸,曾在商汤落地过多个从零到一的 AI 项目,曾参与大模型六小强之一 MiniMax 的创立;CTO 梁鼎,清华本硕博,师从戴琼海院士,曾任商汤通用模型负责人。

成立一年半以来,这家公司动作频频。

首先在今年年初,亮相了自家首个 3D 大模型Tripo 1.0。

Tripo 1.0 参数量数十亿,用上它,从单图 / 文字生成 3D 网格模型仅需要 8 秒。

△3D 建模经典之「牛油果扶手椅」,Tripo 1.0 生成

上线半年内,Tripo 1.0 全球用户生成的 3D 模型超过了 500 万个。

500 万个是什么概念呢?约为全球前三大 3D 模型数据库总和。

到了今年 3 月初,VAST 又联合 Stable Diffusion 背后的 Stability AI,共同推出了开源的 3D 基础模型TripoSR。

因其能够达成 "0.5 秒完成单图生成 3D 模型 " 的成就,在 3D 生成领網域的开源届广受欢迎,至今 GitHub 上揽星 4.3k。

现在,Tripo 2.0 又问世了,已经在线可玩。

得益于 3D Scaling Law 带来的效果提升,Tripo 的这三次更新时间跨度仅仅有 9 个月。

而且有速度也有质量,效果在业内外颇受认可。

拿一则新消息来佐证一下:不久前,世界最大在线游戏开发平台 Roblox 官宣入局 AI 3D 生成,但截至目前,Tripo 都是 Roblox 玩家最风靡的 3D 建模的趁手工具。

接下来的 VAST 会带着 Tripo 去向什么方向?

量子位寻回的答案是,至少在技术方面,VAST 会持续追寻 3D 生成式 AI 的 Scaling Law研究模型规模、数据量和生成质量之间关系的基本原理,同时寻找数据、表征和模型架构的可扩展范式。

既致力于推动 3D 生成式 AI 的边界,也会不断探索更整体的(Holistic)3D 生成。

就还挺令人期待的。

在语言模型和视频模型带给这个世界一点小小震撼过后,人们也希望 3D 生成赛道能滋养出属于自己的 ChatGPT 时刻。

毕竟 3D 的 AI 生成与其它 AI 生成赛道相比,情况比较特殊,不仅 AI 生成后人工二改技术难度大,如果模型效果表现不好,想要仅凭增加抽卡次数来达到满意度,不如趁早自己画(不是)。

好在 3D 生成行业深孚众望,一路前行着——

回顾过去的两年时间,尤其在 2023 年末到 2024 年间,3D 生成技术得到了快速发展。

不仅在效果、速度方面均有提升,还实现了 " 效率高、成本低、创新性强和可定制性强 " 的特点。

技术飞快进步的同时,整个行业的人才密度都在不断增大。

国内,以 VAST 为代表,初创公司多来自全球知名高校和科研机构;放眼国外,AI 教母李飞飞首次创业成立的空间智能公司World Labs,也着眼于 3D 生成世界,宣布长期目标是构建大世界模型(LWM)来感知、生成 3D 世界并与之互動。

众人拾柴火焰高嘛。

可以说,因为人才与技术、效果与场景的清晰和进步,现在 AI 3D 生成这个赛道,渐渐走进了更多人的视野之中。

而 3D Scaling Law 或将带来的突破性进展,似乎已经预示了人工智能领網域下一个焦点的方向。

—  完  —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們