今天小编分享的互联网经验:Vast 创始人&CEO宋亚宸:让每个人都能生成独一无二的3D模型,欢迎阅读。
宋亚宸 | Vast 创始人 &CEO 宋亚宸
在硅星人首届 AI 创造者大会(ACC 2024)上,Vast 创始人 &CEO 宋亚宸分享了生成式 3D 的前沿进展。从最初 360P 级别的生成效果,到即将迈入 4K 时代;从专业建模师的专属领地,到人人都能 zero-shot 创作的开放平台;从静态模型到具备骨骼、动作的完整角色,3D 生成正在重塑我们创造和互動的方式。作为中国引领全球的 3D 生成技术企业,Vast 的 Tripo 模型为我们展示了一个令人振奋的未来:每个人都能成为自己世界的设计师。
以下为演讲实录:
大家下午好!今天给大家带来一些特别有趣的 AI 内容。我们公司叫 Vast,是一家专注于 3D 大模型的公司,大家可能对 3D 大模型感到陌生,或许大家已经很熟悉语言、影像、视频大模型,以及海外的音乐大模型,其实 3D 领網域也有属于自己的大模型。
我们的 3D 大模型叫做 Tripo,其核心能力是通过输入一段文字或一张图片作为 Prompt,甚至是多模态输入,例如影像、视频等,生成一个 3D 模型。这个模型的表达形式可以包含贴图、材质、PBR(物理基础渲染)等元素,它是一个有实用价值的完整 3D 模型。它可以应用于游戏、动画、元宇宙、3D 打印、工业设计等多种领網域,支持多样且富有细节的使用场景。
除了 3D 生成本身,我们还提供了各种处理功能,包括自动骨骼绑定和动作生成。这意味着,生成的 3D 模型不仅是静态的,还可以进行互動,具备动态效果。此外,我们还实现了风格化、格式转换等功能,欢迎大家直接在我们官网上体验 3D TripoAI 的功能。
https://www.tripo3d.com/
从 " 文字 " 到 " 实体 ",Tripo 究竟 " 智 " 造了什么?
目前我们的 3D 模型生成技术发展到什么阶段呢?我们可以将其与影像大模型 Midjourney 的水平作比较:在今年年初,我们的技术相当于 Midjourney V3 的水平;到现在我们已经达到了 V4 的水平,预计明年年初可以达到 V5 甚至 V6 的水平。可以把它形象地比喻为:在今年年初时,我们的生成效果类似于手机摄像头的 360P 分辨率,而现在的 Tripo 2.0 已经达到了 720P 的清晰度,明年我们有望实现 1080P 甚至 4K 的效果。这一进展基于去年发布的研究论文,表明我们在 3D 生成领網域的核心技术模块已走在前列。作为中国公司,我们在 3D 生成的技术创新方面奠定了非常核心的技术模块和能力,包括六头六纵的 CVPR 等等。此外,我们还开源了许多有影响力的项目,包括全球最大的 3D 算法框架 ThreeStudio,图生 3D 的鼻祖 Wonder3D ,以及全球最大的开源 3D 仿真生成模型。
我们的目标是在今年使静态的 3D 模型生成达到实用水平。当前生成的内容已经接近于拥有一年建模经验的建模师的水平,同时,我们正在推进双足及四足骨骼自动绑定、文字生成动作、视频生成动作等功能。预计明年,无论是我的外婆、我的孩子,还是在座的每一位,都可以零门槛、零成本地实时创造完整的 3D 内容和体验。
3D 生成在 CG、工业和元宇宙中到底有多 " 聪明 "?
当前 3D 生成技术已经达到了相当成熟的水平,接下来我们来看一下这个技术在哪些场景中能够得到广泛应用,到 2024 年,我们发现主要有四大传统场景可以被 AI 3D 技术赋能。首先是传统的 CG 行业,包括游戏、动画、影视制作、虚拟制作等领網域;其次是传统工业领網域,特别是下半年我们重点关注的 3D 打印、工业设计、家居、首饰、玩具、灯具、香薰、蜡烛、文创等行业;第三类是新兴行业,比如元宇宙、XR、具身智能仿真模拟、数字孪生、数字人等应用场景;最后一类是传统的 TMT 行业,如社交、直播、教育、电商等。
到目前为止,作为一家专注于海外市场的公司,我们的海外开发者数量已经超过 40 万人,并拥有超过一万家中小客户,他们通过我们的 API 服务于自己的 To B 客户和 To C 客户,此外,我们还服务着 400 多家大客户。
那么,3D 生成技术解决了哪些核心问题呢?首先,降低了建模成本,以前一个 3D 模型的建模成本可能需要数百美金,而现在生成成本已无限接近于零;其次,显著缩短了耗时,原来建模可能需要数周时间,而现在可以通过网络实时生成;此外,过去需要非常高级的硬體和专业建模师,现在这些要求已不再必要,这种技术还实现了 3D 模型的规模化生成,比如以前一个模型需要反复修改,现在可以生成数万个模型供挑选,这极大地提高了效率。
同时,3D 生成技术还能够满足个性化需求,未来每个人都可以根据需求生成独一无二的 3D 模型,从而实现真正的定制化。这对于 3D 打印领網域尤其重要,它分为家用 3D 打印和工业 3D 打印两部分,在家用 3D 打印领網域,我们已经与全球前十的 3D 打印公司达成合作,过去用户购买 3D 印表機后,由于不会建模而无法使用,而有了 3D 生成技术之后,不管是老年人还是小孩,都可以直接打印出自己喜欢的模型,比如钢铁侠与皮卡丘的结合体,非常有趣。在工业 3D 打印方面,我们看到许多应用场景,比如食品、礼品和文创的 3D 打印,可以根据用户需求打印出个性化的产品。举个例子,上周我们在汕头与全球最大的积木厂商高砖合作推出了 3D 积木生成大模型,现在用户只需提供一张图片或文字描述,就可以生成属于自己的积木玩具。
我们与全球六七家最大的 3D 打印公司合作,共同举办了 3D 工业设计大赛,吸引了全球近千名工业设计爱好者参赛,创作了各式各样的国际象棋设计作品。参赛者只需提供文字和图片即可直接生成完整的 3D 模型,这些模型可以立即放入家用 3D 印表機进行打印,我自己也贡献了三套作品,虽然遗憾未能入围。
每个人都能成为自己世界的设计师
除了工业设计,3D 生成还广泛应用于虚拟内容的创作。你现在看到的所有画面均来自 Tripo1.4 版本生成的 3D 内容,作为一个从未建过模的人,我用了一个早晨的时间,借助 Tripo 大模型创作出人生中第一个动画,还获得了入围奖。万圣节期间,我们也举办了相关活动,利用 3D 生成制作了许多有趣的视频和动画内容。
我们的用户中还有一些非常有创意的创作者,利用成千上万个 Tripo 生成的 3D 零件拼搭了一个太空站,这个作品在 Twitter 上被埃隆 · 马斯克转发,全球观看次数超过 9000 万次。现如今,通过 3D 生成技术,各种动画和游戏场景都能被秒级完成,例如《我的世界》这样的游戏,以前需要一年时间才能搭建的大型场景,现在不到 5 分钟就可以生成。
我们还与 UGC 内容平台、家居厂商等达成合作,在平台上用户可以快速生成各种大型的室内外场景。在元宇宙中,用户可以设计服饰、首饰、家居等 3D 元素,用于虚拟场景。无论是游戏、动画还是虚拟制作,3D 生成技术都能快速进行调换、低成本地满足需求。
未来,随着 UGC 内容的增加,越来越多非专业建模师的人将能够通过文字和图片生成自己理想中的世界,诸如 " 海贼王 " 的海洋世界、" 加勒比海盗 " 的冒险场景,甚至是 " 沙丘 " 中的神秘风光,都可以轻松打造,每个人都有机会成为自己最喜爱的游戏设计师。
此外,XR 也是一个重要的应用场景。虽然目前 XR 和 MR 还未普及,但当它们真正普及时,3D 生成将会成为一种全新的互動方式。用户只需发出指令,就可以即时生成场景和物品,例如为一个舞者生成舞台、为一个沙发配置绚丽的灯光等。这不仅仅是创作,更是一种表达,甚至可以成为 3D 日记,记录和分享每个人的日常生活与心情。
我们的使命是 " 为世界进文明,为人类造幸福 "。大家有任何合作或感兴趣的创意可以随时找我。谢谢大家!