今天小編分享的科技經驗:騰訊混元推出5款3D生成模型,全部開源,歡迎閱讀。
3 月 18 日,騰訊混元宣布推出 5 個全新 3D 生成模型,模型生成速度更快、細節更豐富、材質表達更逼真,并且全部開源。同時,其自研的 3D AI 創作引擎也迎來更新,新增多視圖輸入、模型智能減面、格式全兼容等能力,面向 C 端用戶全面開放使用。
騰訊混元 3D 生成模型家族
據了解,5 個開源模型均基于 Hunyuan3D-2.0 打造,其中 Turbo 系列模型在保證高精度和高質量的基礎上,對幾何生成模型進行了數十倍的加速,确保整個生成過程能夠在 30 秒内完成。
這一加速能力來源于騰訊混元提出的 3D 生成加速框架 FlashVDM ,它突破了傳統模型的效率壁壘,将大規模 3D 模型的生成時間提升到秒級範圍,對開源社區和工業界部署都具有重要價值。
多視圖版本模型,例如 Hunyuan3D-2-MV,通過結合多個視圖的輸入信息,能夠更好地捕捉細節并生成符合用戶預期的 3D 資產。而輕量級 mini 系列模型,通過模型架構優化與運行效率提升,可進一步降低算力成本,其幾何模型可以部署在 4080 顯卡甚至蘋果 M1 Pro 芯片上,為模型的應用擴展了場景。
騰訊于 2024 年 11 月發布第一代 3D 生成大模型,在行業内率先支持文本和影像生成 3D 内容,2025 年 1 月,騰訊混元 3D 生成大模型發布 2.0 版本(Hunyuan3D-2.0 ),在文本一致性、幾何精度和畫面質量等多維度評測中表現超越業内排名第一的大模型。
得益于模型的進步,面向創作者的 C 端應用騰訊混元 3D AI 創作引擎也迎來更新。
騰訊混元 3D AI 創作引擎支持多視圖輸入
新版引擎突破性支持多視圖輸入,只需上傳 2-4 張标準視角圖片,就能快速生成高精度、高質量的 3D 模型,針對遊戲制作、3D UGC 創作等場景,可以大幅降低 3D 設計師從多視圖原畫到三維模型的制作成本。
3D 智能減面技術,讓模型更易于渲染
騰訊混元 3D AI 創作引擎可通過 3D 智能減面能力,自适應生成幾百至數千面的三角面,進一步提升幾何邊緣平滑度,生成結果可在低面片的基礎上最大化體現模型細節,讓模型布線更加規整,以降低渲染難度,提升模型可用率及生產效率。
此次更新還實現了 PBR(基于物理渲染技術)的材質生成效果提升,通過物理特性模拟技術,賦予模型更真實的顏色與材質表達,讓數字資產在光影互動中展現電影級質感。
左圖:普通圖片,右圖:生成 PBR 模型
兼容性上,除通用 OBJ、GLB、FBX 外,可輸出 STL、USDZ 及 MP4 等主流格式,無縫連接 3D 打印工具,也可支持模型快速預覽及移動端實時互動,滿足不同業務場景對 3D 模型格式的使用要求。
圖(左至右):UGC 玩具、商品素材生成、遊戲 3D 角色效果
在騰訊,混元 3D 生成模型已經開始應用于用戶生成内容(UGC)、商品素材合成、遊戲 3D 資產生成等場景,遊戲業務中,大模型生成的 3D 模型已能滿足部分遊戲 3D 資產标準,包括幾何布線合理性、貼圖準确性與骨骼蒙皮合理性等。(騰訊科技特約作者 曉靜)
騰訊混元 3D 官網體驗及開源社區地址:
1、 3D 創作引擎體驗:https://3d.hunyuan.tencent.com/
2、 huggingface:https://huggingface.co/spaces/tencent/Hunyuan3D-2mv-Turbo
3、 Github:GitHub - Tencent/Hunyuan3D-2: High-Resolution 3D Assets Generation with Large Scale Hunyuan3D Diffusion Models.