制作成本降低97.5%！“清华版Sora”视频模型Vidu全球首发主体参照技术

今天小编分享的汽车经验：制作成本降低97.5%！“清华版Sora”视频模型Vidu全球首发主体参照技术，欢迎阅读。

" 清华版 Sora"Vidu 再度迎来重要更新。

钛媒体 App 9 月 12 日消息，在 11 日生数科技媒体开放日上，由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型 Vidu，公布全球首个 " 主体参照 " ( SubjectConsistency ) 技术功能更新，能够实现对任意主体的一致性生成，不局限于单一对象，而是面向 " 任意主体 "，无论是人物、动物、商品，还是动漫角色、虚构主体，都能确保其在视频生成中的一致性和可控性。

生数科技表示，Vidu 是全球首个支持 " 主体参照 " 能力的 AI 视频大模型，打破了分镜头画面对视频内容的限制，改变了视频创作的 " 游戏规则 "，提供了一定自由度和创新空间。目前，Vidu 已经上线，视频生成最长可以生成 32 秒，用户可以免费注册体验 AI 视频生成功能。

" 主体参照 " 技术对于专业创作领網域影响很大。生数科技透露，Vidu 与北京电影节 AIGC 短片单元最佳影片得主、Ainimate Lab 合作打造的动画短片《一路向南》，画面质量接近传统动画制作标准，但成本仅为传统流程的 1/40，传统 600 人天，而基于 Vidu 做的是 15 人天，包含导演、美术、建模、灯光、渲染等不同 " 工种 "，相当于视频制作成本降低了大约 97.5%，Vidu 大大缩短了制作周期并显著降低成本。

生数科技联合创始人、CEO 唐家渝表示，" 主体参照 " 这一全新功能的上线，代表着 AI 完整叙事的开端，AI 视频创作也将迈向更高效、更灵活的阶段。无论是制作短视频、动画作品还是广告片，在叙事的艺术中，一个完整的叙事体系是 " 主体一致、场景一致、风格一致 " 等要素的有机结合。

今年 4 月，清华大学人工智能研究院副院长、生数科技联合创始人兼首席科学家朱军教授发布了长时长、高一致性、高动态性视频大模型 Vidu，可以一键生成长达 16 秒的视频。此次技术更新，Vidu 视频最长可以生成 32 秒。

生数科技联合创始人、CEO 唐家渝

会后群访中，针对与快手、字节等大厂市场竞争话题，唐家渝表示，无论是动态基础能力、语义理解，Vidu 都是目前业绩最好、全球首发的能力情况，这是当下非常直观的竞争优势。未来公司坚持自主的底层算法研发，不断突破认知边界，提升现在视频能力的天花板，有更好的稳定提升和补充。

" 我们也不是只做基础技术的科研机构，而是一家商业公司，在这个过程中会持续围绕落地行业进行技术能力迭代，努力在实际场景中也有好的一些磨合打造，保持我们对落地这件事情上理解的领先性。" 唐家渝称。

谈到视频模型商业化，唐家渝透露，生数落地商业模式有两种：SaaS 订阅模式；API 形式，即模型能力输出形式提供给客户（MaaS ) ，客户直接调用模型的能力。自 7 月 30 日上线以来，我们在全球范围内已收到数万个 API 接入申请。另外，目前从收入角度看，B 端市场的收入更大，是比较明确、比较直接的需求在其中，因此 B 端是生数科技长期非常重点的方向；C 端增长曲线非常高，在不断的探索过程中。

据悉，生数科技成立于 2023 年，是 " 清华系 " 多模态企业的核心团队成员，由清华系 AI 公司瑞莱智慧 RealAI、蚂蚁集团和 BV 百度风投联合孵化成立。今年 6 月，" 生数科技 " 完成数亿元 Pre-A 轮融资，目前生数科技投资方包括直投基金北京市人工智能产业投资基金，百度，中关村科学城公司，启明创投，蚂蚁集团、BV 百度风投、卓源亚洲、锦秋基金、达泰资本、智谱 AI 等机构。

钛媒体 App 了解到，近期生数科技新增工商实体 " 生數科技（香港）有限公司 "，推测该公司接下来可能会考虑港股 IPO 或发力海外市场等。

（本文首发于钛媒体 App，作者｜林志佳，编辑｜胡润峰）