今天小編分享的汽車經驗:制作成本降低97.5%!“清華版Sora”視頻模型Vidu全球首發主體參照技術,歡迎閱讀。
" 清華版 Sora"Vidu 再度迎來重要更新。
钛媒體 App 9 月 12 日消息,在 11 日生數科技媒體開放日上,由生數科技和清華大學聯合研發的國内首個純自研原創視頻大模型 Vidu,公布全球首個 " 主體參照 " ( SubjectConsistency ) 技術功能更新,能夠實現對任意主體的一致性生成,不局限于單一對象,而是面向 " 任意主體 ",無論是人物、動物、商品,還是動漫角色、虛構主體,都能确保其在視頻生成中的一致性和可控性。
生數科技表示,Vidu 是全球首個支持 " 主體參照 " 能力的 AI 視頻大模型,打破了分鏡頭畫面對視頻内容的限制,改變了視頻創作的 " 遊戲規則 ",提供了一定自由度和創新空間。目前,Vidu 已經上線,視頻生成最長可以生成 32 秒,用戶可以免費注冊體驗 AI 視頻生成功能。
" 主體參照 " 技術對于專業創作領網域影響很大。生數科技透露,Vidu 與北京電影節 AIGC 短片單元最佳影片得主、Ainimate Lab 合作打造的動畫短片《一路向南》,畫面質量接近傳統動畫制作标準,但成本僅為傳統流程的 1/40,傳統 600 人天,而基于 Vidu 做的是 15 人天,包含導演、美術、建模、燈光、渲染等不同 " 工種 ",相當于視頻制作成本降低了大約 97.5%,Vidu 大大縮短了制作周期并顯著降低成本。
生數科技聯合創始人、CEO 唐家渝表示," 主體參照 " 這一全新功能的上線,代表着 AI 完整叙事的開端,AI 視頻創作也将邁向更高效、更靈活的階段。無論是制作短視頻、動畫作品還是廣告片,在叙事的藝術中,一個完整的叙事體系是 " 主體一致、場景一致、風格一致 " 等要素的有機結合。
今年 4 月,清華大學人工智能研究院副院長、生數科技聯合創始人兼首席科學家朱軍教授發布了長時長、高一致性、高動态性視頻大模型 Vidu,可以一鍵生成長達 16 秒的視頻。此次技術更新,Vidu 視頻最長可以生成 32 秒。
生數科技聯合創始人、CEO 唐家渝
會後群訪中,針對與快手、字節等大廠市場競争話題,唐家渝表示,無論是動态基礎能力、語義理解,Vidu 都是目前業績最好、全球首發的能力情況,這是當下非常直觀的競争優勢。未來公司堅持自主的底層算法研發,不斷突破認知邊界,提升現在視頻能力的天花板,有更好的穩定提升和補充。
" 我們也不是只做基礎技術的科研機構,而是一家商業公司,在這個過程中會持續圍繞落地行業進行技術能力迭代,努力在實際場景中也有好的一些磨合打造,保持我們對落地這件事情上理解的領先性。" 唐家渝稱。
談到視頻模型商業化,唐家渝透露,生數落地商業模式有兩種:SaaS 訂閱模式;API 形式,即模型能力輸出形式提供給客戶(MaaS ) ,客戶直接調用模型的能力。自 7 月 30 日上線以來,我們在全球範圍内已收到數萬個 API 接入申請。另外,目前從收入角度看,B 端市場的收入更大,是比較明确、比較直接的需求在其中,因此 B 端是生數科技長期非常重點的方向;C 端增長曲線非常高,在不斷的探索過程中。
據悉,生數科技成立于 2023 年,是 " 清華系 " 多模态企業的核心團隊成員,由清華系 AI 公司瑞萊智慧 RealAI、螞蟻集團和 BV 百度風投聯合孵化成立。今年 6 月," 生數科技 " 完成數億元 Pre-A 輪融資,目前生數科技投資方包括直投基金北京市人工智能產業投資基金,百度,中關村科學城公司,啟明創投,螞蟻集團、BV 百度風投、卓源亞洲、錦秋基金、達泰資本、智譜 AI 等機構。
钛媒體 App 了解到,近期生數科技新增工商實體 " 生數科技(香港)有限公司 ",推測該公司接下來可能會考慮港股 IPO 或發力海外市場等。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)