今天小編分享的互聯網經驗:圖森未來發布圖生視頻大模型“Ruyi”,歡迎閲讀。
36 氪獲悉,圖森未來正式發布圖生視頻大模型 "Ruyi",并将 Ruyi-Mini-7B 版本正式開源,用户可以從 huggingface 上下載使用。據介紹,Ruyi 是一個基于 DiT 架構的圖生視頻模型,它由兩部分構成:一個 Casual VAE 模塊負責視頻數據的壓縮和解壓,一個 Diffusion Transformer 負責壓縮後的視頻生成。模型的總參數量約為 7.1B,使用了約 200M 個視頻片段進行訓練。Ruyi 是圖森未來正式發布的第一款 " 圖生視頻 " 模型。