今天小編分享的科技經驗:生數科技發布高可控視頻大模型Vidu Q1:可精準調整所有動作行為,歡迎閱讀。
IT 之家 3 月 29 日消息,清華大學人工智能研究院副院長、生數科技創始人兼首席科學家朱軍今日發布了高可控視頻大模型 Vidu Q1,官方宣稱其為業内首個高可控 AI 視頻大模型。
IT 之家從官方獲悉,Vidu Q1 在多主體細節可控(特别是動作、布局可控)、音效同步可控、畫質增強等方面均取得顯著成效。以多主體細節可控為例,在語義指令的基礎上,通過融入參考圖的視覺指令,Vidu Q1 支持對場景中多主體的位置、大小、運動軌迹等屬性進行更進一步的可控,對所有動作行為(出場、退場、坐立姿态、行動路線)進行精準調整。
其支持音效同步可控功能,可确保随着視頻環境與畫面轉場,Vidu Q1 能夠輸出生成相應音效,并可精準控制每段音效的長短區間,精準設定每段音頻出現的時間點,如 0-2s 風聲、3-5s 雨聲等。