今天小編分享的科技經驗:叫板 Sora! Adobe 推出 AI 視頻神器,一句話 P 視頻,歡迎閱讀。
最近 AI 視頻領網域異常熱鬧,Adobe 也剛剛加入了這場混戰。
在今年的 Adobe Max 大會上,Adobe 正式推出了自己的 AI 視頻模型—— Firefly Video Model,進軍生成式人工智能領網域。
Adobe 的首席產品營銷經理 Meagan Keane 表示,Firefly Video Model 的推出旨在簡化加速視頻創作,并且增加視頻的故事講述能力。概括來講,這個模型包含三個有趣且實用的功能:
Generative Extend(生成拓展)
Text-to-Video(文生視頻)
Image-to-Video(圖生視頻)
其中,Generative Extend 已經被集成至 Adobe 所開發的專業視頻編輯軟體 Premiere Pro 當中;Text-to-Video 和 Image-to-Video 則剛剛在 Firefly Web app 中推出 beta 版本。
顧名思義,如果你拍攝的視頻片段太短或缺失某些部分,Generative Extend 可以幫你在視頻片段的開頭或結尾進行「生成式擴展」。
也就是說,假如所需的鏡頭不可用,或者某個鏡頭的剪輯時機過早或過晚,剪輯師只需要拖動該視頻片段的開頭或結尾,Generative Extend 就可以自動填充生成式内容,以保持視頻的連貫、平滑。
▲ Generative Extend 的生成式視頻擴展功能演示(圖片來源:Adobe)
這意味着如果視頻創作者在拍攝過程中得到了一個「廢鏡頭」,他可能不再需要回到原場地重新拍攝,而是利用 Generative Extend 直接對原片段進行擴展和修復。
一定程度上講,這确實有助于提高視頻創作效率——當然,是在 Generative Extend 所延伸的片段質量過硬的情況下。
遺憾的是,該功能目前的最大分辨率限制為 1080p,且片段最長只能擴展兩秒鍾。
因此 Generative Extend 只适合對視頻片段進行微小的調整,即它只能幫助用戶修復某些細節,卻不能代替創作者本身,進行大篇幅的創作。
Generative Extend 還可以幫助用戶拍攝過程中進行調整,糾正在拍攝過程中視線偏移或其他意外產生的移動。
除了視頻之外,Generative Extend 還可以用于音頻的平滑編輯。它可以将視頻中的環境背景音效擴展長達十秒鍾時間,但無法對對話或音樂進行拓展。
▲ Generative Extend 的音頻擴展功能示意(圖片來源:Adobe)
如果你想在視頻創作過程中省點力氣,你可以使用 Text-to-Video 功能直接生成。同它的「老前輩」Runway 和 OpenAI 的 Sora 一樣,用戶只需要輸入他們想要生成的視頻的文本描述,它就可以模拟「真實電影」、「3D 動畫」和「定格動畫」等各種風格生成相應的視頻片段。
以下是一些使用 Text-to-Video 功能生成視頻片段,感受一下:
▲提示文本:電影無人機飛越廣闊的紅色火星景觀,它從我們腳下飛馳而過,當太陽升起時,地平線是紅色的。在鏡頭的結尾,太陽從地平線上升起。(圖片來源:Adobe)
▲提示文本:電影特寫和夜晚街道中央一位老人的肖像細節。燈光氣氛沉悶,充滿戲劇性。顏色等級為藍色陰影和橙色高光。這個男人有極其逼真的細節皮膚紋理和明顯的毛孔。動作微妙而柔和。相機不動。膠片顆粒。老式變形鏡頭。(圖片來源:Adobe)
▲提示文本:在墨西哥一個美麗、柔和的天井内拍攝的視角。水清澈湛藍,在傍晚的陽光下閃閃發光。顏色是溫暖和神奇的魔幻風格。高品質,電影感。(圖片來源:Adobe)
除了逼真的,電影般的視覺影像,Text-to-Video 還支持生成一些「抽象」的畫面。例如,它可以被用來生成包括火焰、水、漏光和煙霧等元素的視頻,并覆蓋疊加到現有的視頻上,來增加現有内容的視覺深度和趣味性。
▲提示文本:黑色背景上的電影漏光,有機質感,逼真。(圖片來源:Adobe)
▲上述視頻與現有視頻合成後生成的視頻片段(圖片來源:Adobe)
值得一提的是,用 Text-to-Video 生成的視頻片段還可以使用一系列「相機控制」進行進一步細化處理,這些控制能夠模拟真實的相機角度、運動和拍攝距離等。
▲ 相機控制選項(圖片來源:Adobe)
Image-to-Video 功能則更進一步,允許用戶在視頻創作過程中添加「參考影像」,以生成更加貼近用戶想象的視頻。
視頻創作者可以從一張影像和照片出發,利用 Image-to-Video 功能直接制作「B-roll」(電影和視頻制作術語,指的是除了主要拍攝内容(A-roll)之外的輔助視頻素材)。
用戶還可以通過上傳視頻的單幀,并由 Image-to-Video 自動補充缺失幀,以此來創建完整的特寫鏡頭。
▲提示文本:花朵在風中搖曳,一只美麗的蝴蝶落在其中一朵花上。(圖片來源:Adobe)
「眾所周知,視頻不能 P,所以一定是真的。」
然而,Image-to-Video 的「賽博重拍」功能,直接讓這句話變成過去式。它宛如一只「上帝之手」,可以讓用戶對視頻内容(視頻中的人物動作等)直接進行操作和修改。來看下面的例子:
▲ 原視頻片段(圖片來源:Adobe)
▲修改後的視頻片段,提示文本:一只戴着手套的宇航員的手進入畫面,并拔掉了其中一根黃色電纜,具有電影感。(圖片來源:Adobe)
目前,Text-to-Video 和 Image-to-Video 功能生成視頻片段的最大長度僅為五秒鍾,質量最高為 720p 和每秒 24 幀。視頻生成時間大約為 90 秒,Adobe 正在開發「渦輪模式」來縮短這一時間。
視頻生成質量的不足表明,用戶還無法用 Firefly Video Model 生成一部完整的電影,暫時只能作為創作輔助工具來使用。
Adobe 強調,Firefly Video Model 只會在許可内容(如 Adobe Stock)和公共領網域内容上對該模型進行訓練,而不會在客戶提供的内容上進行。
此外,使用 Firefly Video Model 創建或編輯的視頻可以内嵌内容憑證,旨在為創作者和内容出處提供歸屬證明,有助于聲明 AI 使用情況和所有權權益,以保證「商業安全」。
感興趣的讀者可以在以下鏈接加入 Adobe Firefly Video Model 的體驗候補名單:
https://www.adobe.com/products/firefly/features/ai-video-generator.html