今天小編分享的互聯網經驗:OpenAI發布Sora!這次的驚豔居然不在模型能力,而是產品功能和制作流,歡迎閲讀。
OpenAI 發布會直播第 3 天,繼第 1 天完全版 o1 和 200 美元月費 ChatGPT Pro 會員,以及第 2 天的強化微調工具後,OpenAI 終于填上 9 個月前的期貨大坑,正式發布了觀眾敲碗已久的全新視頻生成模型——Sora Turbo。
Sora Turbo 被描述為今年 2 月 Sora 預覽版的高端加強版,速度顯著提升,繼承了早期技術報告中提到的 " 世界模拟 " 能力。不僅支持從文本和圖片生成視頻,還新增了風格重混、時間延展、故事版等多種高級功能。
從放出的 demo 和不少用户體驗的效果來看,它的模型能力并沒有比其他同類產品有明顯增強,但這一次 OpenAI 帶來的驚豔在于它給 Sora 設計的一整個完善的產品體驗,和它所提供的制作流程。
看來,模型遇到瓶頸的 OpenAI,在發力自己的產品能力後,還是有效果了。
獨立產品,全新界面
目前 Sora Turbo 作為獨立產品在Sora.com上線,首批開放給 Plus 和 Pro 用户。
直播中,團隊先是介紹了全新設計的用户界面,長這樣:
左側欄「Explore」是社區共享的靈感空間,用于展示其他用户生成的精彩視頻。用户可以點擊查看視頻詳情,每個視頻底部會顯示制作方法,支持基于他人創作進行再創作,學習分享技巧。
「Library」則相當于個人主頁,供查看所有生成的作品。頁面提供多種視圖模式,支持創建檔案夾、收藏内容,并可從動态頁面标記書籤,方便管理作品。
界面底部設有編輯器,你可以在此輸入文字描述或上傳圖片素材來創建視頻。
Sora 支持生成 480p 至 1080p 分辨率的視頻,時長範圍 5 至 20 秒,提供橫屏、豎屏和方形三種寬高比。系統還能夠同時生成多個版本,方便比對不同的生成效果。
另外值得一提的是 "Presets(預設風格)" 選項。當找到一個特别中意的審美風格時,可以将其保存為預設,以便應用到未來作品中。除自定義預設外,系統還内置了一些有趣的默認風格,如 " 定格動畫 "、" 氣球世界 " 等,為創作增添更多可能性。
五大功能,解鎖視頻創意玩法
本次發布會直播的核心亮點就是 Sora Turbo 具備的一系列新功能,包括:
Remix(重混)
使用自然語言描述想要進行的改動,可對視頻元素進行替換、移除或重構。
例如演示中,在 " 沙漠中行走的長毛猛犸象,廣角鏡頭視角 " 場景下,選擇 Remix 功能,輸入 " 将長毛猛犸象替換為機器人 " 的指令。
Sora 會自動完成渲染過程。還可以調整生成強度,選擇 " 強力 Remix" 進行大幅改動(如替換角色),或選擇 " 輕微 Remix" 進行小調整(如添加風或沙塵)。
Storyboard(故事板)
一個全新工具,讓創作者在個性化時間軸上組織和編輯獨特的動作序列。
點擊編輯器右側 " Storyboard " 進入後,螢幕上方是用于描述場景、角色和具體動作的 " 故事板卡片 ",中間是展示視頻剪輯輪廓的時間軸,底部則是各項創建設定。
以創作一段白鶴捕魚的視頻為例:
首先在故事板卡片中設定初始場景 " 一只美麗的白鶴站在小溪中,尾巴是黃色的 ", Sora 會根據描述自動補充細節。随後在時間軸中添加另一張卡片,描述新動作:" 白鶴低下頭進入水中并叼起一條魚 "。Sora 會在兩張卡片之間的空白區網域,生成流暢的過渡畫面。
(此處演示小翻車,白鶴沒有叼到魚。)
Re-cut(重新剪輯)
可對視頻片段進行精準裁剪并擴展。
這個比較好理解:有時你可能只喜歡生成視頻中的某一個畫面,這時選出自己需要的鏡頭,點擊 Re-cut 後進行時間軸的擺放,Sora 就可以延展鏡頭前後空白時間,補全場景。
Loop(循環)
在時間軸上截取鏡頭,制作 2 秒到 6 秒的無縫循環視頻片段。
Blend(混合)
将兩個視頻無縫結合為一個短片。
不知是不是怕又翻車,直播裏只説把機器人和猛犸象結合,卻并沒有演示。沒關系,咱們親自試試。
我選取了社區共享的一段熊貓跳舞視頻,和自己上傳的一段煙花視頻進行 blend。
在兩段視頻中間可以看到一條曲線,用于表示每段視頻在不同時間點的影響強度。曲線越高,上方視頻的影響越大;曲線越低,則下方視頻的影響更強。通過調整左右滑塊,可以裁剪或擴大每段視頻在最終混合中的占比。
混合操作大約用了幾十秒,最終生成的結果如下:
不過我更期待看到 " 熊貓在煙花下跳舞 " 的場景。
Sora 提供了四種混合方式:transition(過渡)、mix(融合)、sample(點綴) 和 custom(自定義)。正當我興致勃勃想嘗試 mix 後的 效果時,系統卻提示 "capacity 已達上限,請稍後再試 " —— 有點可惜,大家自行想象吧!
視頻編輯過程中,随時都可以對提示詞、比例和分辨率等進行修改。完成後可以選擇将作品發布到社區,或保存到本地。
如果只想自用,也不希望被 OpenAI 拿去訓練模型,到設定裏關閉 "Publish to explore" 和 "improve the model for everyone" 就可以了。
Plus 和 Pro 用户搶先體驗,暫不支持歐洲
可用性方面,Sora Turbo 已在全球大部分地區上線,但暫不支持歐洲、英國及部分受限國家。
對于 Plus 和 Pro 用户,Sora 已包含在訂閲中,無需額外費用。具體用量如下:
• Plus 用户:每月最多生成 50 個 480p 視頻,或更少數量的 720p 視頻。
• Pro 用户:每月支持 500 次高速生成,以及無限次慢速生成。
• 所有用户:可免費浏覽動态頁面。
結語
早在周日晚上,Sam Altman 就在 X 平台上發布了一條意味深長的 " 藏頭詩 ",被網友解讀為 Sora 即将登場的暗示。
在直播中,Sam Altman 強調了視頻技術對 OpenAI 的三個重要意義:
首先是為創意人士提供 AI 工具,創造全新的人機協作方式。其次是突破局限,讓 AI 從文本互動擴展到視頻領網域,重新定義人機互動。第三是推進 AGI 發展,視頻将成為 AI 學習現實世界任務的重要訓練環境,對實現通用人工智能至關重要。
關于產品定位,Sora 團隊明确表示,這并非一個自動生成完整電影的解決方案,而是一個為創作者提供新型創意方式的輔助工具。目前發布的 Sora 版本仍存在許多限制。比如視頻物理效果有時不夠真實,且在長時間復雜動作場景中表現不佳。
Sam Altman 将其比作 " 視頻領網域的 GPT-1"——雖處于早期階段,但已展現出強大潛力,未來還将在性能、速度和成本方面持續優化。
值得一提的是,Sora 是由頂尖的研究團隊與小型高效的產品工程團隊密切合作,僅用數月時間就完成了從模型開發到產品的落地,奧特曼也數次驕傲點贊 OpenAI 快速推進的能力(認真的嗎,好吧)。
不論如何,今天 Sora 的上線算是 OpenAI 久違帶來的真東西。社區熱情肉眼可見,很快就把伺服器擠爆了。
不過,今天的主角不是只有 OpenAI。Google 同樣帶來了一項重磅發布——全新一代量子計算芯片 Willow。這款芯片通過突破性的技術大幅減少誤差,攻克了困擾行業 30 年的難題。
Google CEO Sundar Pichai 表示,在測試中,Willow 在不到 5 分鍾内完成了一項傳統超級計算機需要超過 317 億年才能完成的計算任務,展現出颠覆性計算能力,堪稱壯舉。Elon Musk 和 Sam Altman 都前排獻上祝賀。
最後,我們再來欣賞幾個用 Sora Turbo 生成和編輯的視頻片段,感受一下細節刻畫和鏡頭語言:
故事板:日本冬季街頭
故事板:六名工人,身穿暗色破舊衣服,攜帶工具和背包,緩慢地行走在一個荒涼、霧氣彌漫的海灘上。
Remix 重混:給水母加上滑稽的眼睛。
坐等各位 Plus 用户和高端 Pro 用户的使用反饋,歡迎下方留言!