今天小編分享的财經經驗:Sora來臨,它能搶了誰的飯碗?,歡迎閱讀。
繼 ChatGPT 後,OpenAI 在 2024 年初又掀起了人們的讨論熱情。
2 月 16 日清晨,OpenAI 發布了文生視頻 AI 模型 Sora,引爆全球網絡。與以往的文生視頻模型 Runway 和 Pika 不同,Sora 可以持續地模拟人物、動物和物體,并生成同一角色的多個景别的鏡頭,在整個視頻中保持其外觀和背景。
此外,Sora 還可以生成圖片。與以往相比,這些圖片中的細節更清晰,包括臉上的斑點和嘴唇上的細紋,分辨率最高可達 2048x2048。
一石激起千層浪,Sora 發布後,一眾科技圈大佬紛紛下場讨論。馬斯克表示 "gg humans"(gg/good games 原指遊戲結束時玩家互相致意,後引申為 " 遊戲結束 "); 周鴻祎預言:" 這可能給廣告業、電影預告片、短視頻行業帶來巨大颠覆 ";前阿裡副總裁賈揚清則評價:" 真的非常牛 "。
" 霸榜 " 近日科技板塊熱點的 Sora 大模型亮點在哪裡?具體來看,這會對影視制作行業起到怎樣的影響?
高質量、長時間、多景别
簡單來講,Sora 能夠根據文本提示,創建 60 秒的視頻、擴展現有視頻以及從影像中生成視頻,視頻中還包含復雜的場景和鏡頭運動。
OpenAI 官網展現了多段 Sora 制作的視頻,身着黑色皮衣、紅色裙子的女子在雨後的夜晚行走在東京市區街道上,女子皮膚毛孔色沉清晰可見,路面積水反映着路燈倒影,視頻真實度十分之高,如果不是偶爾穿幫的左右腿,很難一眼判斷是 AI 制作的視頻。
在運鏡、構圖等方面,Sora 視頻都呈現出大幅度的提升,一舉将 AI 視頻提升至 "next level"。
圖源 OpenAI
此外,Sora 不僅能夠生成完整的 60 秒視頻,還能延長已生成的視頻。也就是說,給 Sora 一段視頻,它可以自動生成前面或者後面的視頻。
更離譜的是,Sora 可以生成不同機位、不同景别的視頻,并進行剪輯。且在不同的機位下,無論是廣角、中景、近景、特寫,室内還是室外,視頻中人物和背景的關系都一致,不受影響。
圖源 OpenAI
也就是說,僅需要一段文字,Sora 模型就可以生成一段 60s 的 1080p 視頻,包含不同景别鏡頭。不由得讓人感嘆—— " 真實和虛幻的差别,到底還有多大距離?"
值得注意的是,文生視頻早已存在,根據知名投資機構 a16z 統計,截至 2023 年底,市場上共有 21 個公開的 AI 視頻模型,例如 Google 的 Lumiere、Stability AI 的 SVD、以及視頻生成大模型 Gen-2 的開發商 Runway。其中,Runway2023 年 6 月底完成 C 輪融資後,估值則是超過 15 億美元。
Sora 公開後,東吳證券對目前主要的視頻生成模型做了對比。他将 Sora、W.A.L.T、Gen-2 和 Emu Video、Pika 1.0、Stable Video 六個模型的特點、生成視頻表現等特點進行對比分析。結論是,Sora 在生成時長、一致性等方面都有顯著的優勢,具有突破性的語義理解能力。
圖源東吳證券
去年年初,ChatGPT 橫空出世,而一年後,Sora 就實現了視頻的快速創作,如此快的發展速度令人心驚。畢竟一年前,AI 生成視頻還是這樣。
圖源網絡
有 B 站網友表示:" 小時候還想過,未來會不會有這樣一種拍電影的技術,戴上腦機後靠人腦的想象來生成各種各樣壯麗恢宏的電影畫面,誰知這個現實已經不遠了。"
雖然目前 Sora 還處于測試階段,只面向邀請的制作者和安全專家開放測試 ( 據稱是一些視覺藝術家、設計師和電影制作人 ) 。然而資本端已然聞風而動,CB Insights 的數據則顯示,OpenAI 目前是世界上最有價值的科技初創企業之一,僅次于字節跳動和 SpaceX。
在根據 Thrive 牽頭的收購要約進行現有股票出售後,當前 OpenAI 的估值已經達到 800 億美元以上 , 達到九個月前的近 3 倍。
只不過,有人歡喜有人愁,對于一些影視行業從業者和 AGI 視頻初創公司,Sora 的問世很難說是喜事。
風暴來襲
Sora 發布,最直觀的影響就是 AGI 視頻創業公司。
曾在 2023 年熱映影片《瞬息全宇宙》中參與制作的 Runway,其 CEO 瓦倫祖拉在 Sora 發布後,在 X 平台上發布了兩個字,"Game On." ( 競争開始了 ) 。
圖源 X 平台
對于字節跳動來說,Sora 的出現無疑是對于剪映的一大威脅。今年,就在 Sora 問世的一周前,原抖音集團 CEO 張楠卸任,轉而投入剪映,反映出抖音對于 AIGC 工具的重視。随着 Sora 的不斷發展,剪映如何才能學習 Sora 并創新,成為了當務之急。
除此之外,Sora 類 AI 模型對于好萊塢以及電影、電視、廣告等領網域的影響是最直觀的。
美國行業調查公司 CVL Economics,上個月發布的一項對 300 位好萊塢行業領袖的調查顯示,75% 的受訪者承認,生成式 AI ( 工具、軟體、模型 ) 已經促使他們業務部門削減與合并工作崗位,擔憂情緒彌漫在整個好萊塢。
那些掌控着好萊塢行業秩序的大佬預計,未來三年好萊塢總計會有超過 20 萬人的工作崗位會遭受 AI 衝擊,尤其是視覺特效、音效師、畫圖師等後期工作崗位。
圖源 OpenAI
不過,回顧内容創作的歷史,工具的發展無法阻擋,進步是常态,比起抵制,創作者更要思考哪些環節和内容變得更有價值。
從 AI 制作視頻的流程上來看,當前的 Sora 需要先輸入一段文字,随後再生成視頻,視頻的原創性還是在依賴着創作者的審美,Sora 的工具屬性更加突出。比起原創内容,Sora 的優勢更在于,那些需要耗費大量人力物力的特效片段。
所以,也有網友預測,雖然未來視頻制作流程中的剪輯師、特效師等後期崗位會面臨更為嚴峻的處境。但過往那些受限于拍攝成本、拍攝技術的内容,則會更受關注。
理想的情況下,Sora 未來能夠代替更多機械、重復的工作,使得創作者可以集中精力于創新的、深度的解讀,給文化消費者們提供更優質的内容。
此外,由于 AI 的理解内容更加偏向于輸入 " 關鍵詞 ",而非劇本。所以在未來,如何創作出适合 AI 理解的劇本,從而生成視頻,也是值得關注的問題。
Sora 的價值,不止視頻
目前來看,Sora 最直觀的影響是視頻制作行業,但他的野心,或者是眾多大模型的野心遠不止于此。
OpenAI 官網上,将 Sora 定位為世界模拟器。OpenAI 認為,其能夠有效地模拟物理和數字世界,包括其中的物體、動物和人類等各種因素。根據 OpenAI 的報告顯示,Sora 在理解地球物理世界的規律層面,取得了巨大的進展。
當然,目前的 Sora 作為一個模拟器當前還存在着一定的缺陷,世界模型仍然不夠完善。在 OpenAI 發布的 48 個 Sora 生成的視頻中,就出現了不少穿幫的畫面。
例如玻璃杯還沒有破碎,但是液體已經流出;人們在沙漠中挖出變形塑料椅子;一個男人在倒着跑跑步機等不符合邏輯的視頻内容。簡單來說,一些對于人類來說約定俗成的因果規律,Sora 模型短期内無法推理。
圖源 OpenAI
就已有信息來看,目前的 Sora 仍處于 1.0 階段,在處理精細的背景時常常出現力不從心的情況,但沒人會否認 Sora 對于 AGI 實現路程上的裡程碑地位。
AI 風口下,Sora 的出現讓我們看到了 AGI 實現的可能,也逼迫着同行業内不斷創新發展。畢竟泡沫過後,赢家只能有一個。