今天小編分享的财經經驗:OpenAi發布的Sora,送給A股800億開年紅包,歡迎閱讀。
圖片來源 @視覺中國
文 | 貝克街探案官,作者 | 鎮西
沒想到今年第一個引爆科技圈的消息,還沒等復工就刷了屏,復工後又直接推動相關企業市值爆拉,A 股 25 家相關企業市值共計增長 888.42 億元,兩個交易日平均漲幅 26.94%。
2 月 16 日凌晨,OpenAI 發布首個文生視頻模型 Sora,是 OpenAI 繼 ChatGPT 之後,推出的另一款具備颠覆行業能力的 AI 應用,Sora 能夠僅僅根據提示詞,生成 60s 的連貫視頻,遠超行業目前大概只有平均 "4s" 的視頻生成長度。
" 平均 4s" 的長度指代非常明顯,就是Runway 和 PIKA。也曾短暫引爆過 A 股文生視頻的炒作,但無論是強度還是持續性,都遠不如 Sora。
在 Sora 問世之前,Runway 和 PIKA 被視為文生視頻領網域的龍頭,但在 sora 生產的視頻出現後,業界普遍認為 Sora 可以吊打 Runway 和 PIKA。
Pika 創始人郭文景曾在接受采訪時表示," 視頻現在沒有很好的算法,它不是一個規模化的問題,不是說現在大家的 GPU 不夠多,很多時候其實是算法上還沒有很好的一個思路。" 并認為 Sora 的發布 " 是一個很振奮人心的消息,我們已經在籌備直接衝,将直接對标 Sora。"
和 Runway 和 PIKA 相比,Sora 產出的視頻時間更長,連貫性更好,其他模型產出的視頻甚至還有卡頓、場景突變等問題;在此基礎上,Sora 的視覺細節更豐富,且清晰度更高。對比 Sora 和 runway 的視頻不難發現,Sora 的視頻内容更符合常人對 " 視頻 " 的理解,而 runway 的視頻内容更像是 "GIF" 動圖。
業内普遍認為,Sora 的出現,預示着一個全新的視覺叙事時代的到來,它能夠依據客戶的文本提示,将人們的想象力轉化為生動的動态畫面。Sora 作為一款通用的視覺數據模型,其卓越之處在于能夠生成跨越不同持續時間、縱橫比和分辨率的視頻和影像,甚至包括生成長達一分鍾的高清視頻。
從成片來看,假以時日,伴随熟練運用 Sora 的工程師、自媒體人越來越多,電影業恐将在此次技術變革中迎來一次大洗牌,畢竟每一部影視作品成片之前都要先有個好劇本,好劇本問世後,用 Sora 就可以實現視頻輸出了。
但就目前而言,實現這個目标為時尚早,因為整個 Sora 產業鏈正處于萌芽期,國内目前尚未有一家公司可以與之抗衡,就連字節都直言 "Boximator" 目前還無法作為完善的產品落地,令人略有欣慰的是,已經湧現出大批企業試圖搭上 Sora 的快車。
這也不禁讓人想起 ChatGPT 發布後,大量企業跟進推出 " 自研大模型 ",并不斷呼嚎趕超 OpenAI,結果人家這次直接來個降維,借着推出 Sora 繼續 AI 應用市場遙遙領先。
01 Sora 是否難以復制
Sora 采用了 Transformer 架構,和 ChatGPT 不同的是,大語言模型通過 token 将各種形式的文本代碼、數學和自然語言統一起來,Sora 則通過視覺包(patchs)實現了類似的效果。
Sora 和 ChatGPT 最大的區别,就是 Sora 為擴散模型,它接受輸入的噪聲包(以及如文本提示等條件性輸入信息),然後被訓練去預測原始的 " 幹淨 " 包。
重要的是,Sora 是一個基于擴散的轉換器模型,這種模型已經在多個領網域展現了顯著的擴展性,包括語言建模、計算機視覺以及影像生成等領網域。擴散轉換器在視頻生成領網域同樣具有巨大的潛力,不同訓練階段下,使用相同種子和輸入的視頻樣本對比,結果證明了随着訓練量的增加,樣本質量有着明顯的提高。
Sora 研究員專門訓練了一個網絡,專門負責降低視覺數據的維度。這個網絡接收原始視頻作為輸入,并輸出經過壓縮的潛在表示。Sora 模型就是在這個壓縮後的潛在空間中接受訓練,并最終生成視頻。此外,研究員還設計了一個解碼器模型,它可以将生成的潛在表示重新映射回像素空間,從而生成可視的視頻或影像。
當給定一個壓縮後的輸入視頻時,從中提取出一系列的時空包,這些包被用作轉換 token。這一方案不僅适用于視頻,因為視頻本質上就是由連續幀構成的,所以影像也可以看作是單幀的視頻。
通過這種基于包的表示方式,Sora 能夠跨越不同分辨率、持續時間和縱橫比的視頻和影像進行訓練。在推理階段,研究員只需在适當大小的網格中安排随機初始化的包,就可以控制生成視頻的大小和分辨率。
僅從原理層面來看,推出 Sora 這種文生視頻大模型并不難,但國產廠商在推出進度上紛紛落後于 OpenAI,此前曾有消息稱字節推出了 Boximator,它可以通過文本精準控制生成視頻中人物或物體的動作。
對此,字節跳動相關人士回應稱,Boximator 是視頻生成領網域控制對象運動的技術方法研究項目,目前還無法作為完善的產品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。
其他發布公告的企業,要麼是想要介入這個賽道,要麼就是可以為該行業提供硬體設備支持,因為 A 股市場中沒有文生視頻的企業,所以退而求其次,找到了一家文生圖產品獲得市場認可的企業炒作,即因賽集團,該公司的 InsightGPT 的文生圖功能已在時尚珠寶和快消兩個賽道的營銷領網域商用,并且具有一定市場認可度。
其他的則是一些算力租賃公司獲得市場爆炒,至于想要切入這個行業的公司就更多了,不勝枚舉。
02 Sora 商用,會切走誰的蛋糕
Sora 之所以會引起市場轟動,主要是因為其 " 文生視頻 " 的功能直接讓影視從業人員集體焦慮。
北京天工異彩影視科技有限公司的副總裁兼 CTO 周輝公開表示,Sora 生成的視頻質量足夠震撼,可以縮短電影拍攝周期。
其實周輝的表達還是保守了,只要 Sora 工程師足夠多,硬體設備不受限,整個影視業的演員都可以省了,動辄過億的演員費用也可以省下,那現在已經成名的影視劇明星,想要上鏡就要另謀出路,當然制作方也可以獲得已成名演員的授權後上鏡。
同時場地租賃、置景等費用也會随之下降,這也給了很多非專業團體在影視業一展身手的機會,換言之,今天是影視業最容易的一天,以後每一天都比今天難上加難,值得注意的是,這一邏輯對視頻依賴較大的廣告業也通用。
除此之外,國内剛起步的科幻電影可發揮空間也将瞬間提升。之前一直說《三體》影視化不成功,是因為很多場景制作困難,而 Sora 的出現,可以有效解決這個問題,C 内容的專家化也将創造新的風格與形式,增強影視内容的吸引力與豐富度。用人方面,特效師因為具備基礎的工作邏輯,培訓周期也比其他沒有經驗的人群更短。
但在 Sora 工程師大規模入局之前,短期 Sora 還是一個工具性產品,某種程度上幫助影視制作方降本增效。
除影視行業外,遊戲行業也将借助 Sora 產生巨大變革,Sora 對于物理世界的理解和模拟可以與遊戲場景開發高度适配,Sora 可以幫助遊戲開發者創立角色或背景故事。OpenAI 也在 Sora 技術報告中提出,Sora 能夠模拟如視頻遊戲的數字化過程,根據官方視頻演示,Sora 能在控制《Minecraft》遊戲角色進行基本操作的同時,高質量動态渲染遊戲世界。
可以預見,Sora 未來将可能被應用生成遊戲動畫和場景等,增加遊戲情感故事背景提高可玩性,遊戲開發者的成本也将随之降低。簡言之,又會有部分人因此面臨崗位變動。
03 學會使用 AI 工具
這種背景下,不會使用 AI 工具的從業者将會伴随科技進步,被時代無情淘汰,而掌握 AI 工具的外行業,跨行也不會再體會 " 翻山越嶺 " 般的困苦,當今大量自媒體從業者,也有機會進一步落地自己的創意。
至于賣課教别人怎麼使用 AI 工具的機構,誰讓人家先掌握知識呢," 知識就是力量 " 已經成為亘古不變的真理,每當科技迭代出現新的生產力工具,都會有相應的課程出現,當年 Word 的使用也是一門技術,路邊的打印店甚至招了很多年 " 打字員 ",而如今打字員早已經不是一個職業,而是每個打工人都必須掌握的技能。
假以時日,使用 AI 工具或許也會成為每個打工人必須掌握的技能,但就目前而言,這仍是一個新興就業崗位,各位也沒必要因為科技進步而焦慮,畢竟機遇總是伴随危機出現,機會也是給有準備的人。