今天小編分享的财經經驗:“今天,所有VC的會上都在談Sora”,歡迎閱讀。
仿佛夢回 2023。去年年初,ChatGPT 引發了普通人澎湃的讨論熱情,此後海内外在 AI 大模型投資上展開了軍備競賽。
龍年剛一開年,OpenAI 又打開了新局面。這次火的是文生視頻。2 月 16 日凌晨,OpenAI 發布了文生視頻大模型 Sora。Sora 能夠根據文本提示創建詳細的視頻、擴展現有視頻中的叙述以及從靜态影像生成場景。
這類應用早就有了,但 Sora 的呈現仍然驚豔,視頻中的主體穩定可控,可實現多角度切換,時長方面也突破,最長能生成 60 秒視頻。
不愧是 OpenAI。盡管 Sora 仍處于開發早期階段,但它的推出已經标志着生成式 AI 迎來一個裡程碑。
資本端同時傳來新消息。在完成最新交易後,OpenAI 的估值已飙升至 800 億美元以上。這筆交易來自于 Thrive Capital 精心策劃的要約收購。
盡管 OpenAI 和 Thrive Capital 對此皆不予置評,但小紅書博主 "Shannon" 昨天發的帖子很有情緒的代表性," 明天所有 fund 開會的議題都有 OpenAI 的 Sora"。
只不過,和去年相比,投資人的心态變了。不是人人都有機會投中 OpenAI,但 OpenAI 的能力邊界卻實實在在影響着一批創業公司和背後的投資人。
" 水到渠成 " 和 " 令人發指 "
首先需要明确," 文生視頻大模型 " 并不是一條全新的賽道。在 OpenAI 登場之前,頭部大模型研發商幾乎都擁有自己的文生視頻大模型,例如 Google 的 Lumiere 以及 Stability AI 的 SVD(Stable Video Diffusion),甚至已經誕生了垂直于多媒體内容創作大模型的獨角獸,例如視頻生成大模型 Gen-2 的開發商 Runway,在 2023 年 6 月底完成由 Google、Nvidia、Salesforce 參與的 C 輪融資後,估值超過 15 億美元。
更重要的是,上述已有的 " 視頻大模型 ",隐隐有了生產力工具的影子。
以 Runway 為例,與許多 " 拿着錘子找釘子 " 式的 " 技術驅動型 " 大模型創業團隊不同,Runway 的三名創始人 Valenzuela、Alejandro Matamala 和 Anastasis Germanidis 來自于紐約大學藝術學院,他們共同看到了 " 人工智能在創造性方面的潛力 ",于是決定共商大計,開發一套裝務于電影制作人、攝影師的工具。
這層基因打底,相比科技公司的 " 車庫文化 ",Runway 的發展軌迹更像 " 橫店影視城奮鬥史 ":先開發了一系列細分到不能再細分的專業創作者輔助工具,針對性地滿足視頻幀插值、背景去除、模糊效果、運動追蹤、音頻整理等需求;随後參與到影像生成大模型 Stable Diffusion 的開發過程中,積累 AIGC 在靜态影像生成方面的技能點,并獲得了參與《瞬息全宇宙》等大片制作的機會——這些影片在宣發中曾經有過詳細描述,出品人們感嘆他們的加入讓後期團隊 " 保持了一個超乎常規的小規模 " 狀态,影視同行們驚嘆很多許多復雜的特效制作(比如《瞬息全宇宙》裡那兩塊對話的石頭),工期已經從 " 好幾天 " 縮短到了 " 幾分鍾 "。
等到 2023 年 2 月,Runway 發布第一代產品 Gen-1,普通用戶已經能通過 iOS 設備進行免費體驗,範圍除了 " 真實影像轉黏土 "" 真實影像轉素描 " 這些濾鏡式的功能,還包含了 " 文本轉視頻 ",從而使得 Gen-1 成為了首批投入商用的文生視頻大模型;2023 年 6 月,他們發布了第二代產品 Gen-2,訓練量上升到了 2.4 億張影像和 640 萬段視頻剪輯。
2023 年 8 月,爆火 B 站、全網播放量超過千萬、獲得郭帆點贊的 AIGC 作品《流浪地球 3 預告片》正是基于 Gen-2 制作。根據作者 @數字生命卡茲克 在個人社媒上的分享,整段視頻的制作大體分為兩部分——由 MidJourney 生成分鏡圖,由 Gen-2 擴散為 4 秒的視頻片段——最終獲得素材圖 693 張、備用剪輯片段 185 條,耗時 5 天。半年之後,@數字生命卡茲克 再次通過 "MJ V6 畫分鏡 -Runway 跑視頻 " 制作了一段 3 分鍾的故事短片《The Last Goodbye》,投稿參賽 Runway Studios(Runway 專門為企業級客戶提供定制化服務的部門)所組織的第二屆 AI 電影節 Gen48。
換句話說,實際上至少在一年以前," 文生視頻大模型 " 就已經擁有足夠的關注度,其目前用戶規模也被遠遠低估。
Runway 的聯合創始人 Valenzuela 在 C 輪融資後透露,除了像 New Balance 這樣的世界 500 強客戶,他們還擁有 " 數百萬個人創作者 "。
除此而外,Sora 所展現出來的 " 精準的物理世界還原能力 ",也并不是 OpenAI 獨自探索的 AI 領網域。馬斯克就在 Sora 發布的兩天半後,也就是 2 月 18 日,在科技播客欄目 "DrKnowItAll" 裡留言," 這種精準還原現實世界物理規律的虛拟世界生成能力,特斯拉已經差不多快掌握一年了 …… 只不過因為素材來自車載攝像頭,所以視頻看上去沒那麼有趣 "。
OpenAI 在同期發布的技術論文《Video generation models as world simulators》也明确 Sora 更像是 " 數據驅動的物理引擎 ",通過大模型的持續擴散來 " 高性能地模拟物理世界或者數字世界中的人、動物、其他物體 ",因此仍然擁有 " 同行們都會面臨 " 的局限性,例如 " 很難準确模拟復雜場景的物理原理,并且無法理解因果關系,比如 Sora 生產一段人咬餅幹的片段,餅幹可能不會出現咬痕 "。
真正帶來壓迫感的,或許是 Sora 不可思議的進化速度。
從技術層面看,無論是 " 擁有精準物理規則的真實世界 "" 支持 60 秒視頻生成 " 還是 " 單視頻多機位 " 都可以被形容為水到渠成,然而正如上面所提到的——如今看起來傻傻的、只支持生成 "4 秒視頻生成 " 并且 " 掉幀明顯到像幻燈片 " 的 Gen-2 其實是 2023 年 6 月發布的產品,距離 Sora 的發布日不過 8 個月。
2023 年 11 月,Meta 發布的視頻生成大模型 Emu Video 看起來在 Gen-2 上更進一步,能夠支持 512×512、每秒 16 幀的 " 精細化創作 ",但 3 個月之後的 Sora 已經能夠做到生成任意分辨率和長寬比的視頻,并且根據上面提到的開發者技術論文,Sora 還能夠執行一系列影像和視頻編輯任務,從創建循環視頻到即時向前或向後延伸視頻,再到更改現有視頻背景等。
而如果要死磕這種不可思議的進化速度,除了 " 神秘的外星文明 ",最現實的解釋恐怕只有 " 海量燒錢 "。
作為 Runway 半個領路人的 Stability AI 近兩年周期性地遭遇 " 現金流壓力 ",一會兒傳聞高層正在積極探索出售公司,一會兒又流傳着早期投資者 Coatue Management 的内部信,直指 "Stability AI 的财務狀況令人擔憂 ",建議 CEO Emad Mostaque 原地辭職。最揪心的傳聞是,為了讓亞馬遜相信自己不會拖欠高達 7500 萬的雲服務費用,身為前對衝基金經理的 Emad Mostaque 選擇以個人财產作為擔保。
然而從融資的角度看,Stability AI 做到了賽道的天花板,其在 2022 年 10 月完成超過 1 億美元的融資後,估值早早來到了獨角獸級别。Emad Mostaque 在去年 7 月的一次采訪中忍不住直發狂暴言論,他說:"Bard AI 只是因為在宣傳片中提供了不準确的信息,就造成了每天超過 1000 億美元的損失 …… 人工智能作為基礎設施所需的投資總額可能為 1 萬億美元,這會是人類有史以來最大的泡沫 "。
知乎上,一位叫做 " 像素煉金師 " 的創業者坦承了他在目睹 Sora 發布後的心路歷程:" 我有些害怕科技巨頭的產品像隆隆火車一樣駛過,而我做的東西如同路邊的野草一樣,在這個技術進步就像跑馬燈一樣的時代裡,留不下一絲痕迹。"
估值 800 億和領頭羊的邊界
無論怎樣,OpenAI 再次印證了 AI" 巨無霸 " 的地位。看似無遠弗屆的能力,支撐其估值在不到 10 個月的時間裡增長了兩倍。CB Insights 的數據顯示,OpenAI 目前是世界上最有價值的科技初創企業之一,僅次于字節跳動和 SpaceX。
拓展模型能力的同時,OpenAI 還在推進多元化的戰略。尤其是在半導體領網域,奧特曼正與潛在投資者、半導體制造商和能源供應商等各種利益相關者接觸。他甚至在考慮成立一家獨立于 OpenAI 的新公司,進入 AI 芯片行業。
這筆交易也揭示了,奧特曼之于 OpenAI,仍然是不可或缺的角色。原本在去年 11 月,OpenAI 便将敲定最新的融資交易,但當時奧特曼遭遇了解雇風波。交易有沒有受到影響不知道,總之結果是,770 名員工中的 700 多人最終籤署了請願書,要求他復職。
細看這輪融資,不是發行新股,而是準許 OpenAI 員工對外出售所持股份。這對于 OpenAI 來說并不新鮮。2023 年,Thrive Capital、紅杉資本、Andreessen Horowitz 和 K2 Global 等風險投資巨頭也采取了類似的做法,參與 OpenAI 的要約收購,當時該公司的估值已經達到 290 億美元。
那麼,OpenAI 的邊界在哪裡?
這個問題不僅事關 OpenAI 的估值,也關乎大大小小生成式 AI 創業公司的前景。
原本在視頻生成這個賽道上,海外已經有幾家創業公司卡位。最知名的莫過于前文所述的 Runway。另一個領頭羊是 Pika,創立于去年 4 月,11 月宣布完成了總計 5500 萬美金的 A 輪及天使輪融資,估值達 2.5 億美元。Pika 由郭文景和孟晨琳共同創立,兩人都曾是斯坦福大學人工智能實驗室的博士生,履歷亮眼。郭文景還被譽為 " 華裔天才少女 "。
OpenAI 會衝擊這些公司嗎?别急,Sora 公開後,有海外博主已經對幾家公司的產品做了對比。他給 Sora、Pika、Runway 和 Stable Video 四個模型輸入了相同的 prompt。結論是,Sora 在生成時長、連貫性等方面都有顯著的優勢。
必須要說,這幾家做文生視頻的公司都開發了自己的大模型,而非純粹的基于别人的大模型來開發應用場景的那類公司。但即使有技術護城河,要抵擋 OpenAI 的衝擊也沒那麼容易。
當然,這并不是說,純做應用的公司完全沒有前途了,背後也許涉及到一個發展階段的問題。
去年,紅杉資本的兩位合夥人再次發表文章,復盤一年前自己對市場的看法。他們指出,其中一個預測錯誤是,垂直分離尚未發生。" 我們仍然相信應用層公司和基礎模型提供商之間會有分離,模型公司專注于規模和研究,應用層公司專注于產品和 UI。但在實際上,這種分離還沒有幹淨利落地發生。最初面向用戶的應用中,最成功的那些都是垂直整合的公司。"
國内也是類似的局面。
有投資人告訴我,他們關注的一家 AIGC 公司也在開發基于特定產業數據的獨有的模型,而不是僅僅調用别人的 API。" 不然很難指望他們在應用層面做出真正差異化的東西。"
回頭看,過去一年,OpenAI 的每一次技術突破,都會拓展資本對它的想象空間,但同時也堵上一部分創業公司的前進之路。
"AGI 去年已經把軟體行業毒死了。現在公眾只是在目睹毒發的過程。" 有創業者在轉發一則 Sora 的消息時,在朋友圈評論道。
所以,AI 投資難,尤其是應用層。" 重點還是界定清楚,什麼東西能在大模型的演進過程中受益,什麼東西又在大模型演進過程中被瓦解。" 一位 AI 投資人曾模糊地告訴我。但 OpenAI 的超能力使得這個關鍵問題沒那麼容易預判。
再看大模型。《北京最火獨角獸翻 6 倍了》一文寫過,智譜 AI 去年一年的估值翻了已經翻了 6 倍多,已經有投資人給出 200 億估值。我最近也聽說,百川智能和 MiniMAX,最近都傳出新一輪融資已到位的消息。OpenAI 出新招,這些公司不可能不焦慮。好在彈藥尚且充足。Sora 的誕生,無疑又将引發新一輪追趕。
借着 Sora 火熱,AI 的相關概念必将再炒一波,尤其是英偉達這類充當賣水人,又可以大賺一筆了。但對于一級市場的創業者和投資人而言,我只能說,暫時,繼續卷罷。