今天小編分享的财經經驗:中國AI的虛火與現實:Sora會帶來又一次GPT式創業嗎,歡迎閱讀。
Sora 讓整個行業又興奮起來。字節辟謠中國版 Sora,周鴻祎火速 " 追星 ",李一舟趁熱賣課,一眾上市公司夾雜着 " 颠覆性、裡程碑、加速器 " 等關鍵詞舞動資本市場。
又一次創業機會,還是新一輪趕超焦慮,是看待 Sora 撥雲見日的兩條線索。
" 沒錢,沒卡,沒人才,差距在拉大 ",這是人們在驚嘆其高超能力的同時,一種有關羨慕與追趕的技術焦慮。正如字節回應 " 中文版 Sora",目前無法作為完善產品落地,與國外有很大差距。但也有人認為,Sora 的出圈是 AIGC 深入人心的新契機,有助于更好地推動國内 AIGC 產業的發展。
像是大航海,不知道有沒有終點的時候,一切都是漫無邊際的。一旦有人登上了新大陸,就是給全世界的證明,終點就在那裡。從 ChatGPT 到 Sora,相同的問題又一次擺到 AI 廠商面前:如何追趕?如何找準落地場景?如何實現數據飛輪?
新 "AI 行情 "?
熱點最容易在資本市場掀起巨浪。連續爆發兩日後,2 月 21 日,Sora 題材股表現分化。截至當天收盤,因賽集團、當虹科技等漲超 10%,新易盛、中際旭創跌超 5%,萬興科技、東方國信等跌超 4%。
其中因賽集團已獲 3 連板,近 4 個交易日累計大漲超 88%。
不久前,因賽集團還在投資者互動平台表示,公司自研的 InsightGPT 屬于營銷行業應用層垂類模型,與 Sora 這類底層通用大模型并不屬于直接競争關系,反而可以結合 Sora 等通用大模型豐富自身視頻素材庫以及提升視頻生成效率和品質。
股市的起伏和公司的回應,是市場狂熱的一面,一如一年前 ChatGPT 的橫空出世,再次掀起一股熟悉的 "AI 行情 "。
不過,Sora 雖然復刻了 ChatGPT 所帶來的轟動,卻沒能在市場上復刻出同樣的創業風。取而代之的是,一種有關技術的焦慮正逐漸蔓延。
文生視頻并不是個新鮮事,但與 Sora 相比,時長是以往文生視頻最大的 " 硬傷 "。
一位大廠的業内人士對北京商報記者提到,國内公司的文生視頻產品,都是基于大型語言模型(LLM)和傳統的視頻生成 AI 集成的結果,生成的視頻長度都是秒級,且簡單場景。
據了解,在 Sora 發布之前,Runway 和 Pika 普遍被認為是視頻生成賽道的佼佼者,但前者僅能生成 4 秒的視頻,後者則只能提供 3 秒的視頻。Runway 的用戶可以将生成的視頻最長延長至 16 秒,而這已經是 AI 生成視頻在 2023 年所能達到的最長時長紀錄。
" 三四秒和一分鍾,是天差地别的。"
在接受北京商報記者采訪時,無界 AI 聯合創始人馬千裡提到,對于 AI 生成視頻來說,随着生成時長增長難度指數級上升,更長的視頻意味着更高的一致性要求、更詳細的畫面描述,對算力的消耗也是遠超此前水平的。
Sora 的另一項突破則在于其對物理世界部分規律的理解,而這也正是過去文生視頻模型的一大痛點。
OpenAI 又一次用 " 暴力美學 " 征服了世界。向量數據庫企業 Zilliz 開發者關系及市場運營總監李晨對北京商報記者概括稱,量變再一次帶來了質變,大規模高質量的訓練數據為 Sora 帶來了 " 颠覆性 " 的世界觀,去理解虛拟世界的物理規律。
" 沒錢,沒卡,沒人才,差距在拉大。" 談及當下的真實感受,上述業内人士做了這樣一句概括,在他看來,前兩者的客觀環境也在一定程度上限制着人才的回流。
此外,萬億級别公司的玩家才能持續的事情,國内雲計算大廠跟起來也很吃力,而且大廠也要考慮投入產出," 總之挺難的 "。
在人才角度,伽利略資本合夥人鄭譞也對北京商報記者提到,目前國内真正具有大模型經驗、了解大模型的技術專家還太少。
而通過與其身邊少數從業者的交流來看,壓力也是顯而易見的。鄭譞稱,除技術外,焦慮還普遍存在于包括算力等方面資源的充沛程度上," 相比于原來的大模型,文生視頻的計算量是一個‘天文數字’,而國内具備這樣算力基礎的 AIDC(人工智能數據中心)數量屈指可數 "。
不過馬千裡認為,Sora 破圈最重要的意義其實在于教育了客戶,讓外界重視了 AIGC 產業,從而進一步推動國内 AIGC 產業的發展。
" 雖然有壓力,但總歸是一件好事,這不僅是輿論層面的判斷,從技術上看,Sora 跑通了這條路,其他人也會更有信心投入這條技術路線,而這對于技術的發展通常也是至關重要的。" 馬千裡稱。
魔鬼營銷
Sora 所引發的焦慮,一部分來源于技術本身,另一部分來源于 " 颠覆性 " 的營銷。
一段時間以來," 颠覆性 " 成了 Sora 最大的标籤,一傳十、十傳百,在公共空間營造出了一股所向披靡的架勢。
Sora 的颠覆究竟是技術層面的徹底革新,還是原有路線的進一步成熟?這或許是于狂熱的市場氛圍中,理性看待 Sora" 衝擊波 " 的一個關鍵起點。
廣發證券認為,在底層基礎技術原理上,Sora 并未有實質性的突破,或應更多理解為類似于 ChatGPT,基于同樣的技術原理,在暴力美學下的又一次重要 " 量變 "。
香頌資本董事沈萌也提到,從技術架構來看,Sora 其實并沒有脫離大語言模型本質,仍是基于深度學習的框架。
馬千裡解釋稱,從底層架構級技術角度看,Sora 的确沒有很多創新,DIT 技術中 Diffusion 和 Transformer 都是幾年前的技術了。但 Sora 的特殊之處在于,它率先實現了大規模的工程化,也就是說把原本應用于文本領網域的 Transformer 技術大規模、成熟地應用在了文生視頻模型當中。此外,它還進行了很多工程層面的創新,比如視頻時空塊 Patch 技術等。
鄭譞也提到,雖然 Sora 的效果非常驚豔,但還不能稱為理論基礎上從無到有的颠覆,但這并不意味着工程上的颠覆就不是颠覆。" 當工程量呈現指數級的上升時,一定會出現各種見都沒見過的問題,解決這些問題本身可能就是一種颠覆。"
Sora 另一種層面的 " 颠覆 ",集中體現在外界對 Sora 取代影視行業從業人員的擔心上,一如當年 ChatGPT 所引發的行業替代焦慮。
不過在沈萌看來,目前 Sora 只是公開了一些官方視頻,很少有人實際應用,所以其效果到底如何是沒有定論的。而 OpenAI CEO 奧特曼又是一個極度擅長營銷的人,他一定想通過這樣的方式最大程度地放大 OpenAI 的估值。
由此,Sora 也同步進入了被 " 祛魅 " 的過程。廣發證券分析稱,Sora 的主題意義更為顯著,商業化進程仍需觀察,一方面,技術文檔提到的當前局限性需逐步解決;另一方面,版權合規、内容倫理等課題仍是 AIGC 類應用需要克服的挑戰,文生視頻也不例外。
上述業内人士也提到,Sora 生成效果堪稱驚豔,開啟了世界模拟器的進步,但還說不上颠覆性。大模型也出現了湧現,能夠理解物體的時空關系,但還不完善。
是不是一條對的路,業界也有不同聲音。" 而且有很大的不确定性在于,訓練成本和推理成本如何不清楚 "。上述業内人士稱。
" 相較于大語言模型或者文生圖模型,文生視頻模型更耗算力,比如 3090 的顯卡燃燒一分鍾才能生成一個 4 秒鍾的視頻,高并發情況下成本更是會驟增 "。馬千裡以無界 AI 的文生視頻技術為例,提供了這樣一組數據。
他解釋稱,從絕對總量上看,推理成本一定是占到大多數的,特别是推廣向 C 端和 B 端用戶的時候,這種情況會更明顯。因為訓練通常是一次性支出,而推理的邊際成本很可能是遞增的,越多人使用,算力壓力就會越大,成本就會越高,進而影響其商業化。
讓子彈再飛一會兒
判斷一件事情火不火,一個關鍵的 " 指标 " 就是有沒有人賣課。
Sora 發布不到一周,尚未對公眾開放測試權限,賣課視頻就已經先一步泛濫于閒魚、小紅書等平台。北京商報記者以 "Sora 文生視頻 " 為關鍵詞在閒魚上搜索,共呈現 59 條相關内容,價格從 9.9 元到 169 元不等。
這些 " 教程 " 廣告中,一張以 "Sora 一鍵文生視頻 " 為标題的海報被廣泛使用。海報内容顯示,資料包含 " 你的 Sora 專屬提示詞庫 ""Sora 專屬提示詞教程 ""30 個 Sora 專用提示詞技巧 " 三方面。
而透過賣課的 " 割韭菜 ",或許不難摸索國内科技產業發展的亂象和虛火。沈萌稱,國内產業的生命周期大多以抄概念為起點,然後大舉跟上,進而衍生一些淺層的應用,進行融資、套項目,最後上市或進行各種程度的資本變現,至此這股風就算過去了。
" 整個環節認真、踏實做事的比例很小,這反映出的問題,其實就是不知道自己在幹什麼,‘肚子裡’也沒有相應的積累 "。沈萌說,越是可替代,越是價值低,這就是國内 AI 產業的現狀,而當我們跟别人沒有差異的時候,也就只能拼價格。
沈萌總結稱,投資者或者機構都覺得 AI 是風口,瘋狂砸錢,但沒有人去分析砸錢的最後能砸出什麼東西," 如果最後的結果是要進行價格的紅海競争,這種項目是鐵虧無疑的 "。
在他看來,AI 領網域的研發創新,永遠是基于之前的成果的,就像是兩個飛輪,不斷給對方以動能,加速對方的旋轉。所以 AI 領網域的領先,才會出現一步領先、步步領先的情況。" 遺憾的是,在這一領網域,國内企業處于的其實是一種‘跟進’上的應接不暇 "。
李晨也分析稱,很多有技術能力的公司之前就已經布局了多模态,但是軟硬體上的差距還是比較明顯的," 我們要正視差距,而不是一味地蹭熱度和講故事,OpenAI 也是憋了一年的大招才把 Sora 放出來,這種精神值得技術企業學習 "。
在李晨的觀察中,整個 2023 年,我們在迅速形成共識的前提下迎來了 AIGC 的高速發展期,在通向真正 AGI 的道路上我們看到了算力、算法和數據的明顯差距。
但李晨也提到,旺盛的需求和市場的潛力同樣帶來了希望。
據馬千裡介紹,目前無界 AI 的文生視頻技術已經在逐步商用過程中了。不久前,無界 AI 剛剛聯合中國聯通,在浙江面向 C 端用戶推出 AI 生成的視頻彩鈴訂閱業務。
有消息稱,2023 年 12 月至今三個月内,已有包括萬興科技、博匯科技、易點天下、數碼視訊、漢王科技、當虹科技、東方國信等在内的十餘家 A 股公司,在投資者互動平台披露過視頻生成模型領網域的業務情況。
鄭譞認為,大模型裡面到底能裝多少現實世界的知識,目前還沒有特别明确的判斷,也就是說 Sora 并不是 AI 的終點,未來還有很大的發展空間,最後是誰領先還不好說。
" 所以面對 Sora 帶來的挑戰,不妨讓子彈再飛一會兒 "。鄭譞說。
北京商報記者 楊月涵