今天小編分享的财經經驗:Sora刷屏!哪些A股上市公司或将受益?,歡迎閲讀。
《投資者網》葉芯
近日,OpenAI 的文生視頻模型 Sora 刷屏了。
2 月 16 日,OpenAI 在其官網發布文生視頻模型 Sora。據介紹,該模型可以生成長達一分鍾的視頻,同時保持視覺品質并遵循用户提示。
作為 OpenAI 首推的文本轉視頻模型,Sora 的問世,宣告了新一輪科技革命的到來。Sora 驚豔炸裂的效果,衝擊着當前的 AI 行業。Sora 橫空出世後,又将帶來怎樣的變革?資本市場哪些上市公司将受益?
Sora 面世
Sora 作為 OpenAI 首推的文本轉視頻模型,能夠嚴格根據用户輸入的提示詞、文本指令或靜态影像,生成長達 1 分鍾的視頻,保持較高的視覺質量,其中包含精細復雜的場景、生動的角色表情以及復雜的鏡頭運動。同時也接受現有視頻擴展或填補缺失的幀。
OpenAI 表示,Sora 能夠生成復雜的場景,不僅包括多個角色,還有特定的動作類型,以及對對象和背景的準确細節描繪。除此之外,Sora 還可以将靜态影像制作成動畫。文本指令和靜态影像均能生成準确反映用户提示的視頻。
國泰君安研報指出,Sora 具有三大突出亮點,一是 60 秒長視頻,Sora 可以保持視頻主體與背景的高度流暢性與穩定性。二是單視頻多角度鏡頭,Sora 在一個視頻内實現多角度鏡頭,分鏡切換符合邏輯且十分流暢。三是理解真實世界的能力,Sora 對于光影反射、運動方式、鏡頭移動等細節處理得十分優秀,極大地提升了真實感。
與目前 AI 視頻賽道同行相比,Sora 每條提示 60 秒的視頻長度,遠高于 Pika Labs 的 3 秒、Meta Emu Video 的 4 秒和 Runway 公司 Gen-2 的 18 秒的視頻時長。
此外,從官方發布的演示來看,無論從視頻流暢度還是細節表現能力上,Sora 的效果都相當驚豔。
不過,目前 Sora 仍在開發中,OpenAI 承認該模型可能會混淆提示的空間細節,例如混淆左右,并且難以精确描述随着時間推移發生的事件,例如遵循特定的相機軌迹。同時,OpenAI 還稱,可擴展的視頻生成模型,是構建物理世界通用模拟器的一條可能的路徑。
Sora 的面世,意味着 AI 視頻生成能力實現了跨越式發展。該模型可以深度模拟真實物理世界,标志着人工智能在理解真實世界場景并與之互動的能力方面實現了重大飛躍。
應用前景廣闊
近年來,OpenAI 領跑 AI 賽道。2021 年初和 2022 年末,OpenAI 分别推出了影像生成系統 DALL · E 和聊天機器人 ChatGPT。這也使得 AI 逐漸成為各行各業輔助工作的工具,也正逐漸改變人們對未來工作的看法。
如今,Sora 模型能夠生成一分鍾的高保真視頻。視頻格式既可以是橫屏 1920*1080 視頻,豎屏 1080*1920 視頻,以及之間的所有内容。這使得 Sora 可以兼容不同的視頻播放設備,根據特定的縱橫比來生成視頻内容,這也會大大影響視頻創作領網域,包括電影制作、電視内容、自媒體等。
國盛證券認為,文生視頻大模型 Sora 橫空出世,其能夠理解并呈現物理定律,影視動畫行業的颠覆性時刻到來。
據介紹,Sora 是基于過去對 DALL · E 和 GPT 的研究基礎構建,利用 DALL · E 3 的重述提示詞技術,為視覺模型訓練數據生成高描述性的标注,因此模型能更好的遵循文本指令。
對此,360 集團創始人周鴻祎表示,Sora 的技術思路完全不一樣。之前我們做視頻做圖用的都是 Diffusion,是多個真實圖片的組合,這次 OpenAI 利用它的大語言模型優勢,把 LLM 和 Diffusion 結合起來訓練,讓 Sora 實現了對現實世界的理解和對世界的模拟兩層能力,這樣產生的視頻才是真實的,才能跳出 2D 的範圍模拟真實的物理世界。
" 這都是大模型的功勞。OpenAI 訓練這個模型應該會閲讀大量視頻。一幅圖勝過千言萬語,而視頻傳遞的信息量又遠遠超過一幅圖,這就離 AGI(通用人工智能)不遠了,不是 10 年 20 年的問題,可能一兩年很快就可以實現。" 周鴻祎稱。
周鴻祎表示,這也代表未來的方向。有強勁的大模型打底子,基于對人類語言的理解,對人類知識和世界模型的了解,再疊加很多其他的技術,就可以創造各個領網域的超級工具,比如生物醫學、蛋白質和基因研究,包括物理、化學、數學的學科研究上,大模型都會發揮作用。這次 Sora 對物理世界的模拟,至少将會對機器人具身智能和自動駕駛帶來巨大的影響。
國盛證券也持有相同的觀點。其認為文生視頻大模型 Sora 橫空出世,其能夠理解并呈現物理定律,影視動畫行業的颠覆性時刻到來。
對于 Sora 的面世,工信部信息通信經濟專家委員會委員、數字經濟專家劉興亮稱,這标志着 AI 技術在内容創作領網域的一個新紀元。
"Sora 能夠生成持續一分鍾左右的 1080P 高清視頻,涵蓋多個角色、不同類型的動作和背景細節等,幾乎達到了電影級别的逼真場景。這種能力不僅為内容創作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度将創意變為現實,而且為觀眾帶來了更豐富和多樣化的視覺體驗。技術創新的這一巨大飛躍,預示着 AI 在未來人類生活的各個方面都将發揮更加重要的作用。" 劉興亮表示。
AI 基礎設施需求旺盛
市場觀點認為,2022 年是影像之年,2023 是聲波之年,而 2024 是視頻之年。
OpenAI 表示,Sora 是構建世界模型的基礎,未來将向實現 AGI 繼續邁進。
對于 Sora 的發展,算力需求旺盛。國泰君安指出,Sora 模型推動 AI 多模态領網域飛躍式發展,AI 創作等相關領網域将迎來深度變革,AI 賦能範圍進一步擴大,多模态相關的訓練及推理應用也将進一步提升對算力基礎設施的相關需求。
無獨有偶,國盛證券也持有相同的觀點,其認為,Sora 依舊符合 AI 縮尺律(Scaling Law)OpenAI 在技術文檔中説明,随着訓練計算量的增加,樣本質量明顯提高,進一步佐證了多模态時代,算力需求将成為最核心的瓶頸之一。
多模态大模型拉動全球算力需求快速增長,國產 AI 算力迎來機會。根據南方财富網趨勢選股系統數據統計,A 股國產 AI 算力相關上市企業目前數量有 52 家,如國產 AI 算力產業鏈包含 AI 伺服器零部件、伺服器整機、算力租賃、數據中心等環節。AI 伺服器零部件公司主要包括海光信息、寒武紀、龍芯中科、景嘉微等;伺服器整機公司主要包括高新發展、神州數碼、拓維信息、廣電運通、烽火通信、同方股份等;算力租賃公司主要包括恒潤股份、雲賽智聯、鴻博股份等;數據中心公司主要包括奧飛數據、光環新網、寶信軟體、數據港等。
此外,多家巨頭謀劃布局 AI 基礎設施。舉例來看,主營視頻創意、繪圖創意類軟體產品的萬興科技近日在互動平台表示,公司旗下視頻創意產品萬興喵影 /Filmora 可用于各類視頻的創作和剪輯," 天幕 " 大模型是以視頻創意類 AI 技術為核心的多媒體大模型,涵蓋音頻、影像、視頻等多模态能力。
昆侖萬維旗下 Star Group 和 Opera 都具備做短視頻的土壤,其中 Opera 在海外已經推出了短視頻功能。此外,昆侖萬維天工大模型在騰訊優圖實驗室聯合廈門大學開展的多模态大語言模型測評中,綜合得分排名第一。
專業智能視頻解決方案與視頻雲服務提供商當虹科技擁有自研的 AIGC 工具集,于去年上半年發布以靜态照片生成三維體積視頻的方案。
當虹科技 1 月 5 日互動平台表示,公司擁有自研的 AIGC 工具集,發布了以靜态照片生成三維體積視頻的方案,并且通過點雲模型轉換及壓縮算法實現高達 800 倍的視覺無損壓縮,實現不同模态之間相互切換。
因賽集團旗下 InsightGPT 目前可生成 20 秒以上的視頻,能夠結合影像、視頻大模型,融合摳圖等多種算法,再結合音頻模型,整體渲染後最終合成完整視頻。
據不完全統計,包括萬興科技、博匯科技、易點天下、數碼視訊、漢王科技、當虹科技、東方國信、神思電子、因賽集團、拓爾思、國脈文化、佳都科技在内的超 10 家 A 股上市公司近三個月以來在互動平台披露視頻生成模型領網域的業務情況。(思維财經出品)■