今天小編分享的互聯網經驗:國產AI視頻彎道超車:開源潮湧,融資不斷,Sora優勢不再,歡迎閱讀。
圖片來自視覺中國
藍鲸新聞 3 月 22 日訊(記者 武靜靜)Sora 的出現曾被視為 AI 視頻領網域的 " 神話 ",然而,随着國内 AI 視頻技術的快速發展,這一 " 神話 " 似乎正在被打破。
當下,國產 AI 視頻模型不僅在技術層面取得了顯著突破,更在商業化應用方面展現出強大的競争力,一場由中國企業主導的視頻模型新紀元正在拉開帷幕。
一方面,國内創業公司和大廠都在持續加碼 AI 視頻領網域的開源技術進展;另一方面,頭部視頻模型創業公司持續獲得新融資,加速推進技術迭代和產品商業化,并在全球掀起了視頻創作的熱潮。
視頻模型開源潮湧,大廠和創業公司持續加碼
眼下,由 DeepSeek 引發的開源熱已經席卷到了視頻模型。騰訊、阿裡等大廠和階躍星辰等創業公司大廠都在視頻開源領網域持續突破。
最新的開源動态來自六小虎之一的階躍星辰。
3 月 20 日,階躍星辰宣布開源圖生視頻模型 Step-Video-TI2V,該模型是基于 30B 參數 Step-Video-T2V 訓練的圖生視頻模型,支持生成 102 幀、5 秒、540P 分辨率的視頻,模型效果在圖生視頻領網域權威基準測試 VBench-I2V 中達到 State-of-the-Art 水平,排名在全球靠前。
據階躍星辰介紹,該模型上線後已與華為昇騰計算平台完成适配,目前在階躍 AI 網頁版、App 端和魔樂社區(Modelers)都可體驗。
此前,阿裡和騰訊也因開源引發了市場廣泛關注。
3 月 6 日,騰訊混元發布圖生視頻模型并對外開源,同時上線對口型與動作驅動等玩法,并支持生成背景音效及 2K 高質量視頻。騰訊介紹稱,用戶只需上傳一張圖片,并用文字發出指令,混元即可按要求讓圖片動起來,變成 5 秒短視頻,還能自動配背景音。
2 月 25 日,阿裡雲旗下視覺生成基座模型萬相 2.1(Wan)開源,采用最寬松的 Apache2.0 協定,14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務;
一位開發者告訴藍鲸新聞,萬相 2.1 模型開源後,其 1.3B 版本稱可以支持在消費級顯卡上部署,可以讓個人創作者快速生成視頻,甚至可以支持在幾分鍾就能在本地生成視頻,對于用戶是個很大的利好。
從目前實踐來看,開源模型的推進将降低了企業和開發者使用視頻模型的門檻,使得更多的人可以參與到視頻模型的研究和應用中來。
此外,基于開源模型,也會湧現出更多新的商業模式,例如模型服務提供商、應用開發商等,有助于推動 AI 視頻技術在產業端和用戶端的持續落地生根。
中金證券在研報中提到,成本上看,對于商業級用戶,萬相 2.1 專業版和快速版 API 調用成本分别為 0.7、0.24 元 / 秒,與此前主流視頻大模型接入成本接近将促進視頻大模型技術的持續進步,加速中小廠商的二次研發。
一位視頻模型創業公司的從業者告訴藍鲸新聞,視頻模型領網域,随着開源生态的繁榮,将會促進閉源模型的發展。
" 視頻模型到視頻應用是一個復雜的系統工程問題,需要模型和應用的深度結合,目前,用戶量大、產品化成熟的模型仍以閉源為主,但開源社區的活躍将吸引更多優秀開發者加入,開發出更多好的應用,推動大的行業共同進步,為行業創造更大的價值。" 該從業者認為。
國產 AI 視頻逆襲超越 Sora,在技術、商業化持續突破領先
當下,國内公司在產品化和商業化層面的進展持續取得突破并超越 OpenAI 的 Sora,站上了全球產品領先的位置。
當下,MiniMax 在持續發力視頻模型領網域:2024 年 9 月,MiniMax 發布了首款 AI 高清視頻生成模型 Abab-video-1;2024 年 12 月,再次發布了圖生視頻模型 I2V-01-Live,新的模型專門對二次元效果進行了優化。2025 年 1 月中旬,MiniMax 發布 S2V 模型,支持主體參考功能。3 月,全球上線鏡頭控制功能。
全球著名投資基金、咨詢公司 a16z 發布的 2025 年全球 100 生成式 AI 應用排行榜中,海螺視頻、快手的可靈等國内視頻 AI 排名領先,超過了海外的 Sora。
除了持續開源等技術進展,投資人也在持續加碼布局頭部視頻模型創業公司,AI 視頻產品的商業化探索也正在進一步拓展中。
近日,國内 AI 視頻頭部創業公司愛詩科技宣布完成 A5 輪融資。
愛詩最新發布的 PixVerse V4 版本,首創 5 秒極速生成、有聲視頻生成、智能人聲。最新數據顯示,截至目前,愛詩科技旗下 AI 視頻生成產品 PixVerse 的全球用戶量已突破 4000 萬,月活躍用戶(MAU)達 1500 萬。配音等創新功能,在海外引發多方好評。
愛詩科技聯合創始人謝旭璋告訴藍鲸新聞,目前,愛詩在商業化層面也在持續探索C 端和 B 端場景;" 一方面,愛詩在 C 端用戶上有深厚積累。另一方面,在企業用戶的服務上,我們在思考如何結合客戶的場景和愛詩的 C 端用戶影響力碰撞出火花。在這個方向上,我們從產品到服務都做了很多嘗試。" 他透露,愛詩在廣告、電商等營銷場景上也做了不同的探索。
更多創業者正在受益于 AI 視頻工具帶來的創作新體驗,同時也對國内的 AI 視頻產品有更直觀的感受。
視頻模型領網域的創作者 Jason 認為,雖然海外模型在創新能力上處于領先地位,如 ChatGPT、Sora 和 Agent 概念都首先在海外得到驗證,但國内模型在創新速度上領先,能夠更快地跟上并迭代新技術,并催生出大量的模型和應用 。
" 像 Sora 這類被認為能颠覆行業的模型,其視頻生成效果甚至可能不如國内的海螺、可靈等,這體現了技術路線的快速變化和國内的追趕速度。"Jason 提到。
在使用各種海内外的 AI 視頻工具中,Jason 自己的實際體會是,"專注于打好基礎模型的策略是國内模型的重要競争力。以海螺為例,盡管其功能不如其他模型多,但其強大的底層技術使其在生成視頻時動作更為自然和真實。這種基礎模型能力才是提升用戶體驗的關鍵。"
由此來看,國内 AI 視頻模型的核心競争力在于其快速的創新迭代、扎實的基礎能力以及積極的商業化探索。未來,通過在高清質量、多模态整合、高級模型研發、美學表現和用戶體驗等方面的持續突破,國内 AI 視頻模型有望繼續保持甚至擴大其領先地位。