今天小編分享的科技經驗:字節、快手、Vidu“打野”更新,AI視頻小步快跑,歡迎閲讀。
前沿科技,數智經濟
文|白 鴿
編|王一粟
繼 9 月份版本更新之後,光錐智能從生數科技聯合創始人兼 CEO 唐家渝朋友圈獲悉,Vidu 大模型将于本周再次進行版本更新,Vidu-1.5 版本即将上線。
此版本更新方向仍是重點延伸大模型的泛化能力和主體一致性問題。上一版本重點是單一主體的一致性,而最新版本則能夠理解和整合人物、物體、環境等多個概念,遵循用户指令 30 秒内生成多個主體融合的相關視頻結果,率先實現視頻創作中的多主體一致性生成。
除 Vidu 外,自今年 9 月份以來,據不完全統計,包括字節旗下即夢 AI、快手可靈 AI、Runway、智譜清影、愛詩科技 PixVerse、Pika 等主流的 AI 視頻生成平台,都已經進行了版本更新。
當前,在爆火的 AI 視頻生成賽道中,大模型創企、互聯網大廠等紛紛入局,而在經過前期各家密集進行產品發布階段後,如今已進入產品迭代更新比拼階段。
通過各家版本更新的内容,不難發現,AI 視頻生成大模型能力迭代的大方向,仍是生成視頻的時長、畫面的穩定性、連續性和主體前後的一致性上。
但與此同時,各個玩家又在實際功能應用中,開始出現 " 分野 ",各有側重,部分中小玩家也開始找到自己的細分市場。
比如 Runway 最新版本中更新了可将真人面部表情精确復刻給 AI 角色的 Act-One,以能夠實現 3D 化的 AI 攝像頭控件。PixVerse 則上線了各種萬聖節特效、毒液特效等。
對此輪各 AI 視頻生成平台的更新,星賢文化創始人、AI 原創玄幻 IP《山海奇鏡》制作人陳坤認為:" 最大的更新應該是 Act-One 這種表情遷移,提供了人物表演的基礎可能性。" 而對于人物主體的一致性和穩定性," 有進步,但并沒有代際型進步。"
在 AI 視頻創作者尾鳍 Vicky 看來,相比上半年初代產品,最新更新的 AI 視頻平台,除了在底層模型能力上的迭代之外,在功能上也進行了更新,比如首尾針、畫質和幀率的補足、配音等功能," 這些功能的完善,實際上是比上半年更全面。"
如果説 2024 上半年,是 AI 視頻生成賽道的軍備競賽,那麼下半年則是進入小步快跑的版本更新周期。
而在此階段,字節和快手的交鋒仍在激烈進行中,中小廠商開始找到自己獨特賽道,而一些企業專注走海外市場,也實現了 " 國内開花,牆外香 " 的效果。
無疑,這一階段的厮殺,看似温和,但卻實質性的影響平台自身的定位和未來發展的方向,以及後續用户群體和數量規模的可持續增長。
字節狂追,快手搶跑
" 即夢有些掉隊。" 這是 AI 視頻生成平台用户給出的客觀評價。
作為去年第一批的 AI 視頻生成平台,以及字節旗下的產品,即夢 AI 的視頻生成效果一直備受使用者诟病,處于被 Runway、Pika 等同一批玩家吊打的狀态。
今年 6 月,字節在短視頻領網域的直接競争對手——快手,正式在官網上線了 " 可靈 " 視頻生成大模型,并火速出圈。同時,越來越多 AI 視頻生成平台如雨後春筍般推出,AI 視頻生成賽道徹底爆火。
在強大競争壓力之下,作為國内 AI 產品第一梯隊,補上視頻生成這一塊短板,已成為字節跳動面臨的當務之急,而其奮起直追的速度也超乎想象。
9 月 24 日,2024 火山引擎 AI 創新巡展深圳舉辦,原抖音藝術負責人陳欣然以即夢 AI 及剪映市場和運營負責人的身份亮相,并宣布即夢 AI 已經接入了豆包最新的視頻生成模型。
同期,字節跳動發布豆包模型家族的兩款視頻生成模型 Seaweed 和 Pixeldance,并通過即夢 AI、火山引擎分别面向創作者和企業客户小範圍邀測。
11 月 8 日,字節跳動旗下的 AI 内容平台即夢 AI 宣布,由字節跳動自研的視頻生成模型 Seaweed 面向平台用户正式開放。
據字節跳動方面介紹,本次開放使用的豆包視頻生成模型 Seaweed 是該款模型的标準版,僅需 60 秒即能生成時長 5 秒的高質量 AI 視頻,領先國内業界 3 至 5 分鍾的所需生成時間。
即夢 AI 還透露,近期 Seaweed 和 Pixeldance 兩款視頻生成模型的 Pro 版也将開放使用。Pro 版模型能實現自然連貫的多拍動作與多主體復雜互動,攻克了多鏡頭切換的一致性難題,在鏡頭切換時可同時保持主體、風格、氛圍的一致性,适配電影、電視、電腦、手機等各種設備的比例。
字節抖音和快手,作為國内短視頻平台的領軍者,雙方的競争已經從短視頻、電商轉移至 AI 領網域,客觀來説,抖音在各方面都壓快手一頭。但唯獨在 AI 領網域,快手給出了漂亮的反擊。
自 6 月一鳴驚人之後,快手可靈其實已經有數次的小版本的迭代。
但在底層大模型能力上,今年 9 月 20 日,快手發布可靈 1.5 版本,接入新一代模型,實現了畫質和動态質量都大幅提升,原有的模型也加入了新功能——運動筆刷,生成效果可控性增強。
" 可靈 1.5 很強,可以説是所有模型裏面最真實的,吊打 Runway,基本上已經克服了之前人物變形的問題。"AIGC 創業者洋芋醬 AIgen(藝名)如此對光錐智能説道。
在實際生成的視頻效果中,對比可靈和 Runway,可以看到,同一個提示詞,兩者在實際人物主體的穩定性上效果都很強,但可靈生成出的視頻效果能夠自動解鎖面部表情。
"Runway 其實也能自主生成面部表情,但效果非常詭異。" 洋芋醬 AIgen 如此説道,不過,可靈 AI 和 Runway 這種能力是随機的,并不固定。
這其實也能夠看到,可靈 AI 和 Runway 在實際生成效果上更勝一籌,而在對提示詞的理解上,可靈 AI 也确實走在前列,但未來也仍需要不斷迭代更新,才能将這一能力固化下來。
(Runway,提示詞一個穿着新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,洋芋醬 AIgen 提供)
(可靈 AI,提示詞一個穿着新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,洋芋醬 AIgen 提供)
不過,此次即夢上線最新視頻生成大模型之後,尾鳍 Vicky 則認為其在模型能力和 UI 設計上,與可靈差距不大。同時,在内測即夢平台 Pro 版模型的時候,其能夠輕松控制畫面的運動幅度和動作。
作為國内頭部的短視頻平台,快手和字節,在 AI 視頻生成賽道的布局,終局目的是要吸引和留住用户的注意力,而這就需要不斷生產出新穎、有質量、有創意的内容。
基于此,AI 短劇,也成為字節即夢和快手可靈競争的焦點之一。
今年 7 月份,由 " 可靈 AI" 創作出的 AI 短劇《山海奇鏡之劈波斬浪》引發廣泛關注,該短劇成為國内首部 AIGC 原創奇幻微短劇。
9 月,快手星芒短劇聯合 " 可靈 AI" 推出了 " 星有靈犀 -AI 短劇創作大賽 "。據悉,大賽以流量獎勵、榮譽獎勵、内容籤約等多項舉措激勵更多人加入 AI 短劇創作。
字節同樣不甘示弱,即夢 AI 在聯手博納影業發布首部 AIGC 生成科幻短劇《三星堆:未來啓示錄》的同時,也在聯手抖音平台多位 " 超級創作者 " 實現共創,邀請平台上有高質量粉絲及高影響力的達人,共同加入 " 超級創作者聯盟 " 計劃,希望借此打造國内最大的虛拟創作社群。
但現階段不管是抖音,還是快手,其視頻平台的影視創作者創作的内容," 很難破圈兒。" 尾鳍 Vicky 如此説道," 因為現在整個市場尚未形成,C 端用户并不知道用它來幹嘛。頭部會有一些商業化需求,但需求并不多,整體并不穩定。"
畢竟,現階段全球的專業創作者還比較少,且 AI 視頻生成大模型技術尚處于早期階段。
因此,作為頭部視頻平台,字節和快手之間的競争也日趨激烈,而除了底層 AI 技術、產品之争外,更重要的則在于誰能夠率先探索出技術賦能内容之路。畢竟,平台如果能夠聚集更多具有創新意識的内容創作者,就能夠打造出一個更受用户關注和喜愛的社區生态。
當然,除了字節和快手之外,在 AI 視頻生成賽道中的其他玩家,也開始出現 " 分野 ",部分中小廠商,也開始探索并走出了一條屬于自己的差異化競争之路。
細分市場崛起,
找準自身定位是王道
在抖音、快手等短視頻平台上,一些創作者創作的内容可能破圈兒難度比較大,但一些包含鬼畜特效的視頻,卻異常的火爆,比如由 AI 生成的何炅和黃磊突然打架的視頻。
對于 AI 視頻生成賽道的玩家來説,如果字節和快手,是全方位的技術和内容生态體系的競争,而其他中小玩家更多的則是聚焦在細分賽道,找準自身平台和產品定位,則成為生存發展的基礎。
10 月底,Runway 的 CEO 在公開信中明确表示, Runway 并不是一家 AI 公司,而是一家媒體和娛樂公司," 我認為 AI 公司的時代已經結束了。"
基于此,在各大公司争相卷 AI 視頻生成長度、逼真度、流暢度的時候,Runway 顯然已經在 AI 視頻賽道中走出了自己的特色——做專門服務于藝術、媒體和娛樂的 AI。
從 Runway 的實際視頻生成效果來看,其在人物穩定性、一致性上的效果可以説走在前列。而除了基礎技術能力外,在最新的版本更新中,Runway 上線的 2 個新功能雖小,但都将為動畫師、遊戲開發者和電影制作人提供非常大的便利、節約巨大的成本。
Runway 可以説是最受影視從業者歡迎的產品之一,除技術實力之外,更重要的還在于性價比。
" Runway 實在是太香了,我們用可靈都是省着用,但是 Runway 是無限次數的,每天抽個幾百次都無所謂。" 洋芋醬 AIgen 表示,"AI 視頻的随機性還是很強的,如果按次收費,普通創作者可能很難承受起這個成本。"
反觀可靈,如果用 1000 元購買積分,能夠購買 15000 可靈值,每次用 35 可靈值,1000 元只能生成 428 次。對于真正的創業者來説,基本不夠用," 按照我在 Runway 每天要生成兩百多次視頻的頻率來看,可靈 1000 元購買的積分基本 2 天就燒完了。" 洋芋醬 AIgen 如此説道。
在光錐智能上一篇《爆 " 卷 " 的 AI 視頻,大廠向左,創企向右》文章中也提到過,對于現階段各平台采用的會員制收費方式,對于不能夠商業化閉環的創業者而言,後續的付費率和付費意願都不會很高。而現如今看來,對于即使能夠實現商業化閉環的創業者而言,性價比也是影響其使用產品的關鍵因素。
而除了 Runway 之外,Pika 和 Pixverse 也找到了自己的賽道。從他們最新更新的版本中可以看到,這兩家重點是訓練了一些用户能夠直接使用的特效效果," 雖然比喻可能會不太恰當,但是有點接近之前抖音做的那種貼紙。" 洋芋醬 AIgen 説道。
比如在 10 月底萬聖節期間,PixVerse V3 版本新增了不少萬聖節主題的特效,包括僵屍模式、巫師帽和怪物入侵等主題效果,還有類似于 Pika 很火的 AI 捏捏特效,視頻延長功能,用户可以為已有視頻額外增加 5-8 秒的内容,并能精确控制新增片段的内容走向。
而随着最近《毒液:最後一舞》電影的上映,PixVerse 基于最新視頻模型 PixVerse V3 推出了新特效 " 我們是毒液 " 的視頻效果,能夠一鍵将圖片生成酷炫毒液動畫。
圖源:尾鳍 Vicky
當前,在社交平台上,這種鬼畜特效非常受用户歡迎。此前 Pika 在 1.5 版本中,就推出了 AI 捏捏的特效,一經推出,就備受用户喜愛,其也靠着這一波特效,實現了彎道超車。而和 Pika 差不多時間開始增長的海螺 AI,其實也是靠人物表演和 meme 表情包直接拉爆了海外輿論,彎道超車。
Pika 的 AI 捏捏特效
事實上,盡管海螺 AI 推出時間較晚,但行業從業者對海螺 AI 的評價并不低。" 海螺 AI 在人物動作上的表現很厲害,最近何炅和黃磊打架的 AI 生成視頻,就是通過海螺 AI 生成。" 洋芋醬 AIgen 説道。
不過,海螺 AI 更重要的是實現了 " 國内開花,牆外香 " 的效果。作為國内 AI 公司 MiniMax 在海外推出的 AI 視頻生成平台,其一經推出,搜索熱度持續攀升。
據 "AI 產品榜 " 統計,海螺 AI 網頁版 9 月訪問量大漲 860%,登頂 9 月全球及國内增速榜首。海外用户紛紛在社交平台分享使用體驗,普遍認為海螺 AI 是目前市面上最出色的 AI 視頻生成工具之一。
而憑借產品在海外市場的爆火,MiniMax 在商業化能力上,已經走在大模型六小虎的前列。
相比較來説,像 Vidu 和智譜清影這一類的平台,在主體一致性和人物穩定性中,視頻生成時長等方向上正在不斷進化,但尚未形成專屬于自己風格的賽道和獨特的競争優勢。
盡管 AI 視頻生成技術正不斷進化,并衍生出具有特色的細分賽道。但信達證券研報也顯示,AI 視頻生成技術在人物一致性、所需時長、畫面質量等方面仍需進一步提升,以滿足商業化水準。
同時,目前主流 AI 視頻工具還處在視頻生成競争的階段,且大多數為單一功能產品,仍需要多種不同的視頻創作工具串聯使用才能達到直接輸出可商業化視頻的效果。
未來,AI 視頻生成大模型平台,仍需要不斷迭代進化。
光錐智能"AI 交流群 "已建立,
感興趣的朋友可以添加小助手微信(GZZN2019)溝通進群。
聯系我們
王一粟
創始人 / 主編
ID:cishicike000
※添加時請備注公司 + 姓名 + 來意