今天小編分享的科技經驗:即夢對陣可靈,重演抖音反超快手?,歡迎閲讀。
快手可靈,只是抖音即夢的下一個目标罷了。
撰文 | 趙衞衞
年初從抖音 CEO 位置上辭職的張楠,應該度過了一個充實的 2024 年。
在中央美術學院設計學院四層階梯空間裏,張楠這位曾經的藝術生坐在 C 位,微笑着與一群大學生合影留念,她是評委之一。這是一場 AI 互動創新大賽的分享交流會,主辦方就是張楠如今負責的業務重點:剪映旗下的 AI 產品即夢,這被視作一款可能再造抖音的產品。
幾天之後,張楠公開把即夢定義為「想象力世界」的相機,而抖音是一個「真實世界」的相機。
要打造想象力的世界,創新的來源更多是年輕的頭腦。抖音的成功離不開年輕的高校學生,他們曾是抖音早期運營團隊關注的重點人群,各種經典的挑戰類活動,都是靠着這些年輕的創作者們踴躍參與而不斷傳播開來,但與早年間抖音運營沒什麼錢、靠打感情牌不同,如今,即夢 AI 互動創新大賽一等獎是 10 萬元的獎金。
得獎人趙純想并不是學生,而是一個年輕的獨立開發者,此前憑借一款飲食記錄的產品「胃之書」嶄露頭角。而這次獲獎的作品,是一個 AI 視頻生成鏡頭精細控制 UIUX 方案,在展示的 2 分鍾 Demo 中,導入一張《天堂電影院》的經典場景圖,用户就可以生成一段視頻,實現推拉鏡頭、特寫、窗外鮮花盛開等 AI 創作。
而在即夢面世前三個月,快手可靈已經在國内率先上線了視頻生成大模型,它們同樣沒有忽視高校裏的年輕人,快手可靈與中國美術學院等高校聯合舉辦了 AI 創作大賽,獲得一等獎的三個作品,聚焦生活、廣告和自由發揮主題,分别拿到了獎金 36666 元。
更大的競争就在不遠的 2025 年,網傳一份對字節跳動 AI 視頻生成產品的調研紀要顯示,「字節希望在其生态内使用 AI 能力,認為明年各生态将形成競争閉環。明年五一之前,扣子智能體平台、豆包、抖音和 B 端的能力會形成關聯的生态網,文生視頻将會有更多的體現和使用場景。」
2025 年,在電商廣告、短劇等多個市場,抖音即夢或許将與快手可靈正面交鋒。
1
高開難高走
「高開低走」與「低開高走」,是現在抖音即夢與快手可靈最大的差别。
QuestMobile 最新數據顯示,即夢上線當天即在抖音平台引發了高漲的讨論熱度,可靈 AI 通過熱度的持續積累也在快手站内出現熱度峰值。但一個明顯的不同是,即夢的内容互動量在一個月高開低走,而可靈的内容互動量在一個月内低開高走。
這是推廣策略、用户體驗、市場競争等多種因素共同作用的結果,但一個最直接的原因,可能就是即夢的產品發布較晚,體驗不如預期,用户深入使用之後,很容易區分與同類產品在生成内容上的質量和穩定性,即便初始階段獲得了大量預熱,目前即夢在熱度上仍不及可靈。
這并非意味着即夢的絕對落後,有 AI 產品深度使用的用户認為,當下國產 AI 產品想要用好,就不能單用一個,尤其是在文生視頻創作中,用户選擇的做法往往是用即夢來做前期的文生圖,然後再用可靈來制作圖生視頻,因為「即夢的 AI 生圖比較優秀」。
字節調研紀要同樣顯示即夢和可靈之間差距很大,即夢日活用户在 20 萬 -22 萬之間,其中 70% 為個人或小型 MCN 工作室,大型企業較少,付費用户 2.5 萬人左右,月訂閲付費均價在 50 元左右;而同期可靈服務用户超 500 萬,累計付費用户超 200 萬,付費金額累計約千萬級别。
這種調研紀要難辨虛實,因為二級市場爆火的「豆包概念股」,字節跳動官方曾對投資者們做出風險提示,以免遭受不必要的投資損失。
而快手可靈之所以「低開高走」,一方面是視頻生成大模型本身的能力更穩定,占據了先發優勢,另外一面則是營銷策略的成功。「藍洞商業」在《快手可靈,把壓力給到了抖音剪映》中已經提到,當時快手通過海外科技大 V 測試可靈生成的案例,成功營造出其在海外市場火爆的氛圍,進而「出口轉内銷」。
半年過去,目前可靈在海外市場的關注度仍遠高于即夢,社交媒體 X 的關注人數是即夢的 67 倍。
就在張楠出現在火山引擎大會上,發布即夢最新消息的當天,快手又更新了可靈大模型,宣稱在内部評測中比此前 1.5 模型整體效果提升 195% 。而此前一個月的三季度财報會上,創始人程一笑也提到對可靈的憧憬:可靈 AI 的商業化單月流水超千萬人民币,有信心在明年實現收入規模的快速增長。
「高開低走」的即夢希望成為一種新的創造和體驗方式,根據調研紀要,明年即夢沒有明确的商業回報目标,但要有商業模式,「盈利要往後放」,明年即夢的重點将是與媒體、影視制作合作等產品形态的落地。
2
快手又将陷入包圍戰
抖音不是第一個做短視頻的,卻在 2018 年開始超越快手,後來居上成為短視頻賽道的第一。張楠曾總結過崛起的四個關鍵因素:全屏高清、音樂、特效濾鏡、個性化算法推薦技術。
如今,即夢對陣可靈,能否重演抖音對陣快手的故事?
即夢目前只是字節跳動在多模态大模型應用層的一款產品,隸屬于抖音旗下的剪映團隊,背後支撐服務的是字節跳動雲服務的火山引擎。在火山引擎官網的模型廣場上,字節跳動提供 20 個大模型產品,遍布文本、語音和視覺多個類型,此外火山方舟還提供月之暗面和智譜 AI 的產品。
AI 可能成為字節跳動下一個核心業務支柱,相比之下,快手磁力引擎的官方網站上,很難找到相關大模型商業應用的展示位。
這離不開抖音豐沛的流量廣告和投放支持,豆包和 Kimi 在今年的廣告市場上投放競争激烈,根據廣告情報分析平台 AppGrowing 統計,豆包智能助手 4 月、5 月的投放金額接近 1800 萬元,等到 6 月上旬,投放金額飙升至 1.24 億元,而且在抖音站内限制了 Kimi 在内的大模型廣告投放。
「營銷預算方面,即夢在 12 月預算開始提升,明年第一季度,尤其是春節前後将提到億級别的投入。」字節調研紀要提到。而除了營銷,字節跳動在芯片底層儲備上也不可小觑。英國《金融時報》報道稱,字節跳動采購了約 23 萬片英偉達芯片,已成為英偉達人工智能芯片的最大中國買家;TheInformation 也在 9 月份報道稱,字節跳動今年訂購了超過 20 萬台 Nvidia H20。
所以基于豆包在國内大模型市場取得的領先地位,未來的看點是,抖音和豆包如何聯動即夢,這也意味着,快手一枝獨秀的可靈,将陷入字節跳動大模型的包圍戰。
今年 9 月,對标 OpenAI 的 Sora,字節跳動發布了兩款對标文生視頻工具 PixelDance 和 Seaweed,即夢 AI 已經接入了豆包,其中支撐即夢的就包括能力更優秀的 PixelDance,官方介紹稱,能夠生成高質量的長達兩分鍾的 1080p 分辨率視頻,擅長描繪復雜的運動和物體之間的互動。
目前看,不論是抖音還是快手,AI 生成視頻最主要的落地場景都是趨同的,除了 C 端用户收費之外,B 端場景一個是服務于短劇等影視制作和後期市場,另外一個則是服務于廣告和電商内容營銷,比如商品素材展示上生成不同的圖片。
在火山引擎大會上,張楠曾展示過兩個即夢創作者的 AI 短片,其中一個就是今年 7 月份上線的科幻短劇《覺醒》,當時在抖音單日點贊破 40 萬;而同一時期,快手的可靈也打造過一部《山海奇鏡之劈波斬浪》,同樣都屬于試水制作。
但實際上,AI 生成視頻對影視制作只是輔助性的,目前階段仍然是小規模制作,要完成大批量的影視後期制作,即夢和可靈都是順着 Sora 類似的 Dit 架構(一種結合了 Transformer 架構的擴散模型,用于影像和視頻生成任務)在前進,都有很長一段路要走,商業化也尚為時過早。
3
當谷歌擊敗 Sora
OpenAI 的 Sora 開放使用之後,一系列生成視頻的表現并不符合外界的期待,而谷歌在近期發布的視頻生成器 Veo2,通過一系列測試表明,其有超過 Sora 的更驚豔表現。
尤其是一個最著名的切西紅柿的鏡頭,谷歌的 Veo2 刀子幹淨利落地切開西紅柿,避開了手指,而 Sora 視頻中的刀子卻切開了手,這讓 Sora 再次成為群嘲的對象,也讓行業人士認為,Sora 更偏向于運動,而 Veo2 則更注重物理的準确性。
有 AI 行業人士認為,谷歌之所以能超越 Sora,不光是發現了 Sora 物理準确性的弱點,更在于其利用 YouTube 來訓練其人工智能模型。
字節跳動的技術團隊并非沒有發現 Sora 在物理準确性上的弱點。11 月,豆包大模型團隊曾發布過一篇論文,名為《從世界模型的角度來看,視頻生成與之相距多遠:基于物理定律的視角》(《HowFar is Video Generation from World Model: A Physical Law Perspective》),探究了視頻生成模型能否觀察事物間的相互關系,并從中提煉出一套穩定的物理規律。
「視覺模糊性會導致在細粒度物理建模方面出現顯著的誤差,單純依賴視頻表示不足以進行精确的物理建模。」該論文認為,視頻生成模型要成為準确的世界模型還面臨挑戰。
而研究這個方向的兩位作者都非常年輕,一位是 95 後,一位是 00 後。如同即夢和可靈,都需要年輕的藝術學院的學生參與打造想象力的世界一樣,為這個 AI 想象力世界奠定技術基礎的,同樣來自年輕的頭腦。兩位作者耗費 8 個月時間,就是為了找到通往世界模型的一扇大門。
找到瓶頸需要 8 個月,而打破瓶頸可能需要耗費更長的時間。
抖音何時真正即夢?在那份調研紀要中,字節跳動明年的 AI 發展有三條主要路徑,一是豆包大家族生态;二是抖音等產品的全面 AI 化;三是包括即夢在内的多模态模型和世界大模型,而且多模态這一條是重點,「無限支持和投入,因為這是轉型的重要節點,可以接受較大虧損」。
當谷歌擊敗 Sora,預示着 OpenAI 創造的模型神話将被打破;而快手可靈,只是抖音即夢的下一個目标罷了。
審校 | 陳秋霖
>