今天小編分享的科技經驗:被張一鳴激勵的字節AI大将,做出國内最值錢視頻大模型,歡迎閱讀。
" 創業要做非共識但正确的事。" 張一鳴的這句話,曾影響了無數字節系創業者,其中也包括前字節 AI 大将王長虎。
作為字節跳動視頻生态崛起的關鍵人物之一,2017 年王長虎加入當時還被稱作 " 今日頭條 " 的字節跳動,出任 AI Lab 總監,完整參與了抖音和 TikTok 兩大現象級產品從 0 到 1 的建設。
在 2023 年視頻生成賽道尚處 " 非共識 " 階段時,王長虎卻繞開彼時如火如荼的文生文大模型賽道,押注視覺大模型,并先做海外市場。
" 當時支撐我們的信念就是,我們堅信我們做的事情是非共識的、但正确的事情。" 這也正是王長虎在字節期間,經常聽張一鳴強調的觀點。
見證過抖音在移動互聯網時代的颠覆,王長虎堅信視頻生成賽道存在平台級產品的機會。"UGC 到 AIGC,變的是 U 和 AI,最主要的視覺難題不盡相同,但系統性地解決視覺問題所需要的核心技術能力卻一脈相承。" 王長虎想做的是一款讓普通人也能輕松玩轉 AI 視頻創作的全民應用。
直到 2024 年初 Sora 橫空出世,大眾對視頻生成的熱情被點燃,也讓王長虎走到了聚光燈下。
Sora 發布後,一張梗圖流傳于社交媒體:Sora 是坐在寶座上的巨大神像,下面跪着一眾渺小的膜拜者,包括 Runway、Pika、SVD、PixVerse 等十多個視頻生成模型或產品。
由王長虎開發的 PixVerse, 是 " 膜拜者 " 中唯一一個由中國公司開發的產品。
看到這張圖後,王長虎的心情很復雜,對于 " 跪 " 在了第一排,跟 Runway、Pika、SVD 等當時最好的視頻生成產品放到一起,王長虎是感到榮幸的,但更多的是遺憾," 如果我們過去一年有更多的投資和算力資源,有可能最先做出 Sora 的不是美國人,有可能是我們。"
近日,王長虎創辦的愛詩科技剛剛完成 A5 輪融資,累計融資金額超 4 億元,成為中國視頻大模型領網域融資規模最大的創業公司。
但随着老東家字節也開始殺入視頻生成賽道,當愛詩科技押注的非共識成為大廠新共識之後,王長虎的新挑戰也随之展開。
01
Sora 橫空出世的第二天,王長虎一大早就被微信吵醒了,投資人、朋友、家人、同事紛紛問他 " 如何看待 Sora?" 還有人問他,超越、追趕 Sora 的最佳視窗期是多長時間?
王長虎的答案是一年前的 2023 年," 是在視頻生成行業很冷的那一年 "。也正是在那一年,在幾乎所有人都不看好視頻生成賽道的情況下,王長虎創辦了愛詩科技。
甚至,在還沒拿到天使投資的時候,王長虎就收到了投資人朱嘯虎的勸退:" 你還是回去上班吧,大模型在中國沒有機會 "。
但作為一名技術理想主義者,親歷深度學習與計算機視覺兩次技術浪潮,王長虎認為生成式 AI 是 "10 年一遇的機會 ",不願錯過時代變革。
20 年前,王長虎做的第一個研究,就和 AIGC 有關。2004 年,王長虎還是中國科學技術大學電子工程與信息科學系的一名大四學生,他做了人生首個研究,就是根據一張或多張人臉圖片,生成該人臉的 3D 模型。
同年,王長虎進入微軟亞洲研究院實習,并在中科大博士畢業後轉為正式員工。期間,王長虎的工作内容也有不少與 AIGC 相關,但 13 年後他還是離開微軟去了字節跳動。
" 在微軟可以做世界上最頂尖前沿的科學研究,但科研項目應用到公司產品需要的周期特别長。" 在王長虎記憶中,自己二零零幾年做的工作,若幹年後才真正應用在必應搜索引擎,新技術很難在第一時間影響用戶。
不同于其他大廠在產品成熟後才建立 AI 部門,字節跳動一邊開發短視頻類產品,一邊組建 AI Lab 部門。也正因如此,2017 年加入字節跳動後,王長虎完整參與了抖音和 TikTok 等短視頻類產品從 0 到 1 的建設和發展,并為集團各產品提供 AI 技術支撐和業務解決方案。
然而當抖音、TikTok 等核心應用取得具有絕對優勢的市場地位、開始步入 " 流量如何商業化 " 的階段,AI Lab 在字節的位置松動了。這一點從 AI Lab 負責人馬維英的匯報對象從張一鳴變為當時的抖音負責人張楠中就能窺見端倪,這意味着 AI Lab 不再是個集團級的前瞻性項目,變成了服務于抖音這一應用的技術團隊。
2021 年,王長虎離開了字節跳動。離開的原因,用王長虎自己的話說是 " 發現自己進入了舒适區,想要挑戰新的事物。"
王長虎 圖源:愛詩科技官網
王長虎是一直有創業情結的,從字節離開後他不是沒想過直接創業,但當時生成式 AI 技術的進步還不足以對整個產業產生巨大影響。
直到 Stable Diffusion、ChatGPT 出來之後,王長虎意識到新的 AI 時代到來了。
見證過抖音在移動互聯網時代的颠覆,王長虎堅信視頻生成賽道存在平台級產品的機會。
2023 年 4 月,王長虎找到現在的合夥人、之前在光源資本 TMT/AI 方向負責人謝旭璋,并拿到超過五千萬的天使輪融資,随即宣布成立了新公司 " 愛詩科技 "。
同年 6 月,數名核心人員就位,核心成員中大都是跟随王長虎在字節跳動打過硬仗的。團隊成立第一天的時候,王長虎就将目标客戶群定位為每天玩抖音、TikTok 的用戶," 我們的基因是伴随抖音、TikTok 成長起來的,肯定主要還是 to C 。"
02
直到 2024 年初,一款名為 PixVerse 的 AI 視頻生成產品在海外突然爆火,首月訪問量便突破 120 萬,這一數字超過了矽谷同期明星初創產品 Pika 上線三個月後的 200 萬月訪問量。
這是王長虎創業半年交出的答卷,但與此同時,一場視頻生成領網域的巨變正在醞釀之中。
一個月後,Sora 震撼發布,雖然只是預覽版本,但還是憑借 60 秒一鏡到底的高清生成能力和三維空間動态連貫性,迅速引爆科技圈,不少業内人士将 Sora 視為 AI 視頻界的 ChatGPT 時刻。
AI 視頻生成的戰場,因為 Sora 的到來,開始真正熱了起來。
提前搶跑的王長虎也因此受到關注。"Sora 的出現恰恰驗證了我們一開始制訂的技術路線是正确的。" 在王長虎看來,Sora 的技術發展相當于在 GPT-2 和 GPT-3 之間,還沒到 GPT-4 的水平,留給市場的空間很大。" 我們有信心在 3-6 個月之内就可以追趕上 Sora 目前的水平。"
不只王長虎,面對彼時尚處于 " 期貨 " 的 Sora,國外 Runway、Luma AI 等一批初創企業均推出了最新的視頻生成模型,阿裡、騰訊等國内巨頭也紛紛發布基于各自優勢的視頻生成模型,不少大模型企業都将研發 " 國產 Sora" 擺在了優先戰略級。
王長虎的老東家字節跳動也殺了進來。 事實上,Sora 發布前,抖音前 CEO 張楠剛剛轉崗剪映,正準備在 AI 視頻生成領網域大幹一番。Sora 的出現,加快了字節 AI 生成視頻產品的研發速度,當月,剪映推出名為 Dreamina 的 AI 繪畫工具。3 個月後,剪映 Dreamina 正式更名為 " 即夢 ",上線 AI 作圖和 AI 視頻生成功能,生成時長為 3-12 秒。
立足海外的王長虎,和老東家的首次交鋒發生在國外市場。PixVerse 發布半年後,字節旗下的 AI 視頻生成產品 Dreamina(國内版名為 " 即夢 ")登上了 CapCut (海外版 " 剪映 ")的主頁面。
如今,老東家親自下場,不僅在資源上對王長虎形成碾壓,更在用戶觸達上構建起難以逾越的生态壁壘。
剪映海外版 CapCut 上線于 2020 年。随着 TikTok 席卷全球,與之深度綁定的 CapCut 也搭上了順風車。根據移動數據監測公司 SensorTower 的數據,CapCut 的 MAU 已超 4 億,占據全球移動視頻剪輯市場逾八成份額。
龐大的用戶基礎下,字節跳動從 UGC 邁向 AIGC,似乎更加水到渠成。CapCut 可以輕松地将新的 AIGC 功能通過 TikTok 的各種推廣渠道觸達用戶,再通過 TikTok 發起特效全球挑戰賽,這種 "AI 工具 - 内容裂變 - 流量反哺 " 的飛輪效應,正是初創公司難以復制的生态優勢。
" 抖音也是在巨頭圍堵過程中成長起來的。" 在王長虎看來,小公司有小公司的優勢,比如決策流程很快,可以聚焦做一件事情。" 在視頻生成這個方向,我們一方面是有先發優勢,一方面我們有信心持續走在最前面。"
然而現實遠比理想殘酷。截至目前,國内 AI 視頻生成賽道擠入近 20 家創業公司,但巨頭的生态絞殺從未停止,字節跳動通過 CapCut 免費開放部分基礎 AI 功能,阿裡雲視頻生成大模型萬相 2.1 已經開源……初創公司不僅要證明自己比巨頭更快,更要在用戶心智被占領前,找到巨頭 " 不願彎腰撿硬币 " 的垂直縫隙。
03
前有 Sora 需要追趕,後有巨頭來勢洶洶。王長虎也加快了產品迭代的速度。
從 2024 年初上線至今,PixVerse 模型的版本已經更新了 6 次,憑借 " 毒液 "" 機器人變身 " 等特效在社交媒體頻頻出圈。截至目前,PixVerse 的全球用戶量已突破 4000 萬,單月月活躍用戶(MAU)達 1500 萬。
但百度董事長兼 CEO 李彥宏率先給視頻生成賽道潑了盆冷水。"Sora 這種視頻生成的投入周期太長了,10 年、20 年都可能拿不到業務收益,那麼無論多麼火爆,百度都不去做 ",2024 年三季度總監會上,李彥宏明确表态道。
Sora 成本究竟有多高?市場研究機構 Factorial Funds 給出過一份報告,Sora 模型至少需要用掉 4200~10500 塊英偉達 H100,想要大範圍應用,還需要再增添約 72 萬張英偉達 H100,單論 GPU 投入費用,就需要超 200 億美元。
面對巨頭碾壓和有限的資源,王長虎也在不斷降低訓練成本。在字節期間主導構建的視頻 AI 中台的經驗,使其團隊掌握了從海量數據中篩選出一小部分高質量數據來訓練更優秀的模型的能力," 訓練成本僅為大廠的十分之一甚至更低 "。
而經過一年的蓄力,去年 12 月,Sora 正式版終于姗姗來遲,但效果卻不盡如人意,被不少用戶吐槽 " 不如一個中國的開源模型 ",價格同樣槽點滿滿,Pro 版要 200 美元一個月。
随着 Sora 熱度降溫,資本對 AI 視頻生成領網域的投資愈發謹慎。在 AI 這個快速迭代的領網域,市場瞬息萬變,錢的流向也随之發生變化。年初 DeepSeek 掀起一場算力革命,加速了推理大模型的研發,近日 Manus 的出圈則點燃了 Agent 生态。
與此同時,行業競争加劇,AI 視頻生成工具之間差異化越來越小,用戶增長乏力已成為不争的事實。
王長虎的 PixVerse 也未能逃脫訪問量下滑的趨勢。根據 aig crank 數據,2025 年 2 月,PixVerse 訪問量出現下滑,環比下降 14%。另據 SimilarWeb 統計,位居全球前列的 AI 視頻生成企業 Luma AI、Pika 的月總訪問量都出現了環比下跌。
當行業陷入同質化競争,王長虎也準備将戰場轉向國内,以開辟更大的潛在用戶。據悉,PixVerse 國内版本已進入籌備階段,預計将于近期上線網頁端及 APP 產品。
" 視頻生成技術離流量和商業化很近,國内市場的用戶基數與應用場景有更多發展和實踐的可能。" 在用戶付費意願高的國外市場,王長虎付費訂閱的商業化得到了驗證。
但在國内,免費與開源的視頻生成工具已在市場中占據了一定的市場份額。老東家字節跳動旗下剪映已集成 AI 視頻生成功能;騰訊智影、百度 AI 創作平台通過雲服務生态持續蠶食企業級市場;而開源社區中,阿裡 ModelScope、清華 VideoGPT 等國產模型不斷迭代,正在消解技術壁壘。
更嚴峻的是,國内用戶對 AI 工具付費意願僅為北美市場的三分之一,超 60% 的創作者首選免費基礎功能——這與 PixVerse 在海外賴以生存的訂閱制商業模式形成衝突。
當技術護城河遭遇生态碾壓,轉戰國内的王長虎需要證明的是:在算力與流量的雙重絞殺下,小而美的故事如何繼續講下去。