今天小編分享的互聯網經驗:字節AI為何兇猛:重啟App工廠,争搶“豆包”,連模型也要賽馬,歡迎閱讀。
2023 年 8 月 18 日,字節跳動旗下 AI 對話產品 Grace,更名為「豆包」。
在百模大戰一波又一波密集的 " 重磅發布 " 中,這條當時看着毫不起眼的消息,悄然開啟了字節大模型的多重宇宙。
從時間線來看,字節跳動的确晚了。相比于當時反應迅速的百度和阿裡,沒有發布基礎模型的字節,彼時并無法靠「豆包」來說服質疑它的觀眾們。
據字節内部人士透露,2023 年年初,集團内部才剛剛開始訓練基礎模型,而後,字節跳動創始人張一鳴明确了 " 不卷基模,做 AI 應用 " 的戰略方向,之後字節開始高舉高打,内部的組織架構以及外部策略都開始進行了大變革。
11 月 27 日,也就是确認字節将放棄遊戲業務的同一天,字節跳動成立了一個新 AI 部門 Flow。
緊接着,字節系各類AI 應用如流水線上的產品一般,快速湧向市場。據矽星人統計,2024 年至今,字節在國内外推出包括「豆包」在内的 20 餘款 App,從集成式的聊天助手,到影像、視頻、音樂等效率工具,加速滲透到教育、辦公助手、開發平台、代碼生成等行業,而且,這些應用的表現亮眼,一個個在 AI 應用大亂鬥裡殺出重圍。
今年 3 月「豆包」的下載量和月活躍用戶開始雙雙登頂。而據 a16z 發布的全球 Top 100 AI 應用榜單顯示,字節系的 Cici、Coze、Gauth、Hypic、CapCut 五款產品名列前茅。與此同時,字節依然不斷在海外推出新的產品進行試點。
10 月份,這種勢頭仍在繼續,據 Sensor Tower10 月份最新數據免費榜前 10 中,Gauth 排名第六、TikTok 排名第七、CapCut 排名第九。
這些都是令所有 AI 應用創業者眼饞的成績。字節 AI 究竟為何能如此兇猛?
重啟 "APP 工廠 "
字節系 AI 產品全線突飛猛進的同時,許多人越來越明顯感到一絲熟悉的味道—— "APP 工廠 " 回來了。
在移動互聯網時期,"App 工廠 " 的打法是字節快速開疆擴土的重要策略之一。公開數據顯示,2018 年 -2020 年,也就是字節增長最為迅速的幾年間,它自研和收購了大量的項目,其中在 App Store 上線的應用就有約 140 個,占其成立以來的七成。
期間,字節通過批量生產,在今日頭條和抖音之後,也成功推出了剪映、懂車帝、皮皮蝦、番茄小說、輕顏相機等爆款。
從 2023 年 11 月,APP 工廠在 AI 時代重啟了,字節陸續密集上線了眾多 APP。經矽星人整理如下表:
值得注意的是,其中海内外產品幾乎一比一對應,一部分國内產品如豆包、剪映復制到國外;另一部分則是在海外高排名的產品復制回國内。
在整理的過程中我們發現,不少產品的名字在幾個月内頻繁變動,比如對标星野的 AnyDoor,早期進入國内時名為「話爐」,在今年 4 月份名稱改為「貓箱」,「河馬愛學」改名為「豆包愛學」等等。
這背後是字節系產品對于 AI 產品命名和定位的思考。
彼時大模型產品的命名常常引經據典,與文心、通義、混元、星火、天工相比,「豆包」聽起來土味十足。" 當時準備将 Grace 推向市場的時候,内部一致認為必須要改名,要做中國市場,英文名限制太大。陸陸續續起了 100 多個名字,有一部分有硬傷直接被 Pass 了,剩下的做了一些田野調查,有負面關聯又淘汰了一部分,最終是朱駿拍板定了「豆包」這個名字。"
豆包團隊的人員告訴我們:" 我們私底下讨論過,豆包這個詞在中國的滲透率差不多 80%-90%,沒有硬傷。字節内部起名字有一整套的流程,再經歷田野調查,這個名字有沒有什麼負面關聯。"
相比于創業公司和其他互聯網大廠,字節的優勢在于成熟的產品方法論,來保證產品的水平在 60 分以上,形成穩定的產出。
而在場景的選擇上,目前根據我們整理的結果發現,字節系產品其實并沒有真正在開拓新的場景,它其實很少 " 教育市場 ",而是更多 " 順應市場 ",在已經被部分驗證的場景下進行產品的迭代和優化。同時,海外市場更多承擔新產品孵化地的角色,產品在國内和國外是隔離的,通常一側上線,完成市場和用戶數據分析後再在另一側上線類似產品。
簡單地說,它的策略就是復制小爆款,成為大爆款。
比如「豆包」雖然推出得晚,但上線便集齊了對話、Agent、語音通話等當時分散在不同產品中的大模型功能,「貓箱」完全對标「星野」、「星繪」對标「妙鴨」、「海綿音樂」對标「Suno」,在此基礎上,結合用戶體驗對產品進行迭代。
哪些產品要放棄,哪些產品又要繼續投入資源?答案依然是,數據。
字節跳動有專門負責產品增長的團隊。這個團隊構建了一個強大的數據監測系統,他們會花大價錢去買市面上的數據,盡可能監控所有產品,用來指導研發。
基于信息差的實驗 + 地毯式孵化 + 數據增長,形成了一條新的AI APP 生產線。
争奪 " 豆包 ",模型也賽馬
App 工廠的背後,是字節式的賽馬機制。
"Grace 是 2022 年我們團隊開發的,在字節内部使用的產品,員工可以用它來學習一下内部資料。" 豆包初始團隊的同學告訴矽星人:" 到了 2023 年年初,字節内部有好幾個團隊還有自發組成的新團隊,都在嘗試新產品,但我們團隊因為做得早,有產品雛形,公司開始計劃基于原來的框架推一個移動端的產品。"
「豆包」誕生初期,賽馬并沒有那麼激烈,随着AI產品戰略逐漸明确,内部也逐漸開始了新一輪的賽馬。
據矽星人了解,目前字節内部形成了多輪賽馬制:
第一階段,創新產品中心負責前期孵化、產品創意、内部審核以及完成產品的前期打造,到產品測試上線。在這個階段幾乎不會有流量支持,靠產品自身的形态吸引自然用戶;
進入第二階段的產品,開始可以拿到一部分初始預算進行外部推廣,由專門負責增長的團隊負責拉新留存,進行產品排名,數據表現好結合内部分析,從創新產品中心進入到具體的產品組;
而第三階段,成型的產品開始進行大規模推廣,如「貓箱」、「星繪」從去年年底開始在抖音投流以及通過 KOL 推廣。
(早期產品生產内部架構)
" 有點内部創業的意思吧,項目做好了團隊内部分獎金,大家都希望能獲得更好的資源,但產品這邊的競争其實比較良性,畢竟大家并不交叉。"
不過,和移動互聯網時期的模式不同的是,當時所有的產品都是基于個性推薦算法團隊生長,而如今,在今天的AI產品們底下的模型層,字節其實并沒有達到統一。
產品層,豆包已經是一個統一的品牌,所有產品向豆包靠攏。但在模型層," 豆包 " 更像是一個代号,究竟誰能成為 " 豆包 ",更像是一場争奪行動。
舉個例子,9 月 24 日,火山引擎一口氣發布了兩款視頻生產模型,但對外并沒有展示詳細解釋兩款模型的差異,我們發現 PixelDance 和 Seaweed 在發布前,在 Github 上發布過對應的模型細節,它們分别屬于兩個團隊,但最終均被冠以 " 豆包 " 之名對外發布。
從内部結構來看,模型和算法歸屬于模型算法團隊 Seed,由朱文佳(曾任 TikTok 產品技術負責人)負責;2023 年 11 月成立的 Flow 團隊主要負責打造 C 端產品,在最新的人事調動中顯示,朱文佳為整體業務負責人、朱駿 ( 原 Music.ly 創始人、原 TikTok 負責人 ) 為產品負責人、洪定坤為技術負責人,向下包括豆包、AI 教育、社區、國際化四個部門,同時 PC 端和移動端也分為兩條業務線;而豆包大模型 to B 的商業化業務主要由火山引擎對外提供,并通過 API 的方式接入飛書。
Seed 團隊由原來的搜索團隊、AILab 團隊、AML 團隊聯合而成,但實際上,這幾個團隊都在暗自較勁。
" 現在的豆包更像是一個統一的出口,連接用戶。豆包產品後端連接了多個模型測試,是一個訓練場,通過API的結果反饋來評測模型效果,但一時間很難有取舍。" 上述内部人士講道。
在 GitHub 和 HuggingFace 上面,字節的各類視頻和影像模型,都分屬于各個小團隊,包含有 4 款不同功能的視頻模型。
根據公開資料和介紹,我們整理了各個模型的功能,發現目前主流視頻模型的能力散落在了各個模型裡,比如視頻編輯、運動筆刷、端到端視頻生成等等,也有在 Github 上評分較高的開源模型,顯示測試效果比已在國内發布的 PixelsDance 要更好。
比如 MagicVideo 的 V2 版本是目前開發者評價字節旗下最可用的一款文生視頻模型,V2 版本采用了模塊化式生產流程,第一模塊從文本到影像、第二模塊從影像到視頻生產關鍵幀、第三模塊從視頻到視頻擴展、第四模塊視頻幀插值,平滑過渡。目前整體的生成效果、色彩和審美高于 Pika1.0 和 Gen2.0。
有算法工程師就分析道:" 如果幾個模型的能力加起來,其實會比現在公開發布的版本更好,至少能達到可靈的效果,但是現在發布版本比較一般,可能也是内部賽馬資源沒有談妥的結果。"
字節 AI 產品今天的突飛猛進,是其賽馬機制下,一套屢試不爽的產品開發方法論加持的結果。但與移動互聯網時代字節的 " 生產體系 " 很不同的是,今天在底層的模型側,字節也在進行着賽馬。
字節可能寄希望于它也像應用一樣,百花齊放後篩選出最強的那一個,但同時它也客觀上帶來着資源無法集中的問題。尤其是在一個最需要大力出奇迹的時刻,這可能也會帶來新的挑戰。