今天小編分享的科技經驗:字節重建AI核心,歡迎閲讀。
11 月 13 日早上,一則關于阿裏巴巴決定申請仲裁 " 通義大模型前員工周暢違反競業協定 " 的消息迅速在 AI 圈傳播開來,而當天中午就有媒體得到阿裏内部人士的确認:情況屬實。
早在 2020 年,周暢就開始在阿裏達摩院帶領團隊訓練名為 M6 的多模态模型,2023 年 ChatGPT 爆火後,他所在的團隊在 M6 基礎上研發了 " 通義千問 " 大模型,該模型如今已成為眾多通義系列 AI 產品的技術底座。可以説他就是當今世界上最懂阿裏大模型的人,但這個人現在跳槽到了字節跳動,對于阿裏來説這無異于釜底抽薪。
7 月中旬,最先曝出來的消息是周暢即将辭職創業,然而 10 月底,他就已經加入了字節跳動。" 辭職創業就是個幌子,就是怕被競業," 在一家服務字節的獵頭公司工作的沈曼告訴《第一财經》雜志," 但這次瞞不住了,來字節的不止周暢一個人,他手底下的團隊還有十多個人也跟着跳槽了。"
此外,最近幾個月加入字節大模型團隊的關鍵人才還包括零一萬物前算法副總裁黃文灏,面壁智能原核心成員、序智科技創始人秦禹嘉。
這家中國最年輕也最激進的技術公司一直以擁有龐大的招聘團隊著稱,HR 部門巅峰時有 5000 多名員工,其中絕大部分人唯一的工作就是招聘,再輔以同等規模的外包獵頭體系,共同構成了一座史無前例的搶人工廠。其他體量相近的技術公司在招聘團隊規模上與它有着約一個數量級的差距,這意味着只要字節決定入場,每家競對公司都将面臨人才流失的風險。
但字節曾是 " 遲鈍 " 的。CEO 梁汝波在 2024 年年初的全員會上反思道,公司 " 直到 2023 年才開始讨論 GPT,而業内做得比較好的大模型創業公司都是在 2018 年至 2021 年創立的 "。百度 2023 年 10 月宣布已在百度搜索、文庫、地圖等各種應用中全部植入了 AI 能力時,豆包 App 剛上線不久,這也是當時字節唯一一款 AI 原生應用。
字節提速,從搶人開始
從 2023 年年中開始,這座工廠 AI 方向的搶人需求就沒有斷過。" 目标主要是阿裏通義團隊、百度文心和飛槳團隊,以及包括月之暗面、智譜在内的‘ AI 六小龍’,等等," 沈曼説," 國内有模型研發經驗的人才基數較少,所以工作時往往可以直接定位到團隊甚至個人。"字節對于基礎模型研發相關人才的招聘是沒有名額上限的,對于目标團隊的候選人在薪資上開出的數字非常可觀,經常可以看到基于原薪資雙倍的漲薪幅度。
根據沈曼的經驗,字節各個部門首先要向招聘團隊提出招人需求,但公司開放給各部門招聘人才級别的權限并不相同。字節職級一共分 10 級,從最低的 1-1 到最高的 5-2,數字越大,職級越高。其中 2-1(工程師)到 3-1(高級技術專家)是内部占比最大的。在業務維穩期,會有大量 2-1 和 2-2 的招聘需求。在業務需要 " 開疆拓土的階段 " 會放出 3-2、4-1 以及更高的需求。一般來説,只有盈利部門 3-1 以上的需求會更多,但是在大模型研發人才的招聘上,字節格外大方。《第一财經》雜志通過多方信源了解到,字節給周暢提供了一份幾乎無法拒絕的合同:4-2 的職級和 8 位數的年包工資,按阿裏的職級體系換算大約是連跳兩級且薪資翻好幾倍。與他一起來的原團隊成員,字節也都給了 4-1、3-2(對标阿裏級别 P10、P9)的職級。" 你也可以把周暢這單合同看作一份英雄帖,字節是在告訴所有人,它願意給,而且給得起。" 沈曼説。
對于字節來説,搶人早已是公司開辟新業務時慣用的手段。字節創始人張一鳴曾多次在公開場合提到 " 人才密度 " 的概念,在他看來,只要保證人才密度超過業務復雜度,那麼在有效的激勵措施下業務的成功是水到渠成的。
張一鳴本人就是這套理論最忠實的踐行者,字節旗下今日頭條、抖音等信息流產品所倚仗的核心技術,即推薦、廣告、搜索算法(簡稱 " 推廣搜 ")的研發班底其實就來自于百度。2014 年至 2015 年,張一鳴以高薪從百度網頁搜索部相繼挖來了當時的副總監楊震原、主任架構師朱文佳,以及一批機器學習算法工程師。現如今,楊震原已是字節跳動副總裁兼火山引擎業務負責人,朱文佳則擔任過今日頭條 CEO 及 TikTok 產品技術負責,2023 年年初更是成立了代号為 "Seed" 的神秘團隊,專注于大模型底層技術的研發。
其實比從外面搶人更早一點發生的,是字節内部的 " 搶人 ",或者按官方的説法:團隊重組。
神秘和特殊是樂雁對 Seed 團隊的最早印象。2023 年年初,他發現在字節機器學習平台的算力使用榜前排出現了一些新名字。依照過往經驗來看,排名靠前的都是當前字節内部最受重視、得到最多資源傾斜的團隊,而前幾名的算力使用量往往能占當時總算力的一半。一些消息靈通的同事稱這個新成立的團隊很可能在做基礎模型的研發,他們的工作區還有第二道門禁。
樂雁 2020 年才作為算法工程師加入字節,但他對這家公司靈活多變的管理風格并不陌生,從每個人到每個部門,一切都在名為效率的指揮棒下快速移動、安置、再移動、再安置。
AI Lab 在公司内部式微後,字節 AI 研究的重心轉移到應用機器學習(Applied Machine Learning,AML),也被稱作機器學習中台部門,該部門一方面負責傳統產品的推廣搜算法研發,另一方面被要求拓展新業務,包括搭建字節的算力集群并訓練大模型。其中的關鍵人物包括原機器學習系統負責人朱亦博,他 2023 年辭職後參與創辦了 "AI 六小龍 " 之一的階躍星辰;大語言模型研發技術專家楊紅霞 2023 年年初加入字節,曾在阿裏達摩院擔任 M6 大模型的技術負責人,也就是周暢曾經的領導,不過 2024 年 5 月她已離開字節。
在 2023 年年初成立 Seed 團隊是字節在 AI 業務上的又一次調整,該團隊主要班底來自搜索、AML、AI Lab 等部門中的大模型相關人才。不僅如此,樂雁稱這個團隊同時還在從其他部門物色人才,以提升這個新興業務的 " 人才密度 "。
沈曼估計,如今 Seed 團隊的人數應該已經超過了 150 人,這還僅僅只是字節研發基礎模型的團隊。2023 年年底,字節又成立了一個名為 Flow 的團隊,負責基于大模型的 AI 原生應用的研發,豆包就是其成果之一,該團隊的人員增長更快,目前有近 300 人。除此之外,字節每個業務部門都被要求思考如何将大模型落地到相關業務場景裏。
回歸 AI 核心
字節正在自上而下地重建它的核心——人工智能。
早在 2016 年,張一鳴就在公司内建立了 AI Lab,力邀微軟亞洲研究院前常務副院長馬維英、華為諾亞方舟實驗室原主任李航、自然語言處理技術專家李磊等多位科學家加入,設立了包括計算機視覺(CV)、自然語言處理(NLP)、語音和音頻處理、音樂、機器學習等多個子團隊,幾乎覆蓋當時人工智能涉及的所有前沿領網域。同時,這個實驗室在北京、上海、深圳、新加坡、美國、歐洲等地都設有辦公室。馬維英被委任為 AI Lab 負責人,直接向張一鳴匯報。
AI Lab 的設立顯示了張一鳴在新技術時代的雄心。彼時的字節還不是 " 大廠 ",它創立僅 4 年,只有今日頭條一個爆款應用,無論公司資歷還是業務體量都無法與阿裏巴巴、百度、騰訊等巨頭相比。那段時期,百度和騰訊已先後大手筆成立了自己的人工智能實驗室,在全球招攬人才,其中百度還招募到了微軟前全球執行副總裁陸奇加入。字節是那一輪 AI Lab 建設浪潮中鮮見的初創公司,而且它作出這一決定的時間比阿裏巴巴早,後者直到 2017 年 5 月才宣布成立達摩 院。
字節後來的發展數十倍、百倍地回報了這一時期的技術投 入。
AI Lab 成立的同一年 9 月,抖音誕生。當時,2011 年就成立的快手通過 " 農村包圍城市 " 策略已收獲大量三四線城市用户,作為剛誕生的同類應用,抖音試圖從一二線城市突破,将 " 音樂 "" 年輕 "" 潮流 " 确立為主打風格,而支持這些風格所需要的功能——變臉、換裝、美顏甚至尬舞,都依賴于人工智能技術。以 " 尬舞 " 為例,它使用字節 AI Lab 的 " 人體關鍵點檢測 " 技術,可以讓用户在鏡頭前跳舞時了解自己的姿态是否和目标姿态準确匹配。2017 年,抖音上線了基于該技術的 " 尬舞機 " 功能,App 版本更新後的第二天,抖音就衝到了應用商店免費榜的第一名。
人工智能技術不止加持了抖音,也使字節開始成為真正的 App 工廠、全球化公司。2018 年,張一鳴在當年舉辦的首屆數字中國建設峰會上發表題為《技術出海,建設全球創作與交流平台》的主題演講時表示," 人工智能技術是字節跳動在全球市場取得優勢地位的關鍵 "。不論是綜合資訊類的產品 TopBuzz、News Republic,還是短視頻類的產品 TikTok、musical.ly、Vigo Video、BuzzVideo,這些產品雖然有着不同名字,内核都是同一套人工智能技術方案——推薦算法,張一鳴稱它為全球用户提供了一致的產品體驗。
然而當抖音、TikTok 等核心應用取得具有絕對優勢的市場地位、開始步入 " 流量如何商業化 " 的階段,AI Lab 在字節的位置松動了。指标性迹象是 AI Lab 負責人馬維英的匯報對象從張一鳴變為當時的抖音負責人張楠,這意味着 AI Lab 不再是個集團級的前瞻性項目,變成了服務于抖音這一應用的技術團隊。
馬維英于 2020 年年中宣布離開字節跳動,回歸學界加入清華大學智能產業研究院。同在該實驗室擔任總監的李磊和王長虎也于次年離職,其中李磊像馬維英一樣重返了學界,王長虎則于 2023 年投入視頻生成模型領網域的創業。
随着核心團隊成員的離開,字節 AI Lab 體系開始被進一步弱化和拆分。按照樂雁的説,他 2020 年加入 AI Lab 時這個部門還是字節跳動 AI 研究的核心部門,團隊規模上百人。但次年,AI Lab 重組,各個組被拆分到不同的業務線,比如影像視覺的一部分人就被劃分到商業化團隊下,為公司一些業務提供技術中台支持,如抖音的手勢、肢體識别等 AI 功能。這次重組後,整個 AI Lab 只剩下不到 50 人,主要做一些偏學術方向的研究,比如機器人等,原先的視覺模型、自然語言處理等方向都已不存 在。
張一鳴很早就意識到了 AI 在内容分發上的巨大潛力,不過他可能沒有意識到 AI 在内容生產上的潛力更大,大到可能颠覆其基于内容分發技術構建的產品形态和競争優勢。目前,業内已有不少創業項目都在基于生成式 AI 構建新一代内容社區,其中既包括可能取代小紅書的文字、圖文社區,也包括可能颠覆抖音、TikTok 的短視頻社區。如果字節不能提供相似或更好水平的内容生產技術,用户很可能會轉移至其他平台。畢竟社區的本質首先是為創作者提供創作工具,其次才是表達渠道,Instagram、小紅書、抖音的崛起,一再説明了這一點。
公開資料顯示,早在 2017 年馬維英就公開表達過:" 在内容分發上 AI 算法已經做得很好了,但很多信息的需求不是靠搜索 3 個網頁就可以滿足 …… 我們希望 AI 能夠在創作端釋放出人更多的創意。"AI Lab 總監李航也曾在 2022 年發表論文讨論基于 Transformer 的 " 序列到序列模型 ",Transformer 正是後來令 GPT 系列模型大火的新 AI 架構。李航在那篇論文中提到了 Google 的 BERT,還提到了 OpenAI 的 GPT。當年 11 月的最後一天,OpenAI 發布了基于 Transformer 的 ChatGPT。到了 2024 年年初,字節 CEO 梁汝波在全員會上反思公司對大模型反應 " 遲鈍 "" 直到 2023 年才開始讨論 GPT"。
2023 年緊急成立的 Seed 團隊,某種程度上承擔了 AI Lab 最初成立時被賦予的角色:理解和抓住眼下最前沿的人工智能技術,讓字節跳動不要掉隊,甚至能引領行業。
補課、燒錢與飽和式攻擊
字節跳動自 2023 年以來的狀态與其説在試圖重現 " 大力出奇迹 " 的神奇功效,不如説是一種擔心被落下的補課。
不僅在人才端搶人,應用端也在搶用户。據《第一财經》雜志統計,字節目前還在正常運營的 AI 應用有大約 20 款,其中絕大部分是在 2024 年以後發布的。而在模型層,2023 年只正式發布了語言模型的字節,在 2024 年相繼補全了影像、語音、音樂、視頻、3D 等不同模态的生成式 AI 模型。在這一輪生成式 AI 浪潮中起步最晚的字節,已經成為目前擁有最全生成式 AI 模型、最多 AI 應用的技術公司。
字節再一次祭出了拿手好戲:内部賽馬,外部 " 小步快跑、敏捷迭代 ",以及燒錢。
樂雁對《第一财經》雜志説,現在 Seed 和 Flow 是字節明面上的生成式模型與應用部門,但當公司高層都将目光投向這個領網域時,每個有 AI 研發能力的團隊都在嘗試研發出更好的模型或產品,争奪更多的資源與升職的機會。" 就比如 Seed 最近同時發了兩款視頻模型(SeaWeed 和 PixelDance),這兩個模型其實是不同小組做出來的,最後都放出來説明這兩個模型确實在能力上各有千秋," 他説," 如果其中某個團隊的模型哪怕稍弱一點,那壓根就不會被外面看到,字節一直都是這種賽馬模式。"
面對外部,字節則采取了一貫的 " 飽和式攻擊 "。以 Coze 為例,它對應的是 AI 智能體最熱門的應用場景之一,它允許用户自己創建定制化的聊天機器人,并且這個機器人能将各種功能節點(如插件、模型、代碼)按照一定的順序和邏輯關系連接起來,創建出復雜的業務流程,以實現特定的任務或功能。
白話 Agent 主理人古德白今年年初就一直在嘗試基于 AI 工作流做營銷工具,他告訴《第一财經》雜志,Coze 幾乎每天都在更新版本,這需要大量資源投入和團隊配置,字節雇用了大量外包公司完成最後的產品測試," 創業公司很難應對這樣的飽和式攻擊。" 古德白説。而且 Coze 推出時直接采取 " 模型免費使用 " 策略,導致國内最早落地 AI 工作流功能的另一個平台 FastGPT 迅速沉寂,Coze 則後來居上。
字節也是今年年中國内大模型價格戰的發起者。2024 年 5 月,火山引擎 FORCE 原動力大會上,字節跳動在正式發布豆包大模型的同時向模型的 B 端價格揮起屠刀,豆包通用模型 pro-32k 版的推理輸入價格僅為 0.0008 元 / 千 tokens,比行業均價低 99.3%。這意味着客户花一元錢就能讓豆包模型處理 200 萬個漢字,相當于 3 本《三國演義》——當時花同樣的錢只能向 GPT-4 輸入不到 4000 字,甚至不夠一篇短篇小説。面對字節發起的價格戰,競争對手不得不快速跟進。阿裏雲将其通義千問主力模型的價格下調 97%;百度甚至直接宣布文心兩款輕量級模型免 費。
面向 C 端用户的 AI 應用上,字節燒起錢來更是毫不手軟,花錢投流買量成為它實現產品冷啓動最直接快速的方式。據廣告情報分析平台 AppGrowing 統計,豆包智能助手 4 月、5 月的投放金額接近 1800 萬元,等到 6 月上旬,投放金額飙升至 1.24 億 元。
與此同時,字節還限制了豆包的競對產品在抖音平台的廣告投放。其中受影響最大的就是智能助手 Kimi,這個由 "AI 六小龍 " 之一月之暗面推出的產品,在豆包下場前曾經依靠在抖音、哔哩哔哩等平台的投放快速起量,但一位 "AI 六小龍 " 的員工説,豆包不僅復制了這個成功路徑,還依靠其母公司字節跳動的力量,限制了包括 Kimi 在内的對手在抖音内的廣告推送。
結果就是,今年 3 月,Kimi 依靠社交平台的廣告投放超過百度旗下的同類產品 " 文小言 "(原文心一言),成為月活最高的原生生成式 AI 應用。4 個月後,Kimi 被豆包超越。一個月内,豆包的月活用户數量從 904 萬陡然上升至 5127 萬,把廣告投放沒那麼激進的 Kimi 和文小言遠遠甩在後面。"AI 產品榜 " 的數據顯示,10 月豆包的排名以近 7000 萬月活用户在中國 AI 產品中斷崖式領先,同為智能助手的 Kimi 與文小言分别只有約 3900 萬和 3400 萬月活。
用花錢的方式買用户的成本目前還不算高。一位熟悉 Kimi 投放策略的人士對《第一财經》雜志説:" 目前 Kimi、豆包的用户留存率還很健康,單個用户獲取成本只有十幾元,這是相當劃算的數字,成熟階段互聯網產品的用户獲取成本都在好幾百 元。"
但這些用户有沒有忠誠度就是另外一回事了。以視頻生成領網域為例,今年 7 月,Luma AI 發布的最新模型 Dream Machine 4 天内獲得了 1000 多萬用户,這些人最早是 Runway 的用户,後來 Pika 發布時也曾湧入 Pika。而且,廣告投流能帶來的邊際效益也在減少。綜合 Similarweb 發布的投流數據和 App Growing 發布的用户數據,不久前階躍星辰的智能助手躍問也在瘋狂投放,花了近 7000 萬元,但截至今年 10 月只轉化來不到 2 萬個新用户。
與字節的激進形成對比的是國内其他大廠和初創公司們的謹慎。
除了字節,其他中國技術公司對生成式 AI 的熱情都在消退——以積極的視角看,這個領網域正在變得理性。最早押注 AI 的李彥宏在剛剛召開的第三季度總監會上表示," 百度不碰 Sora 類的視頻生成 ",并且在文小言的推廣上選擇 " 穩健 " 而非 " 激進 ";阿裏不再執着于開發 all in one 的 AI 超級應用,而是将更多精力放在 AI 雲服務上;短視頻巨頭快手至今沒有推出過語言模型應用,而是集中在視頻模型的開發與應用上。多位人士向《第一财經》雜志證實,随着國内模型在能力上逼近 GPT-4,以及 GPT-5 的一再延遲,多家公司尤其資源有限的初創公司對于投入訓練下一代基礎模型(通稱 " 預訓練 ")變得謹慎。甚至有投資人稱暫停 " 預訓練 " 的 AI 六小龍不止兩家。
一位業内人士告訴《第一财經》雜志,獨角獸們選擇暫緩預訓練下一代大語言模型的原因之一,是即便預訓練一個比現有模型好 1 代甚至 1.5 代、超越 GPT-4 的模型,其推理能力仍然達不到讓終端應用從陪伴領網域進入生產力領網域的產品需求。GPT-4o 目前在生產力領網域的應用狀況已經説明了這一點。根據階躍星辰創始人姜大昕在阿裏雲栖大會上提到的數據,GPT-4 達到萬億級參數後,再去提升參數量,邊際收益是下降的。
字節卻沒有減速的迹象。沈曼對《第一财經》雜志透露,預訓練人才是字節目前最急要的人才類型。最近字節成立了一個叫 " 大模型研究院 " 的機構,從名字看,它可能承擔比基于現有算法訓練模型更為前沿的任務。最初的市場傳言稱,從阿裏雲挖來周暢就是讓他負責這個團隊。不過也有消息稱,為避開競業協定,周暢被派去了新加坡就職,工作方向是具身智能,研究機器人在物理世界中自由行動需要的 " 世界模型 "(world model)。AI Lab 在字節式微,其仍然被張一鳴看重并重點投入的最後一個研究方向就是機器人,這些機器人被認為可以服務于字節的電商履約需求。
豆包目前還沒有盈利,據 Acecamp 上一份專家訪談紀要,字節跳動對于大模型的财務政策是 " 推理層不虧 ",即模型訓練階段所需要的研發投入、芯片算力投入、人員成本方面可以承受戰略性虧損,而模型投入應用後每次調用的成本需要降低。豆包目前對于 B 端用户按照 API 調用收費,平均每 1 億個 tokens 調用收費約為 80 元至 200 元,豆包能從這種調用中獲得 8%-10% 的毛利。尚未向 C 端用户收費。訪談紀要稱,從 2023 年至 2024 年,字節跳動通過 " 模型蒸餾 ",将模型尺寸從 300B 降到了 80B 左右,大幅降低了算力開銷。
目前,豆包還沒有向 C 端用户收費,一大原因仍然是產品不夠,一旦開始收費用户就可能流失。紀要提供的數據稱,每個豆包用户每天使用該應用的平均時長只有 10 到 11 分鍾,而且這個時長是多次使用後的累積數字,如果平攤到每次使用時長,數字就會降低為 2 分鍾,即用户每次打開豆包基本只會進行 3 到 4 輪對話就會結束。" 如果 2 分鍾内未能滿足需求,他們可能會切換到其他應用,而不一定是其他 AI 工具。例如,用户可能會打開微信、小紅書等應用。" 紀要中稱。
豆包已經是目前國内用户量最大的原生 AI 了。然而字節對此有個更激進的目标,即今年年底實現 1 億月活。
日後看,字節的飽和式投入中一定有不少比例是浪費的,但眼下的現實狀況是,它不得不為新技術時代的到來做足準備。作為字節一直以來——從社交媒體到元宇宙——的戰略對标對象,Meta 也在以上百億美元的規模投入 AI,MetaCEO 扎克伯克在最近一次與英偉達 CEO 黃仁勳的對談中解釋為什麼這麼做時説:" 今天你在 Instagram 上看到的大部分内容是根據你的興趣匹配給你的 …… 在未來,我認為這些内容會由創作者使用 AI 工具創造,或者由 AI 綜合生 成。"
字節的财務狀況在眾多大廠中還算不錯。據科技媒體 The Information 報道,2024 年上半年字節跳動的營收約為 730 億美元(約合 5280 億元人民币),這一數字已經遠遠超過騰訊同期 3206 億元的營收,接近 Meta。而字節目前的估值只有 Meta 的 1/5。若有資金需要,它還比其他公司都多一個可觀的融資渠道:上市。不過它的造血業務——廣告和電商的增速已在快速放緩。今年前三季度,字節中國區單季度廣告同比增速從 40% 左右跌至 17% 以内,已有兩個季度未能達成既定目标。與此同時,抖音電商的銷售額增速也已從年初的超過 60% 跌至 9 月的不到 20%。成熟業務的增速一旦變成個位數,字節能夠支持新業務的現金流就會受限。
不過對一個試圖進行重大轉型的公司來説,上市并不是個好選擇——上市之前轉型成功的公司多見,上市後成功的則不多。對字節而言,造血能力決定一切。