今天小編分享的互聯網經驗:字節AI部門Seed定位調整,從Gemini加盟的吳永輝将成新負責人,歡迎閱讀。
面對 DeepSeek 給模型技術及應用模式帶來的新衝擊和挑戰,字節的調整比以往更加迅速到來。
多位接近字節的人士對矽星人透露,字節的 AI 核心部門 Seed 正在快速調整定位和調兵遣将。剛剛從谷歌加入字節跳動的 AI 大牛、參與了 Gemini 開發的 Google Fellow 吳永輝博士,将成為 Seed 新的負責人,替換原 LLM 團隊及 Seed 總負責人朱文佳,團隊内部正在梳理調整匯報關系。
對此,矽星人向字節跳動求證,對方稱:吳永輝博士主要負責 AI 基礎研究探索工作,偏基礎研究,朱文佳主要負責模型應用相關的工作,偏模型應用,兩個人都在 Seed 部門,都向梁汝波匯報。
不過,矽星人此前梳理 Seed 組織架構時發現,朱文佳既負責 Seed,同時分管 Flow(模型應用),現僅負責模型應用即便職級不變,但實際此次調整管理範圍收縮。
這一人事變動的時間點頗具深意。就在上周的内部全員會上,字節跳動 CEO 梁汝波剛剛反思了公司在 AI 領網域的短板,對重大技術的跟進速度不夠。
整個 2024 年,字節在應用層花費了大量功夫,在年末成功将豆包打造成了國内日活用戶最高的 AI 應用。但進入 2025 年,在經歷了 DeepSeek R1 的衝擊後,字節開始意識到僅靠產品創新和流量優勢,已不足以在 AI 時代保持領先。
" 字節過去一年看起來豆包衝的比較兇,但豆包只是一個代号,背後大模型上的投入也很大,最後結果是語音模型發展得最好,而視頻模型上和世界一流有一定差距,LLM 發展一般,特别是沒趕上 DeepSeek 這波,這應該是吳永輝加入的關鍵原因。" 一位知情者說道。
一切指向字節對其 AI 業務組織架構的重新梳理,由吳永輝帶領的 Seed 顯然将聚焦模型基礎研發,不再與應用等混合在一起。
第一位回到國内大廠的矽谷大模型明星科學家,花落字節
在加入字節跳動之前,吳永輝在谷歌工作了 17 年。據 Google Research 官網介紹,他于 2008 年 9 月加入谷歌,最初是一名搜索排名工程師,負責改進谷歌的核心搜索算法。2014 年,他轉向了當時方興未艾的深度學習領網域,加入 Google Brain 團隊,在 2023 年與 DeepMind 團隊合并之後,成為了 VP of Research,并被授予 "Google Fellow" 的稱号。
從研究領網域來看,吳永輝的成果涉及機器翻譯、語音技術和大語言模型等多個領網域。據谷歌學術顯示,2020 年以來,吳的論文引用超過了 4 萬次。
其最著名的研究是在機器翻譯領網域。2016 年,吳永輝參與的谷歌神經機器翻譯系統(GNMT)是一個行業技術發展的關鍵節點——該系統首次将端到端深度學習引入翻譯引擎,通過多層 LSTM 網絡結合注意力機制與殘差連接,使翻譯錯誤率較傳統短語系統降低 60%。
GNMT 背後,涉及到 RNN、LSTM、Seq2Seq、Attention 機制、 Beam Search、Encoder-Decoder 架構等模型,在發布之初,曾引起了語言服務市場上的一陣騷動,不僅讓漢英翻譯全面轉向神經網絡架構,更推動谷歌翻譯日均處理量突破 1800 萬條,而後谷歌翻譯開始用神經網絡翻譯提供 9 國語言的互譯。
在大模型的浪潮下,吳永輝另一個令人矚目的經歷是參與了 Gemini 系列模型的開發工作,包括 Gemini Family 和 Gemini 1.5,推動了模型在長上下文理解、跨模态推理等方面的突破。
在參與大模型基礎研究方面, 吳永輝還在 2022 年的《GLaM: Efficient Scaling of Language Models with Mixture-of-Expert》中提到通過稀疏專家網絡優化萬億參數模型訓練效率,相比傳統密集模型降低三分之二能耗,這項技術重塑了超大規模 AI 系統的工程範式。
在影像生成模型領網域,吳永輝則是參與開發了 CoCa 圖文基礎模型(2022 年,引用 1453 次)等數個圖文模型;在語音技術領網域,他參與開發的 Conformer 語音識别架構(2020 年,引用 3575 次)和 Tacotron 端到端語音合成系統(2017 年,引用 2595 次),主要聚焦于提升語音識别精度和簡化語音合成流程,并且在加入字節前的 2024 年到 2025 年,他的研究重點基本集中在語音方向,包括更自然的語音合成、端到端語音系統和多語言語音合成等項目。
可以說,在 17 年的谷歌生涯中,吳永輝積累了橫跨多個細分研究領網域的成果和經驗。即使在近兩年來國内外大模型人才戰十分密集,這樣一位從矽谷大模型大廠回國加入國内大模型大廠的明星科學家也并不多見。
回顧 2023 年以來,人才流動或在創業和大廠之間流動,或在國内、國外分隔流動,例如百度、阿裡、字節之間,谷歌、微軟、OpenAI 之間,這也意味着,此前對國外大廠的科學家而言,國内大廠的機會不夠有吸引力,以及國内大廠向海外挖人需要高昂的代價。也正是因此,此次吳永輝從谷歌加入字節,值得被視為一個新的節點。
字節 AI 大轉向,從應用層開拓到模型層探索
此前,此前的字節 AISeed 部門由朱文佳負責。朱文佳曾任百度搜索部主任架構師,2015 年加入字節跳動,負責算法工作,憑借在算法和搜索領網域的卓越能力,被譽為 " 頭條算法技術 Top 3",而後先後擔任今日頭條 CEO、TikTok 產品技術負責人,直到 2023 年,朱文佳開始組建字節跳動大模型團隊,探索搜索和廣告等業務應用,2024 年晉升為直接向 CEO 梁汝波匯報的核心負責人。
" 并不是說朱文佳做的不好,而是業務發展了 2 年,對字節這種保持變化活力的公司來說,有變動非常正常。" 一位知情者說道。
這或許與上周字節的内部全員會有關。在會上針對 AI 業務,字節 CEO 梁汝波反思了字節對技術浪潮的錯失,并提出 2025 年的重點目标,其一就是,追求 " 智能 " 上限,相比于追求某個具體產品——比如豆包的 DAU,把智能本身作為最重要的目标可以激發更多嘗試、不忽略關鍵技術節點。
不久前,字節還正式設立代号為 "Seed Edge" 的研究項目,核心目标是做比預訓練和大模型迭代更長期、更基礎的 AGI 前沿研究,項目員工考核周期放慢,過程指标考核也被放寬, 鼓勵探索更長周期、不确定的和大膽的課題。
将目标設為打破智能上限,意味着字節要繼續與世界一流的基礎大模型公司一較高低,颠覆了過去一年的 " 應用工廠 " 思路。而吳永輝的技術出身和經歷,更适合帶領字節 AI 探索基礎模型的未來。
這不是字節第一次反思自己錯過關鍵的技術節點。2024 年年初,梁汝波就在内部反思 " 公司變遲鈍了 ",忽視了以 Transformer 為核心的語言模型。于是,整個 2024 年," 效率至上 " 的字節都在瘋狂追趕進度。
一方面,在人才儲備上面,原谷歌 VideoPoet 的項目研究負責人、高級科學家蔣路、阿裡通義千問大模型技術負責人周暢、零一萬物原聯合創始人和預訓練負責人黃文灏等相繼加入字節等等;另一方面,在架構和產品上,在產品和模型層同時賽馬,向内部開放抖音的流量。
最終,字節成功地讓豆包 APP 從吊車尾上漲到國内日活躍用戶第一的 AI 產品。直到這個春節,DeepSeek R1 發布,在沒營銷的情況下,靠模型基礎技術的突破,輕描淡寫地将這一優勢打碎了。
去年下半年,國内開始了 o1 追逐賽之後,通義千問的 Qwen QwQ、階躍星辰的 R-mini,再到 DeepSeek R1 和 Kimi 1.5 都是推理模型,但字節一直沒有推出相應的推理模型,并且至今豆包也沒有接入 DeepSeek。至此,字節開始反思第二次錯過,全員會上,梁汝波反思說去年 9 月 OpenAI 發布長鏈思考模型,字節 " 沒有覺得要馬上復現出來 。"
這種對關鍵節點的錯失和延遲的追随,正在讓字節變得不夠 " 字節 "。畢竟,在互聯網時代,字節才是那把反應敏銳的創新尖刀。當下,所有人都在尋找 AI 時代的字節跳動,字節跳動自己似乎仍停留在互聯網模式裡。
此次找來谷歌 AI 核心人物,字節 AI 必然會重新梳理 AI 路線和方法。不單純地躺在流量王國之上,走在技術創新的前列,正如梁汝波所說," 做科技公司還不夠,得做創新科技公司,不僅要應用好新技術,還要能探索、發明新技術。"
但這對字節來說并不是一件容易的事。突破技術的邊界,和做最能洞察消費者的應用,是兩個邏輯。這需要字節一定程度上跳出既有方法論和慣性,首先或許就是,要有更明确的技術思路,而不是靠賽馬測試。