今天小编分享的互联网经验:字节AI部门Seed定位调整,从Gemini加盟的吴永辉将成新负责人,欢迎阅读。
面对 DeepSeek 给模型技术及应用模式带来的新冲击和挑战,字节的调整比以往更加迅速到来。
多位接近字节的人士对硅星人透露,字节的 AI 核心部门 Seed 正在快速调整定位和调兵遣将。刚刚从谷歌加入字节跳动的 AI 大牛、参与了 Gemini 开发的 Google Fellow 吴永辉博士,将成为 Seed 新的负责人,替换原 LLM 团队及 Seed 总负责人朱文佳,团队内部正在梳理调整汇报关系。
对此,硅星人向字节跳动求证,对方称:吴永辉博士主要负责 AI 基础研究探索工作,偏基础研究,朱文佳主要负责模型应用相关的工作,偏模型应用,两个人都在 Seed 部门,都向梁汝波汇报。
不过,硅星人此前梳理 Seed 组织架构时发现,朱文佳既负责 Seed,同时分管 Flow(模型应用),现仅负责模型应用即便职级不变,但实际此次调整管理范围收缩。
这一人事变动的时间点颇具深意。就在上周的内部全员会上,字节跳动 CEO 梁汝波刚刚反思了公司在 AI 领網域的短板,对重大技术的跟进速度不够。
整个 2024 年,字节在应用层花费了大量功夫,在年末成功将豆包打造成了国内日活用户最高的 AI 应用。但进入 2025 年,在经历了 DeepSeek R1 的冲击后,字节开始意识到仅靠产品创新和流量优势,已不足以在 AI 时代保持领先。
" 字节过去一年看起来豆包冲的比较凶,但豆包只是一个代号,背后大模型上的投入也很大,最后结果是语音模型发展得最好,而视频模型上和世界一流有一定差距,LLM 发展一般,特别是没赶上 DeepSeek 这波,这应该是吴永辉加入的关键原因。" 一位知情者说道。
一切指向字节对其 AI 业务组织架构的重新梳理,由吴永辉带领的 Seed 显然将聚焦模型基础研发,不再与应用等混合在一起。
第一位回到国内大厂的硅谷大模型明星科学家,花落字节
在加入字节跳动之前,吴永辉在谷歌工作了 17 年。据 Google Research 官网介绍,他于 2008 年 9 月加入谷歌,最初是一名搜索排名工程师,负责改进谷歌的核心搜索算法。2014 年,他转向了当时方兴未艾的深度学习领網域,加入 Google Brain 团队,在 2023 年与 DeepMind 团队合并之后,成为了 VP of Research,并被授予 "Google Fellow" 的称号。
从研究领網域来看,吴永辉的成果涉及机器翻译、语音技术和大语言模型等多个领網域。据谷歌学术显示,2020 年以来,吴的论文引用超过了 4 万次。
其最著名的研究是在机器翻译领網域。2016 年,吴永辉参与的谷歌神经机器翻译系统(GNMT)是一个行业技术发展的关键节点——该系统首次将端到端深度学习引入翻译引擎,通过多层 LSTM 网络结合注意力机制与残差连接,使翻译错误率较传统短语系统降低 60%。
GNMT 背后,涉及到 RNN、LSTM、Seq2Seq、Attention 机制、 Beam Search、Encoder-Decoder 架构等模型,在发布之初,曾引起了语言服务市场上的一阵骚动,不仅让汉英翻译全面转向神经网络架构,更推动谷歌翻译日均处理量突破 1800 万条,而后谷歌翻译开始用神经网络翻译提供 9 国语言的互译。
在大模型的浪潮下,吴永辉另一个令人瞩目的经历是参与了 Gemini 系列模型的开发工作,包括 Gemini Family 和 Gemini 1.5,推动了模型在长上下文理解、跨模态推理等方面的突破。
在参与大模型基础研究方面, 吴永辉还在 2022 年的《GLaM: Efficient Scaling of Language Models with Mixture-of-Expert》中提到通过稀疏专家网络优化万亿参数模型训练效率,相比传统密集模型降低三分之二能耗,这项技术重塑了超大规模 AI 系统的工程范式。
在影像生成模型领網域,吴永辉则是参与开发了 CoCa 图文基础模型(2022 年,引用 1453 次)等数个图文模型;在语音技术领網域,他参与开发的 Conformer 语音识别架构(2020 年,引用 3575 次)和 Tacotron 端到端语音合成系统(2017 年,引用 2595 次),主要聚焦于提升语音识别精度和简化语音合成流程,并且在加入字节前的 2024 年到 2025 年,他的研究重点基本集中在语音方向,包括更自然的语音合成、端到端语音系统和多语言语音合成等项目。
可以说,在 17 年的谷歌生涯中,吴永辉积累了横跨多个细分研究领網域的成果和经验。即使在近两年来国内外大模型人才战十分密集,这样一位从硅谷大模型大厂回国加入国内大模型大厂的明星科学家也并不多见。
回顾 2023 年以来,人才流动或在创业和大厂之间流动,或在国内、国外分隔流动,例如百度、阿里、字节之间,谷歌、微软、OpenAI 之间,这也意味着,此前对国外大厂的科学家而言,国内大厂的机会不够有吸引力,以及国内大厂向海外挖人需要高昂的代价。也正是因此,此次吴永辉从谷歌加入字节,值得被视为一个新的节点。
字节 AI 大转向,从应用层开拓到模型层探索
此前,此前的字节 AISeed 部门由朱文佳负责。朱文佳曾任百度搜索部主任架构师,2015 年加入字节跳动,负责算法工作,凭借在算法和搜索领網域的卓越能力,被誉为 " 头条算法技术 Top 3",而后先后担任今日头条 CEO、TikTok 产品技术负责人,直到 2023 年,朱文佳开始组建字节跳动大模型团队,探索搜索和广告等业务应用,2024 年晋升为直接向 CEO 梁汝波汇报的核心负责人。
" 并不是说朱文佳做的不好,而是业务发展了 2 年,对字节这种保持变化活力的公司来说,有变动非常正常。" 一位知情者说道。
这或许与上周字节的内部全员会有关。在会上针对 AI 业务,字节 CEO 梁汝波反思了字节对技术浪潮的错失,并提出 2025 年的重点目标,其一就是,追求 " 智能 " 上限,相比于追求某个具体产品——比如豆包的 DAU,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点。
不久前,字节还正式设立代号为 "Seed Edge" 的研究项目,核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究,项目员工考核周期放慢,过程指标考核也被放宽, 鼓励探索更长周期、不确定的和大胆的课题。
将目标设为打破智能上限,意味着字节要继续与世界一流的基础大模型公司一较高低,颠覆了过去一年的 " 应用工厂 " 思路。而吴永辉的技术出身和经历,更适合带领字节 AI 探索基础模型的未来。
这不是字节第一次反思自己错过关键的技术节点。2024 年年初,梁汝波就在内部反思 " 公司变迟钝了 ",忽视了以 Transformer 为核心的语言模型。于是,整个 2024 年," 效率至上 " 的字节都在疯狂追赶进度。
一方面,在人才储备上面,原谷歌 VideoPoet 的项目研究负责人、高级科学家蒋路、阿里通义千问大模型技术负责人周畅、零一万物原联合创始人和预训练负责人黄文灏等相继加入字节等等;另一方面,在架构和产品上,在产品和模型层同时赛马,向内部开放抖音的流量。
最终,字节成功地让豆包 APP 从吊车尾上涨到国内日活跃用户第一的 AI 产品。直到这个春节,DeepSeek R1 发布,在没营销的情况下,靠模型基础技术的突破,轻描淡写地将这一优势打碎了。
去年下半年,国内开始了 o1 追逐赛之后,通义千问的 Qwen QwQ、阶跃星辰的 R-mini,再到 DeepSeek R1 和 Kimi 1.5 都是推理模型,但字节一直没有推出相应的推理模型,并且至今豆包也没有接入 DeepSeek。至此,字节开始反思第二次错过,全员会上,梁汝波反思说去年 9 月 OpenAI 发布长链思考模型,字节 " 没有觉得要马上复现出来 。"
这种对关键节点的错失和延迟的追随,正在让字节变得不够 " 字节 "。毕竟,在互联网时代,字节才是那把反应敏锐的创新尖刀。当下,所有人都在寻找 AI 时代的字节跳动,字节跳动自己似乎仍停留在互联网模式里。
此次找来谷歌 AI 核心人物,字节 AI 必然会重新梳理 AI 路线和方法。不单纯地躺在流量王国之上,走在技术创新的前列,正如梁汝波所说," 做科技公司还不够,得做创新科技公司,不仅要应用好新技术,还要能探索、发明新技术。"
但这对字节来说并不是一件容易的事。突破技术的边界,和做最能洞察消费者的应用,是两个逻辑。这需要字节一定程度上跳出既有方法论和惯性,首先或许就是,要有更明确的技术思路,而不是靠赛马测试。