今天小编分享的互联网经验:那些年扎克伯格的错过与过错,欢迎阅读。
图片来源 @视觉中国
文 | 硅基研究室,作者 | 山核桃
2013 年,在美国内华达州的一个酒店舞厅里举办了一场私人聚会。几十名工程师、计算机科学家们围坐在一起,他们正在庆祝一个人工智能组织的成立。
" 这是一场天堂里的婚礼 "。说这话的人叫做杨立昆,除了「卷积神经网络之父」的称号,在这一年,他做了一个重要的决定,从实验室走进 Facebook,成为这家科技公司人工智能研究院 FAIR 的第一代领导者,由此开启了深度学习的浪潮。
但请注意这是 2013 年,当时科技行业的大多数人甚至都没有听说过深度学习,彼时的 Meta(在当时还是 Facebook)还是一家社交网络公司,人们天然地认为,它的使命不该是探究最前沿的技术,而是快速扩充规模。但扎克伯格没有这么做,他下定决心要押注最前沿的技术,比谷歌、微软等巨头们更快。
细数扎克伯格和他的 Meta,曾一度是 AI 界仅次于谷歌、微软的存在。不仅在深度学习浪潮早期就占尽人和,将杨立昆等明星科学家纳入麾下,同时也拥有最前瞻性的目光,扎克伯格甚至参与过 DeepMind 的竞购,从微软里抢走不少的人才。
十余年过去,在微软、OpenAI、谷歌等一众科技巨头的「AI 军备竞赛」中,Meta 沦为了第二梯队,但扎克伯格并不愿意承认这一点。在近期接受 The Verge 的访谈中,很久没有现身的扎克伯格对外宣布了 Meta 打造通用智能的野心,不仅公布了最新的大模型动态,还大秀算力储备,借 AI 之风,Meta 股价创历史新高,市值超过 1 万亿美元。
只是这一次,扎克伯格的 AGI 野心真的能实现吗?
Meta AI 前传:占尽天时、地利和人和
在 AI 浪潮中,曾经的 Meta 是可以和谷歌、微软掰手腕的存在。
这得益于扎克伯格自身的「野心」,也是「天时」。扎克伯格很早就决定加入谷歌、微软、苹果等巨头的战争,即便规模尚小,他渴望通过下一项变革性技术,成为领导者,因此当谷歌率先通过收购「深度学习之父」辛顿的初创公司进入深度学习领網域时,扎克伯格就意识到他也必须抵达那里。
2013 年,当杨立昆决定加入 Facebook,成为人工智能研究院的第一任主任前,这位学者向扎克伯格提了两个条件:一个是不会离开纽约大学,另一个则是坚持企业研究的「开放哲学」。
扎克伯格同意了这两个条件,某种程度上也为 Meta 在 AI 时代的领先位置奠定了基础。
「不会离开纽约大学」让 FAIR 始终致力于追赶最前沿的技术,充满着理想主义。据当时从谷歌跳槽到 FAIR 的根据实验室华人成员田渊栋介绍,FAIR 实验室不像谷歌那样条条框框很多,有各种各样的限制,相对非常自由,没有产品压力。" 我到了 Facebook 之后就好像回到了读博时的状态,特别有兴奋感,在工作上特别有动力,整个人就好像活过来了。"田渊栋说。
可以说,彼时规模尚小的 Facebook 并未有谷歌「大象难转身」的难题,FAIR 这种自由包容的研究氛围可以被视为是第一重「地利」,同时扎克伯格凭借 Facebook 牢牢掌握着流量入口,社交网络上的图片、视频、语音等种种多模态的数据,这是深度学习成长的沃土,这是第二重「地利」。
杨立昆所提出的另一个条件——企业研究的「开放哲学」则为 Meta 带来了「人和」。
杨立昆坚信「开放研究」,并以此为条件,让这种愿景变成了 Meta 的规范。" 因为如果你的研究秘密进行,你的研究质量会很差,你无法吸引最好的人才,你不会招募到有能力推动最先进技术发展的人。" 杨立昆曾这样说。
在这样的企业研究哲学下,Meta 不走封闭的 AI 路线,而是尽可能地对外开源研究代码、数据集和工具。一方面,取得了看得见的研究成果,直接推动了 AI 的进程,其中最典型的案例有两个。
一个是自监督和生成模型(Self-supervised learning and generative models)。SSL 一直都是 Meta 布局 AI 的重要方向。杨立昆曾将 SSL 视为「人工智能的暗物质」。他认为,区别于监督学习这种范式,SSL 可以利用大量未标记数据来扩大人工智能规模,这对于识别和理解世界更微妙、更不常见的表示模式很重要。2014 年,当 Ian Goodfellow 提出了 GANs 模型(生成对抗网络)时,科技巨头们先后跳上了研究 GANs 的彩车,连一向在 AI 上鲜少发声的苹果也在当时发布了一篇「如何更好地利用 GANs」的研究论文。
Meta 无疑走在前列,从 2015 年开始,Meta 就关注 GANs 的不同变体,让其从研究人员着迷的「玩具」变成可辅助人类生产的「工具」。
Meta 的科学家和工程师们认为,GANs 真正有趣的部分是它们对未来的意义,上图展示了可参与时尚单品的创作图源:Meta
2017 年,Facebook 联合罗格斯大学和查尔斯顿学院艺术史系,针对 GANs 提出了名为 CAN(创造性对抗网络),让 AI 绘画真正走入大众视野。据当时研究人员的测试,请观众去判断由 CAN 模型生成的 AI 艺术作品是人类艺术家的作品,还是人工智能的创作。结果,有 53% 的观众认为艺术作品出自人类,这也是历史上类似的图灵测试里首次突破半数。
另一个案例则是 AI 框架 PyTorch。作为时下流行的开源深度学习框架,PyTorch 被广泛应用于人工智能和机器学习领網域,其地位一度逼近谷歌的 TensorFlow。杨立昆曾说:" 当初谷歌的 TensorFlow 确实比 Torch 更火。然而 Meta 的 PyTorch 出现之后,现在其受欢迎程度已经超过 TensorFlow 了。"
而根据中信建投对 Github 上的项目数量、关注人数的对比,在 AI 工程领網域,Meta 工程领網域相关能力仅次于微软和谷歌。
这种「开放开源」更深远的影响就是吸引了众多顶尖人才的加入。深度学习发展的历史,就是一部科技巨头的抢人史。彼时的 FAIR 可以被视为深度学习「研究与工程」的人才库。有 ResNet 网络的发明人何恺明、VC 维和 SVM 的缔造者 Vladimir Vapnik、提出随机梯度下降法理论的 L é on Bottou 等。
天时、地利、人和,Meta 似乎具备成为 AI 时代的霸主的因素,那么究竟为什么,Meta 和扎克伯格会错过这次浪潮呢?
FAIR 的两次重组:Meta 错过的时代
2014 年,扎克伯格开启了自己的「亚洲行」,到访中国时,在清华大学经管学院舜德楼内,用中文演讲的扎克伯格阐述了当时十岁的Facebook 在「下一个十年」的三个方向:连接整个世界、发展人工智能、虚拟现实。
" 第一,我们想要连接整个世界,所以我们要帮助所有人用互联网,第二,我们想要发展人工智能,第三是所有人用手机以后,我相信下个平台是虚拟现实(virtual reality),Oculus 是第一产品,我们希望还有别的很多产品。"
三大方向对应当时 Facebook 最重要三个业务板块:连接,即对应来自社交媒体平台所创造的收入。VR,也就是扎克伯格所坚信的「下一代互联网」,也是后来他口中的「元宇宙」。而人工智能,既是彼时扎克伯格对外展示的野心,也同样可视为支撑其他业务的重要技术组件。
扎克伯格曾在说服杨立昆加入时,向这位学者描述过自己的愿景——未来,社交网络上的互动变成独立完成任务的技术驱动,在短期内,这些技术将识别照片中的人脸,识别语音指令,并在不同的语言之间进行翻译。从长远来看,智能体或机器人将巡视 Facebook 的数字世界,接受指令,并根据需要执行指令。
当杨立昆问 Facebook 是否有任何不感兴趣的人工智能研究领網域时,扎克伯格说:" 可能是机器人学。" 但其他一切——数字领網域的一切——都在扎克伯格兴趣范围之内。
按照这样的战略逻辑,依靠领先的技术、社交网络规模化的收入以及 VR 作为硬體载体,Facebook 理应走出一条更顺畅的发展道路。但事实上,谁也难以预料技术的发展与周期变化,扎克伯格与他的 Facebook 也毫不例外。
理解 Meta 为何没有成为当下最热门的 AI 企业,FAIR 的两次重组是一个很好的观察視窗。
在 2018 年之前,FAIR 实验室主要负责学术研究,另一个被称为应用机器学习部门(下文简称:AML)则是负责产品团队成果的转化,双方互不干涉,相对比较独立。一个强调最前沿的技术,另一个则是注重转化,因此如何强调团队之间的协作,成为了关键。但好在,尽管工作方式不同,但两个团队的共识都是一致的,比如强调开放,因此上述问题还并没有显露。
转折的点发生在 2018 年,FAIR 的第一次重组。
2018 年,杨立昆宣布卸任 FAIR 的职位,转任首席 AI 科学家一职,接任杨立昆的是当时 AML 的领导者 J é r me Pesenti。这次调动不同的点在于,削弱了 FAIR 的独立性,Pesenti 同时拥有 FAIR 和 AML 两个部门的话语权。杨立昆在一次采访中这样评价这次变动:「AML 和 FAIR 向 CTO 汇报,随着 AI 重要性、围绕深度学习建立更多系统重要性的提升,CTO 再也不用担心了。」
杨立昆的「言外之意」其实有二:一是 FAIR 正在去集中化,这意味着未来将更多为产品和业务服务。二是在当时 Facebook 陷入到了严重的监管,CTO 必须要用技术解决公众的信任危机,因此 FAIR 加大了在识别型 AI 的投入,以促进人工智能的公平、透明和可解释性。
第二次重组则发生在 2022 年 6 月,Meta 再次宣布 FAIR 重组调整,明确提出 AI 部门不再「集中化研究」,而是分布式的下放到每个组织部门中去。这项改动加速 AI 技术在 Meta 实际业务中的应用,而被引入到不同产品组的业务部被称为「AI 创新中心」。其中,FAIR 也将成为 Reality Labs Research 旗下部门,就在一年前,Facebook 正式改名为 Meta。
科技公司的组织变动非常常见,毕竟技术的变化太快了。但不同于微软、苹果等科技公司,FAIR 之于 Meta,两次重组的不同点有二:
一是 AI 都是「救急」,而非创新。无论是用以服务社交媒体,识别与解决假新闻等问题,还是应对不成熟的 VR 业务,FAIR 本身聚焦前沿技术的创新被大大稀释了。
二是缺乏战略的稳定性。「拥抱变化」尽管是科技公司经常挂在嘴边的一句话,但参考微软、苹果的经验,总有一个稳定长期的「主线」。例如,苹果尽管市场被吐槽「挤牙膏创新」,但在围绕 C 端的软硬體迭代上始终放大自己的生态、供应链等核心优势。
至此,如果回头看看十年前扎克伯格给自己留的三个方向:连接整个世界、发展人工智能、虚拟现实,似乎三个都没有助力其成为 TOP1。
重新变酷的 Meta,不愿再走老路
" 我们可以发现的一点是说,Meta 又变酷了。" 曾在 Meta 担任 AI 架构总监,如今创业的贾扬清如此评价 Meta 的新变化。
在由 chatGPT 所开启的生成式 AI 浪潮中,之所以说 Meta「重新变酷」的关键有二:一是区别于 OpenAI 等巨头的闭源路线,Meta 加入战场的姿态是「开源」。
从 LLaMA 系列开始,Meta 相继开源了一系列的模型,包括视觉领網域的 SAM 和 DINOv2、音频领網域的 AudioCraft 系列模型、多模态大模型 ImageBind 等。而据扎克伯格的最新透露,Meta 正在训练 Llama 3,且该模型具备更强的代码生成能力。
而由 LLaMA 所引发的「开源和闭源」之间的讨论已足以证明了 Meta 的变化。杨立昆曾这样形容开源社区与闭源模型在生成式 AI 上的发展。" 开源人工智能模型正走在超越专有模型的路上 "。
第二个「重新变酷」的原因则是扎克伯格态度的转变。区别于过去对增长的迷恋以及混乱的 AI 策略,无论是与微软合作,还是宣布对开源大模型的押注,Meta 的 AI 策略逐步从分散走向整合。具体来说,一是延续开源路线,加大 AI 生态的繁荣,这既符合对 FAIR 当初的承诺,也有利于在开发者和公众间,改善 Meta 的形象。二是借助 AI 更快抵达元宇宙,一方面利用 AI 降低开发门槛,另一方面,发挥应用优势,更好地优化体验。
据「硅基研究室」梳理,区别于谷歌、亚马逊等巨头,Meta 的 AI 能力主要集中在 C 端和视觉,包括影像识别和目标检测、影像生成、增强现实(AR)和虚拟现实(VR)、人脸识别和人脸相关技术以及社交网络数据处理和隐私保护。这些技术储备在生成式 AI 时代具备先发优势。
可以肯定的是,扎克伯格和他的 Meta 都不愿重走过去的老路,曾经的 AI 王者是否能够再度翻身,这是时代交给扎克伯格的新命题了,毕竟 Meta 所面临的挑战还有很多。
首先,是老生常谈的 Reality Labs 的盈利问题。从 Meta 去年第三季度财报状况来看,广告业务强势复苏,但 VR/AR 业务持续亏损。去年 9 月,Meta 发布了首款消费级 MR 头显 Quest 3,据天风国际证券分析师郭明錤的分析,Quest 3 头显销量将明显少于最初的预期。据机构 IDC 的估计,2023 年 AR/VR 头显的出货量为 810 万台,同比下降 8.3%,尽管有苹 Vision pro 的热度加持,但市场回暖依旧需要一定的时间。
其次,即便不走过去的老路,AI 战略已逐渐连贯,但比起微软、OpenAI 等巨头,Meta 想做的还是太多了。如「互联网怪盗团」的评价,当所有科技巨头都在集中投入 AI 这一个「研发焦点」时,Meta 却必须将资源分散在两个「研发焦点」,这不可避免地要面临资源和精力的分配问题。
时间拨回 2012 年,彼时 Facebook 尚未改名,面对当时股价的低迷、移动化战略的失误,扎克伯格回应道:" 我能承受人们的低估,因为我宁愿被低估,这样才能真正让他们刮目相看。" 如今在这场关于 AI 的新战事中,扎克伯格回到了原点,他和 Meta 都急需一场胜仗。
参考资料:
1、福布斯:杨立昆希望用开源战胜 OpenAI?
2、甲子光年:三次误判后,扎克伯格这次终于做对了
3、远川研究所:差一步称霸 AI:历史进程中的扎克伯格
4、互联网怪盗团:Meta 的逆袭:扎克伯格到底做对了什么?
5、深度学习革命,凯德 · 梅茨