今天小编分享的科技经验:夹缝中的英伟达中国,欢迎阅读。
作者 | 杨逍
编辑 | 苏建勋 杨轩
穿着大花袄,转着红手绢,入乡随俗的英伟达 CEO 黄仁勋脱下他标志性的黑色皮衣,在全体上海员工的哄闹中,跳起了东北大秧歌。这是时隔 4 年,黄仁勋再度光临英伟达中国年会。
在英伟达内部,黄仁勋此次 " 访华 " 是高度机密," 当主持人说有请我们最亲密的家人后,很多人都在猜测是谁 ", 英伟达内部员工告诉 36 氪," 直到老黄出现,全场沸腾,完全没想到他会来。"
黄仁勋在年会上扭秧歌(来自网络截图)
英伟达的员工大多视黄仁勋为偶像。他的到来将年会气氛推向顶点,也给英伟达中国员工和合作伙伴吃了一颗定心丸。5 天时间,他连赶了 3 场年会。
美国的芯片禁令,让这家芯片巨头过去一年,在中国市场举步维艰,黄仁勋 2023 年 6 月原定的访问中国大陆的行程取消后,甚至有员工在视频会上问道:" 你还能来中国吗?"
但黄仁勋的意外光临,打消了员工的疑虑,也在这个充满寒意的冬天,向整个英伟达中国员工传递出了积极的信号。
英伟达无疑是 2023 年全球最受瞩目的公司。大模型火爆带来的芯片需求激增,让它在这年赚得盆满钵满,前三个季度总营收达到 388 亿美元,同比增长 85.5%。
英伟达股价更是水涨船高,一年时间翻了 3 倍,截止 2024 年 2 月 2 日收盘,英伟达股价已突破 660 美元 / 股,有望成为又一家突破 2 万亿美元市值的科技巨头。
英伟达员工 " 靠股票致富 " 一度成为行业热闻,令人艳羡。但在中国,英伟达所面临的局面却颇为尴尬。
显卡两次被禁售,一度让英伟达在中国几乎无货可卖,业绩遭遇了巨大下滑。公司新改良的 PCIe L20(面向中国市场的用于 AI 推理特供版 GPU,以下简称 "L20"),在大模型训练市场销售艰难。
黄仁勋访华后仅 10 天,市场上便立刻传出 HGX H20(面向中国市场的用于 AI 训练特供版 GPU,以下简称 "H20")的消息。但 H20 仅面向大客户开启预定,至少等到 2024 年下半年才能到货。接近英伟达的人告诉 36 氪,销售们都表示中国市场四季度 " 废 " 了。
英伟达主要通过代理商出货,其官方合作伙伴的员工管业曾私下透露," 第一次被禁后,我们冲了一波业绩,但第二波被禁后,英伟达几乎全系列数据中心的卡全部砍了,我们每天问老板,可以卖什么?"
无事可做,也让英伟达部分员工,尤其销售和客户服务相关部门产生了巨大的隐忧。部分企业端的销售开始卖起了軟體和 InfiniBand 网络产品(用于伺服器间互联的通信产品,以下简称 IB 网络),但这聊胜于无。
核心产品两次被禁后,一次视频会议上,英伟达中国员工向黄仁勋发问," 你会裁员吗?"
这是夹缝中的英伟达中国员工最真实的情绪反应,他们担心自己的前途,尽管黄仁勋一再强调 " 不会裁员 ",但当时代的重锤落下,英伟达中国就如同两个大洲板块碰撞下的边界,除了承受挤压,别无他法。
" 无卡可卖 " 的 2 个月
在英伟达生态圈多年,管业(化名)从未经历过如此艰难的时刻。
2023 年 10 月底,美国对中国发起了第二次 AI 芯片出口管制,除了此前已被禁的 A100 和 H800,专为中国市场推出的改良版芯片 A800、H800 芯片被列入名单,就连消费领網域的 4090 卡也成为牺牲品。
这让作为英伟达合作伙伴的管业感受到了一丝绝望。因为只卖英伟达产品,管业所在公司的一切业绩都系英伟达之上。
可如今英伟达企业端根本没卡可卖,"当时嫌弃 A800 难卖, 现在我们每天都得问老板,还能卖什么", 管业感慨道。
一时之间,整个产业哀鸿遍野。在当下最火热的大模型训练市场,英伟达的伺服器是最重要和几乎唯一的算力武器。买不到英伟达,就意味着没法训练大模型,在这场百模大战中失去先机。
为了缩小损失,第二次禁令到来后,英伟达内部立刻行动起来,更改符合规定的产品。
" 大家几乎一夜之间从床上爬起,把产品重新翻新一遍,軟體、硬體部门忙着重新配置 GPU,后端忙着对硬體进行稳定性测试,完全是新品发布会前最忙的节奏。" 一位英伟达员工回忆道。
不到 2 个月时间,英伟达便迅速推出了面向中国游戏市场的特供版本 4090D,补上了市场的空缺。
英伟达 4090D 显卡 (来自淘宝截图)
比起游戏业务,数据中心业务的路无疑难了很多。被禁一个月后,产业便出传英伟达会为中国市场再推出三款改良版的企业端 GPU 芯片—— HGX H20、L20 PCle 和 L2 PCle 的消息。
具有推理功能的 L20 PCle 卡迅速在市场上推出,但能用于大模型训练的 H20,直到黄仁勋访华 10 天后的 1 月 29 日,才在市场上开始预定,但仅有大客户具有预定资格。
A800、H800 被禁后的 2 个多月里,多位从业者告诉 36 氪,英伟达中国市场几乎所有数据中心显卡都被禁,目前能卖的 GPU 只有 L20。
这是一款推理芯片,它的显存容量和访存带宽与被禁的 L40S 几乎没有差异,价格还便宜了一半,很适合用在 AI 的搜索、推荐等模型。接近英伟达的人士林琼称,第一批 L20 到货后很快就被字节、百度、腾讯等大厂分完了。
只要不用在大模型推理市场,L20 就有着极高的性价比。可当英伟达中国不得不用它打大模型市场时,一切就变得艰难。
" 我们做了很多测试来证明 L20 可以用于训练,但客户根本不买单 ",英伟达内部员工冯元夏满怀无奈。
英伟达的员工很少会遇到如此艰难的时刻。这家芯片巨头一手发明了 GPU 产品,质量又向来过硬,员工销售时一向底气十足,很少有心里发虚和郁闷的经历," 明明是豪华车,却不得不跑在经济车赛道 ",一位英伟达员工颇为无奈。
"A800、H800 至少还能用,L20 的性价比实在太低了。" 一位对芯片需求较为了解的算力供应商周毅明告诉 36 氪。就连头疼卖什么的管业也表示:" 见客户根本不说这个,没意义,他们只关心算力。"
除了算力性能不达标,L20 卡推荐的是 4 卡机的方案,一台伺服器只能放 4 张卡,这意味着要达到同等算力,它需要更多的机柜、更多的电和更多的场地,运营成本会更高。
管业苦笑,英伟达销售说这些成本用买卡省下来的钱就都抵消回来,不过是没东西可卖、不得已而为之的说法。
黄仁勋访华后才姗姗来迟的 H20 显卡,虽具有大模型训练功能,但现在完全没货,最早可能要 6 月份才能交付客户。" 产能有限,肯定是生产最赚钱的产品 ", 接近英伟达的人士林琼感慨。
无奈之下,中国的客户们开始了另一种选择——购买非官方渠道的英伟达 GPU。
周毅明告诉 36 氪,在第二次禁售之前,国内客户都还老老实实购买为中国市场准备的 A800、H800,但二次禁令后,大家索性放开了,直接购买 H100 产品。
" 很多公司跑到海外,向国内卖英伟达 GPU,每个月通过不同渠道都有 H100 进入中国。"
微信群里售卖英伟达伺服器的消息(作者截图)
买不到货的客户也开始考虑起在海外建立数据中心,解决买卡难问题。AI 领網域从业者金杰表示," 很多人找我询问,有没有在海外建数据中心的合作伙伴资源。有大规模训练需求的公司可能不敢出海训练,但零散训练需求的企业,还是愿意试水。"
办法总比困难多,但无论是在海外购买的英伟达 GPU,还是可能从中国走出去的数据中心客户,其业绩都将不再属于英伟达中国。
英伟达中国能做什么?
面对这种被动场景,英伟达中国能做的却十分有限。
最直接的,在何时推出、推出何种合规 GPU 这件事上,英伟达中国没有任何话语权,只能被动等待与美国总部的沟通。原本英伟达计划 H20 与 L20 一同在 11 月发布,但由于美国政府的限制,英伟达不得不调整计划,将 H20 的发布时间推迟。
哪怕不是这一特殊事件,英伟达中国的自主权和决策权也相对较弱,这从它的组织架构便可窥见。AMD 有大中华区总裁,英特尔和高通有中国区董事长,但英伟达中国没有一个能代表中国区与美国总部进行沟通的总负责人。
严格意义上,英伟达中国并非独立闭环的组织,它的各个业务是总部各职能部门的延伸,每个业务都向总部职能线负责人汇报,一个仅十几个人的小团队也不例外。如果将各职能部门都视作八爪鱼的一脚,英伟达中国则更像是每个脚上的触须。
在这种架构下,英伟达中国更多承担的是执行功能,不具有决策权。一位英伟达中国早期员工告诉 36 氪,"很多事情都是有结果了才会通知中国,决策正确与否,全靠总部想明白。"
以商务为例,哪怕中国大陆已占到英伟达营收的 20% 左右,是其全球第二大市场,英伟达中国也没有一个商务总负责人,其消费业务和企业卡业务等条线销售负责人,都要汇报给亚太区的副总裁。换句话说,在中国,商务条线的高管只在业务负责人级别。
因为业务需求的暴增,英伟达北京办公室的员工相比 2021 年的约 230 人扩张了一倍,这其中很大一部分是销售和解决方案团队等前端员工。
" 但在申请扩招时,英伟达总部很难理解,为什么需要这么多人?" 英伟达内部员工很苦恼。销售们也经常在沟通中自嘲,自己在公司没有价值。
此外,商务在日常工作中的自主权也有限。英伟达的产品是统一定价,商务不能对产品打折,甚至他们在签单时也不能保证到货期,也只能向总部申请货源。
这种自主权缺失的问题,在市场营销等部门同样常见。
有英伟达前员工抱怨," 有时候想做一点本土化营销的东西,如微博营销、节庆等,总部并不认同。他们所做的亚马逊电商活动又不符合国内閱聽人胃口。" 尽管很多国外巨头在中国区都存在类似的问题,但英伟达无疑是其中对权限收缩较紧的。
" 其实这就是一家硬體公司,市场、销售这些都是锦上添花,重要的还是产品够好或者够便宜。" 一位英伟达前员工告诉 36 氪。
与市场、商务等业务相比,研发是这家公司的人才核心。英伟达中国曾被寄予厚望,总部一度将重要的芯片放在中国研发。
上海团队成立不到 5 年时,英伟达正研究全球第一款 40nm GPU 芯片,当时便将数字后端工作交给了中国团队。这也是英伟达在 40nm 制程的第一颗芯片,有着特殊性。不过这款芯片的研发并不顺利,当时台积电 40nm 工艺难产影响了芯片研发进程,就连已退休的张忠谋也不得不回到公司解决工艺问题。
" 但总部给了机会,这件事在英特尔、AMD 是不可能发生的。" 莫风鸣表示。
英伟达愿意给中国团队机会,但在海外法律等限制因素影响下,总部不得不思考哪些业务可以放在中国,英伟达中国也很难参与 GPU 最核心的架构设计和研发,这也让部分员工因 " 只能做边缘工作 "、" 只能当螺丝钉 " 等原因离职。
据莫风鸣介绍,英伟达中国部分员工曾有机会参与高端 CPU 的研发,但被美国政府关注到后该业务作废,重新收回美国总部。
发展到最后," 前端越靠前的越在美国,我们参与后端。" 莫风鸣表示。
如今,英伟达上海的后端团队也是英伟达最大的后端设计团队,几乎英伟达每一款芯片等流片都需要中国后端测试、验证团队的参与。英伟达中国也有一些独特性的业务职能,在总部退出视频编解码业务后,英伟达中国成为公司内部唯一拥有完整编解码人员配置的团队。
何去何从?
两次产品被禁,英伟达中国的员工都问了黄仁勋同一个问题," 你会裁员吗 ?"
英伟达的产品不在中国生产,卡全靠进口。一位内部员工担忧道," 如果哪天老黄舍得放弃中国市场,当场关闭,就什么也没有了。" 在代理商看来,英伟达减少部分员工也并不影响其运转," 他们即使只做大客户的生意,也有很大订单。"
在 2023 年,裁员一直是科技大厂避不掉的话题,AMD 、英特尔、高通、德州仪器等公司接连裁员。如 AMD 对 RTG 部门,即负责 GPU 的设计开发的团队进行优化;德州仪器则裁撤了中国区 MCU 研发团队,将 MCU 产品线迁往印度。有 " 英国英伟达 " 之称的人工智能 ( AI ) 芯片独角兽 Graphcore,也裁减了大部分中国员工,退出中国。
面对如此复杂的局面,黄仁勋给出的答复却是 " 不会 ",且表示公司仍将扩招。
他的态度罕见地鲜明、直接。对比 2018 年美国总部问是否会裁员时,当时黄仁勋并未给出直接答复,只是举例不会轻易裁员,2008 年金融危机时也是通过全员降薪度过的危机。
这的确安抚了人心,尤其是研发人员。一位英伟达的研发告诉 36 氪,禁令后大家很担忧裁员," 但现在安全感挺高,老黄在公司说话非常有分量。" 研发所从事的产品软硬體开发,通常以项目制为周期,其工作目标不以业绩为导向,产品面向全球,所受影响其实相对较小。
最焦虑的是与客户接触最多的销售员工。" 他们只有打底层开发的軟體工程师不会担忧,像商务和 SA 都非常焦虑。" 管业告诉 36 氪。
SA 是英伟达与商务配合的部门,帮忙推广产品、测试产品性能等。" 他们的工作和本地客户联系非常紧密,如果没有芯片可卖,工作会受到影响。" 一位英伟达内部员工告诉 36 氪。有的销售员工则担心 " 明年我还在不在都是问题 "。但没人知道答案。
禁售后,原本 " 事无巨细,半小时没回复客户消息就会投诉你 " 的英伟达商务们,陷入了迷茫。当代理商询问产品消息、情况,得到的都是 " 不要问我 "、" 等官方回复 "、" 问我们市场同事 " 的回答。
在此之前,他们完全是另一个状态——每天行程安排很满," 哪怕干到夜里 3 点,第二天早上照样 8 点起来、回复工作消息。"
这种焦虑的情绪,在可用于训练市场的 H20 卡开启预定后,得到了一定的缓解。
1 月 29 日,黄仁勋访华 10 天后,新华三宣布将为东方国信首批提供 H20 GPU 系列算力伺服器。这是首个关于 H20 预定的消息,也意味着,在不远的将来会有更多中国客户可以订购到 H20。
不过,H20 在算力上还是进行了压缩。H20 的峰值算力仅英伟达 H100 的 15%,但显存带宽维持不变。
" 老黄非常想保住中国市场,每生产一块 H20,就意味着少生产一块 H100。H20 的价格相比 H100 非常有诚意,现在可以说是赔钱保市场。" 一位英伟达的员工表示。
市场对 H20 的态度还算积极。一位行业人士告诉 36 氪,此前大家对于 H20 的预期就很低,但这个卡价格上划算,相较国产芯片重新适配 CUDA 生态和做无数次的大规模测试,H20 的成本是可控的。
不过即使能买到,禁令和合规也会像达摩克利斯之剑一样垂在英伟达中国和国产厂商的头上。"合规卡的生命可能在 18 个月左右,之后会被新的合规卡取代",上述行业人士表示。
两年两禁,也彻底打破了国内客户的幻想。接近需求端的从业人士宫浩满怀不满和无奈,"今日割 5 城,明日割 10 城,总不能别人限制什么我们用什么 "。如今,客户纷纷开始尝试国产 GPU 产品," 哪怕不好用也要用起来 "。
更换国产 GPU 是一件成本很高的事情,CUDA 生态是英伟达强大的壁垒,企业和 GPU 公司驻场团队要磨合至少半年,开发算子和打磨产品都需要时间。如今,有国产 GPU 公司已经开始与互联网大厂合作,为其写算子库,让 GPU 显卡能变得好用起来。
随着市场转向,国产 GPU 卡的租赁和购买价格也水涨船高。AI 领網域从业者金杰告诉 36 氪,华为 GPU 卡的算力租赁价格已经跟 A100、A800 相差不大。
为了抢夺可能失去的市场,一位接近英伟达销售的合作伙伴透露,H20 的降价可能会很快到来,这在之前的英伟达,是很少出现的情况。
除了在风雨中飘摇着的 GPU 卡,如今,商务们也正努力寻找新故事和潜在用户。为了寻求自救,英伟达商务也开始宣传起了 IB 网络和 SDK 等軟體。
网络传输能力是英伟达的一大技术优势,英伟达如今将 IB 网络拿出来单独售卖。网络传输有以太和 IB 组网两种产品,在做大模型训练时,采用 IB 组网能有更快的数据传输效果。但大部分客户,都倾向于采用以太网络。英伟达这项业务的营收非常少," 九牛一毛 ",很难养起一家公司。
除了 IB 网络,軟體产品也是英伟达的商务们今年发力的重点方向。
售卖軟體是英伟达的一项新业务。2022 年英伟达第一次被禁前后,英伟达开始将軟體产品作为一项独立产品售卖,到 2023 年 8 月左右,英伟达还对軟體产品进行了调价。
接近英伟达的人士告诉 36 氪,2023 年英伟达的合作伙伴做了很多小型峰会来推广軟體产品。如具有在线协同工作功能的 NVIDIA Omniverse 等。不过由于售价太高,推起来难度也较大。
现有市场之外,英伟达中国也开始找寻新的发展方向——自动驾驶。
这是英伟达投入已久的潜力业务,英伟达的自动驾驶芯片 Orin 一直声名响亮,在高端智能驾驶市场几乎独占鳌头,但其整体解决方案一直在业内被人诟病。此次在中国部署的自动驾驶团队,主要就是从事量产及解决方案业务。
2023 年 12 月,加入英伟达不足 4 个月的吴新宙,火速带着数个部门 VP 回国,加速自动驾驶业务招聘事宜。如今其招聘已取得初步成果, 2 个月时间,英伟达便招募了超 100 名员工。
一位猎头告诉 36 氪,他们的招人策略也从以往的看综合素质,到要求快速进人,补齐团队空缺,更具体的是具有量产服务经验、能打仗的团队,很多团队为了进人甚至放宽了对英语的要求。
" 卷 ",是对自动驾驶团队的核心要求,这跟英伟达此前的文化截然相反。现实也的确如此。在一向以 WLB ( 生活、工作平衡 ) 的英伟达中国,他们开始了周六、周日加班的节奏。
卖軟體、解决方案、IB 网络,加强自动驾驶领網域重要性,都是英伟达中国对抗 GPU 市场下沉的努力,因为它懂这种经历将带来何种打击。
在 GPU 概念还不为人知、CPU 当道的 2015 年,美国就曾为了限制中国超算的发展,禁止英特尔向中国四家超算公司出口高性能计算芯片。
这给英特尔带来巨创。当时,采用中国 E 级超算天和 2 号所采购的英特尔 Xeon 处理器和至强 Phi 加速器芯片,占到英特尔该芯片约一半的销量。次年,英特尔 Phi 7290、7250 加速器价格腰斩,Phi 7290 更是于 2017 年直接停产。而中国也逐渐发展出了自研的 CPU 芯片。
尽管去年 12 月,8 天内连续访问了日本、新加坡、马来西亚和越南四国,但黄仁勋清楚的知道中国市场的重要性,他曾在接受金融时报采访时说,"如果失去了中国市场,我们并没有应变计划。中国只有一个。"
从成立以来,英伟达中国就在一直向上,并在如今了达到顶点。但当一切变化迅速袭来,面对本属于自己的时代,以及随时可能流走的机会,英伟达中国目前只能承受、适应。
在时代的枷锁下,如英特尔的 Phi 芯片一样,在板块挤压下坠入海沟,大概是英伟达中国最不愿看到的事情。
(文章中出现名字皆为化名)