今天小编分享的财经经验:字节、百度、阿里,为这块芯片抢破了头,欢迎阅读。
需求似乎是无限的,但英伟达的代工厂台积电产能有限,除了大厂之间的争夺,美国对中国的芯片封锁也让国内的大厂更难买到 A100 这样的高端芯片。包括 A800、H100、H800,A100 和它的 " 继承者们 ",遭到各方的哄抢,价格水涨船高,最疯狂的时候,在短短一周里,一台由 8 张 A800 组成的伺服器,可以从 230 万涨价到 330 万。有段时间,孙文博感到疑惑:怎么好像在炒比特币?
文 | 徐晴
编辑 | 赵磊
运营 | 圈圈
一个赌局
一个赌局在伺服器销售的圈子里悄悄传开:香港新到的 300 台 8 卡 A100 伺服器,总货值近 8 个亿,到底会花落谁手?
关于这个赌局,有层层的迷雾——买家都有谁?不清楚,但有消息说,货是 2023 年 10 月的第三个周五进的香港,来自拼多多和金山的采购团队为了这个消息,连夜抵达,严阵以待;货从哪里来的?不知道,据说是一家手段高明的公司,通过英伟达的非授权渠道拿到;具体定价多少?没有准确数字,追踪着这个消息的伺服器厂商高管孙文博说:" 话语权在卖方,肯定会为这批货筛选到价格最高、现金最多、交易条件最好、未来有望继续合作的买方。"
A100,一个颇具科幻气息的名字,容易让人联想到《终结者》中的机器人代号。实际上,这是一种 GPU 芯片,采用 7nm 制程,制造它的光刻机,需要在大约万分之一根头发丝细的空间里进行精细的雕刻。在大约 826 平方毫米——不到一张 3cm*3cm 便签纸大的面积里,容纳了足足 540 亿个晶体管。它的设计公司英伟达,用科学家的名字来命名产品,A 来自电磁学科学家安培(Ampere),而 A100 的前代产品 V100,来自电池的发明者伏特(Volta)。
与每台电腦中都有的中央处理器(CPU)不同,GPU 似乎离普通人有点远,它在电腦中的另一个名字是显卡,负责影像处理、视频渲染,热衷打游戏的年轻人,会为一块高性能显卡省吃俭用,而 GPU 的另一个主要场景是 " 挖矿 ",单枚价值数万美元的比特币,就是 GPU 昼夜不停运作的产物。
如果说 CPU 是一个数学系毕业的高材生,能计算各种艰深复杂的问题,GPU 就像是汇集了一万个只会 1+1=2 的小学生,能以最快的速度处理海量简单重复的问题,而这正是训练人工智能最需要的能力,通过对庞大数据的学习、分析、推理,让机器像人类那样解决问题。学习的数据越多,机器越聪明,但处理海量数据需要强大的芯片,A100 正是为此而生,它靠着超强算力,被誉为 "GPU 中的王者 " " 一片顶六片 "。
▲ 黄仁勋从烤箱拎出了一套将 8 块 A100 芯片组合在一起的智能算力伺服器。图 / 英伟达官网截图
在美国科技公司 OpenAI 推出的大语言模型 ChatGPT 惊艳了全世界之后,国内的互联网公司、大模型创业公司都大步快跑,冲进这个最有前景的赛道,百度、阿里、科大讯飞、360 等互联网大厂,和不少初创企业,都抓紧推出自家的大模型,轰轰烈烈的 " 百模大战 " 彻底打响。
大模型之争的关键在于算力和数据,理论上说,只要 GPU 数量足够多(例如有 10000 台伺服器),一家公司甚至可以在极短的时间之内训练出一个不逊色于 ChatGPT 4 的大模型,而 A100 就是挖掘大模型金矿时最锋利的那把铲子。除了大模型,各类人工智能公司,包括计算机视觉、语音互動、智能驾驶等,都需要这把铲子。
需求似乎是无限的,但英伟达的代工厂台积电产能有限,除了大厂之间的争夺,美国对中国的芯片封锁也让国内的大厂更难买到 A100 这样的高端芯片。包括 A800、H100、H800,A100 和它的 " 继承者们 ",遭到各方的哄抢,价格水涨船高,最疯狂的时候,在短短一周里,一台由 8 张 A800 组成的伺服器,可以从 230 万涨价到 330 万。有段时间,孙文博感到疑惑:怎么好像在炒比特币?
在无限的需求、有限的供给和时间当中,流转着巨额的钱和掘金者们的冀望,考验着大厂和创业公司们的嗅觉、财力、战略和决策效率。全新的排位赛中,有个体的命运沉浮,也有企业的野心、欲望和争夺。
就像那个赌局,尽管还不知道结果,但行内人都估量,拼多多做电商的,业务跟大模型无关,也没有传出做大模型的消息,但 AI 时代,先下注总比错过好。就算不做大模型,转售出去,或是做算力租赁,也是稳赚不赔的好生意。至于金山,虽然自家的 WPS AI 也需要算力芯片,但估计吃不下这么大的单子,财力也稍逊一筹。
暧昧不明的交易,以及谣言、猜测、赌局,都成了大模型和 A100 疯狂的注脚。
烧钱游戏
王子鹏第一次感到风暴袭来,是在 2023 年的 5 月。
来自美团的高管带着采购团队,把他供职的伺服器厂商——宝德信息科技有限公司库存里仅剩的数百台 8 卡 A100 伺服器,像买白菜一样全部扫走。尽管一台机器的价格要大几十万,总订单额过亿,美团的人丝毫没有犹豫,下单、签合同、打预付款、提货 …… 流程飞快。
事实上,在专业的领網域里,A100 从来不是什么稀罕事物。大模型的风刮起来之前,A100 等算力芯片的购买者大多是国内大型的实验室,例如鹏程实验室、智源实验室、之江实验室、中科院的计算所,曾经购买过上百台伺服器。除此之外,还有一些人工智能相关业务的公司,比如抖音疯狂增长的那几年,为了训练 AI 进行内容审核,也曾找宝德订购了不少 V100 伺服器," 一年买两个多亿 "。
作为曾经的伺服器销冠、如今的高管,王子鹏自称是 " 战场最前端战壕里的瞭望员 ",行业里每个细微的变化,都是销售们最先知道。但那一次,他和同事都看走了眼,以 " 相当低的价格 " 出售," 就是平进平出走个量,挣一个点、两个点 "。这让公司的高层日后都懊悔不已,觉得做了 " 赔本生意 "。
2023 年 3 月 14 日,OpenAI 发布 GPT-4,以此为时间点,大模型赛道突然涌进来大量的钱、公司、采购团队,曾经并不紧俏的 A100,突然成了抢手货。而就在 2022 年的 10 月,美国商务部对高性能芯片作出额外出口限制,禁止美国公司向中国实体出售高端芯片,A100 正在其中。政策是政策,生意是生意,英伟达转而推出了 A100 的中国特供版—— A800,王子鹏打了个比方,与 A100 相比,A800" 就像是把汽车的输油管改细了一点,发动机和轮胎还是原来的东西 "。
▲ 图 / 视觉中国
最初,所有人都追逐最好的东西——市场里有限的 A100。需求暴涨,2022 年 10 月之前," 就是一个正常的市场 ",到了 2023 年的 5 月," 至少得是以前 50 倍以上的需求量 "。美团扫货之后的短短几个月,A100 和 8 卡 A100 伺服器的价格水涨船高,涨到了 13-16 万 / 张和 135-160 万 / 台左右,这意味着,以前 5 个亿能买下来的东西,现在要 10 个亿。
昂贵的价格让这场芯片争夺战变成了烧钱战。价格就是这么涨上去的:在卖方市场里,一批货没有准确的买家,谁出的钱多,就归谁。还有一种情况,厂商签下了订单,宁可付违约金,只交付 50%,也要把剩下的货用更高的价格卖出去。
众多买家里,字节是业内公认投入最多的那个。有知情人士透露,字节内部采购了大约 13600 张 A100,按照一张卡 7 万元的最低价格计算,光这些芯片就价值 9.52 亿。
一家大厂在内部资料中估算,目前字节拥有 20 多万张算力芯片,其中约 10 万张是 A100/A800/H800 等高算力芯片。这些芯片当中,有一小部分对外出租,未被出租的高算力芯片则被用于字节大模型的训练和推理,还有一些其他型号被用于支持公司内部业务推理场景,比如兴趣电商、抖音搜索、抖音广告排序等。
等市面上仅剩的 A100 被哄抢得差不多了,对 A800 的需求逐渐成了主流。此时,更多的大厂和创业公司入局了,比如拼多多,在 2023 年的下半年组建了大模型团队,招兵买马,开出了百万年薪挖角人才。对算力的需求就像一个越吹越大的气球,A800 的价格达到了比 A100 更高的高度——在 2023 年 10 月,一台 8 卡 A800 伺服器的价格达到了 220-230 万左右。
双重考验
A100 和 A800 的疯狂,是市场需求和政策禁令双重叠加,催生出的极致供需矛盾的体现。而在涨价和禁令的夹缝之中,大厂和创业公司们也面临着双重考验。
第一重考验是嗅觉和战略决策能力。
本身就探索人工智能前沿技术的阿里达摩院、科大讯飞、百度和商汤科技等公司,长期跟算力芯片打交道,是最早布局、嗅觉也最敏锐的公司。王子鹏和孙文博都曾得到过消息,字节和阿里是最先向英伟达下单的," 都下了近一万张卡的订单 "。百度后来之所以最早推出文心一言,也是因为提前采购了算力芯片。
由于涉及大量的钱,事关公司未来发展,大模型项目以及采购算力芯片等事项,大多是公司最高层来决策。一位阿里云人士透露,阿里云内部有一个供应链团队,其中有几十人负责芯片采购,直接听命于 CTO。而在阿里云前 CEO 张勇卸任之前,通义千问等人工智能项目由他亲自盯进度。
据《晚点》报道,在百度开始文心一言内测前,百度创始人兼 CEO 李彦宏每晚和项目团队开会,他们为筹备产品,一度睡在公司里;而即便已经卸任 CEO,张一鸣也在看人工智能论文,经常跟一些字节人士分享论文学习心得和对 ChatGPT 的思考。一把手们的重视,让这些公司在这场比赛中占了先机,省下了数以亿计的成本。
▲ 百度公司董事长兼首席执行官李彦宏在 " 文心一言 " 发布会上发言。图 / 视觉中国
而 "A100 们 " 设下的第二层考验,是公司内部的沟通和执行能力。
正如一个 " 打地鼠游戏 ",2022 年英伟达推出了 A100 的特供版 A800,但 2023 年 10 月 23 日,这款芯片也被列入了禁售列表。跟它一起被禁售的,还有 H100 的特供版 H800,只给中国公司留下了 30 天的应对时间。
王子鹏记得,在 2023 年的 10 月,A800、H100 等产品的订单都已经排到了一年后,有英伟达的销售告诉他,公司会断掉一些老产品、低性能产品的供应,把产能都集中到高性能算力芯片上,但即便如此,产能还是不够。这意味着,从英伟达拿货已经不太现实。
市场变化得极快,产品、价格、货期随时变化,那些决策不够快的大厂,会在此时暴露出问题。
孙文博与京东的采购打过交道。京东供应链体系有上千人,专门采购算力芯片的团队有近 20 人,负责人直接向 VP 汇报。他们不关心配置、技术,认准了产品型号直接谈价格,这是他们最关心的三个问题之一,另外两个是交货期和具体的交货条件,比如预付款占比、违约条款等。
孙文博还记得京东采购团队的犹豫," 他们一直在追着市场走 "。10 月上旬,A800 还有货,价格在 220-230 万左右,采购团队向高层汇报后,始终没有得到具体的答复,没有 " 是 ",也没有 " 否 "。直到需求涨起来了,才提出以 250 万的价格购入 1000 台伺服器,但这时,市场上的价格已经高达 320 万。
犹豫和观望是有成本的,可能是几千万,也可能是几个亿。孙文博觉得无奈," 劝他们买的时候他们不买,要等价格下跌,结果等到的是上涨 "。
后来,孙文博观察到,随着 A100、A800 价格的高涨,京东的决策周期在变快,从前把情况报给高层没有反馈," 知道了,但很久不决策 ",如今," 两三天基本上会给你一个结果,因为超过两天没有决策,基本上这批货就没了 "。
卖铲子和水的人
2024 年,曾经风光的大厂们,年会要么取消,要么低调举办。沉默的互联网世界,只有英伟达还热闹着。CEO 黄仁勋首次参加英伟达中国区的年会,他穿着一身东北大花马甲,笑容灿烂,跟员工一起扭起了秧歌。那股热闹喜庆,也是英伟达这一年的写照。
▲ 图 / 抖音截图
大模型狂奔、算力芯片被争夺,英伟达成了最大的赢家。假如说大模型创业公司和互联网大厂们在人工智能的世界里掘金,那英伟达就是卖水和铲子的人,市值在一年多时间里暴涨 6 倍,前几日甚至超过了亚马逊和谷歌,以 1.83 万亿美元的市值位居全球第四。
在国内,有两种方式可以购买英伟达的产品,一种是通过英伟达的合作伙伴网络内的代理商单独购买 GPU 卡,例如英迈,神码、丽台;另一种是找到英伟达的 OEM 整机合作伙伴,直接购买含有英伟达 GPU 的伺服器整机,例如浪潮信息、宝德信息。
假如是前一种方式,根据 36Kr 的报道,2023 年上半年,高算力芯片要像爱马仕一样,配货才能购买,阿里、字节这样财力雄厚、订单量大的大厂,可能会优先供货。
假如是后者,王子鹏说,英伟达对于渠道管理非常严格,根据销售额给渠道划分级别,连续两年达标才可以申请更新,否则就会下降。不同级别拿到的产品价格又是不一样的,级别越高,作为中间商的利润空间就越大。
巨头之下,有不少人在跟着吃肉喝汤,在大模型真正赚到钱之前,这些卖铲子的分销人和中间商早已赚得盆满钵满。
王子鹏曾经跟浪潮的高层交流," 浪潮 60% 的业绩是互联网一个行业撑起来的 "。有一次,王子鹏接到一个浪潮转过来的订单,对方销售称,某运营商有 30 台 8 卡 A100 需求,公司没有货," 要不转给你们做?" 王子鹏一脸疑惑:" 你们公司怎么可能没有货,全中国囤货最多,销量最大,怎么连运营商都敢得罪。" 结果对方说,浪潮的货都优先供给互联网公司了。
▲ 图 / 视觉中国
尽管不是最大的伺服器厂商,宝德也在风口中赚了一笔。直到今天,王子鹏依然觉得不可思议,原来一年才卖十几二十台,碰见大项目可能走个三五十台,现在大量的询价、订单流向自己,一张口就是 20 台、30 台," 我们当时都惊呆了,20 台、30 台这个订单就是 2000 万、3000 万 ",这样的单子,每天都有好几个。
当 A100 们被几家大厂瓜分,大厂也摇身一变,成为算力租赁商,争做大模型掘金热潮中的卖水人。最典型的是阿里和字节。
前阿里云员工杨箫透露,阿里的战略特殊,不靠大模型赚钱,靠的是生态。已经发布并开源的通义千问就像一个模範间,谁都可以使用阿里的代码,让自己的大模型跑起来,然后来阿里租赁算力。" 阿里的大模型是一个带动性的东西,真正赚钱的是卖‘水’。"
在阿里,一台 8 卡的伺服器算力一个月的租赁价格在 15 万 -20 万左右,至少 4 台起卖,这意味着,一台机器只要租出去 8 个月就可以收回成本。
字节的火山云也像阿里云一样在卖算力,杨箫说:" 区别在于,字节纯卖水,阿里在卖水的基础上,还卖服务,一整套解决方案卖给你。" 正因如此,阿里的算力价格比字节更贵。
现在,阿里和字节在这门生意上已经成了对头,双方互相探听对方算力芯片的数量、价格。在阿里云,可能只有 CEO 吴泳铭、CTO 周靖人这样级别的高管才知道自己公司一共囤了多少张芯片,但大家都听说过字节囤了多少张。价格战也打响了。字节的火山云销售会询问客户," 阿里跟你们要多少钱?我们六折 "。
创业大模型公司作为融资最多、现金流丰裕的客户,是双方争抢的关键。李开复的零一万物和王慧文退出的光年之外,选择了阿里;而在海外名声更大的 Minimax,行业内看好的智谱 AI,主要使用字节火山云的算力。
2023 年也是智能驾驶竞争激烈、开城落地的关键之年,对算力芯片也有庞大的需求。智驾公司元戎启行,曾是阿里云智算业务的客户。新势力中的蔚小理,纷纷成立了智算中心,蔚来的在合肥,小鹏在乌兰察布,都跟阿里合作,理想的在山西,跟火山引擎合作。不过,到了买算力的档口,还是要看哪家性价比更高、更适合自己。一位阿里云人士透露,蔚来曾经在阿里 " 跑过一个小集群和 demo",但最终还是选了更便宜的字节。
当算力的储备远远供不上需求,阿里云智算业务也像英伟达和浪潮一样,调整了客户策略。" 内部有一个客户评级体系,起码到 6-7 级以上,也就是订单金额在千万以上,才有成为阿里云智算业务客户的机会。"
风口里的人
2022 年 8 月底,美国的芯片禁令下来,A100、H100 名列其中。那个月,王子鹏手里刚好有一个项目,机器预计在禁售的前一天抵达香港海关。但到了第二天,那台机器没能进来,英伟达给公司退了款——也就是那台机器的订购价格,近百万。没多久,这台机器的价格就涨到了他不敢相信的数字。
市场里的涨幅,是以十万、百万为部門的。孙文博记得,在 10 月 25 号左右,一台 H800 伺服器在国内现货市场的成交价格是 220 万 -230 万一台,一周后,11 月 2 日,美国出了最新的政策,伺服器的价格从 220 万直接涨了 100 万,达到了 320 万。到了 11 月,价格还在涨,最高报到了 385 万。
市场疯狂的上涨让一夜暴富的故事批量上演。
有人看准了时机,在伺服器 90 万的时候囤货,等涨到 110 万再卖出去,也有人胆子够大,可以等到 120 万甚至 220 万的时候再卖。王子鹏总结," 风浪越大,鱼越贵 "。孙文博说:" 最疯的时候有多少疯?比如你手里有个三五台,因为各种原因没有卖掉,放在那,10 天时间,资产就涨了 50%。"
据 36Kr 报道,2023 年底,英伟达中国区的销售都联系不上,因为这一年太赚钱,纷纷出国度假了。一家叫声智科技的公司,本来是做电动牙刷和智能家电的,不知道为什么囤了一大批 A100,算力租赁做得风生水起。
也有很多唏嘘和感慨。在 80 台 8 卡 A100 伺服器以很低的价格被美团扫货之后,宝德的高层领导幡然醒悟,王子鹏记得," 一直在骂销售,说你把我这个东西贱卖,让公司少赚了大几百万纯利润 "。
每隔一段时间,这件事就要被老板重新提起来一次,成为督促销售们 " 看准时机 " 的反面案例," 说为什么这波这大模型没有抓住,为什么没有赚到钱 "。或者是," 你这个事情给我干好,要不然又像大模型一样错失机会 "。
▲ 图 / 视觉中国
骗局、贪腐也出现了。有人在小红书上倒卖 A100、A800 等芯片。一位自称手里有 A100 现货的中间商声称,从 2023 年的 3 月开始,陆续有人找到他询问有没有货,半年时间,他卖出去大约十几片。
王子鹏认为,在社交平台上声称自己有货源的,很可能是假货源,也有可能是 40g 的库存货,因为内存不够大,这些 A100 通常被当做作训练大模型的第二或者第三梯队用卡,大家哄抢的是 80g 内存的算力芯片。还有一种可能,是互联网大厂中隐秘的贪腐:" 互联网可能有很多个数据中心,拆出来卖掉也是有可能的,那么多的卡,回头跟公司报修一下,就说是坏了,也能糊弄过去。"
热情、失落、疲惫、震撼,这个行业以一种前所未有的姿态冲击着人们。孙文博说,作为销售,他承担着所有的情绪——伺服器涨价,客户的气撒在他身上;货供不上,老板的焦虑也传递到他这里来,他的神经高度紧绷着,2023 年一整年,他的电话 24 小时待机,不管是谁打来电话,他都会在第一时间接听。
经历了良多,王子鹏依然觉得,这是时代给他的机会。2020 年时,他向客户介绍 A100,需要把它的历史渊源、性能优势从头到尾讲个清楚,而整个公司,一年才卖十几台伺服器。到了 2023 年下半年,每次他开口给客户介绍产品,对方会给他一个 " 我懂 " 的眼神,谈话直接进入下一阶段," 没想到三年以后,我这套专业的说辞变成人尽皆知 "。他意识到,那个鼓点,他踩中了。
风口还是风险?
芯片是一个典型的全球化产品。一块芯片,可能由英伟达设计,使用荷兰阿斯麦公司 ( ASML ) 的光刻机生产,在台湾的台积电封装,而每一个环节又涉及到更多的国家、企业。
因此,芯片行业与其他行业最大的不同在于,美元汇率、国际形势甚至自然灾害,都会影响到一块芯片的成本、价格和供需关系,而这其中蕴藏着巨大的风险。
一位浪潮的中层销售王初告诉记者,在美国发布新规、继续加码,英伟达 A100、A800、H100、H800 都被禁售的 10 月底,公司乱成了一锅粥。" 我们按照订单金额 20% 收定金,光定金就收了 30 个亿,倒推回去,150 个亿的单子,供不上。"
缺卡态势严重,王初的一位同事,一个单子 8 个亿,只供了 40 多台机器,还有 7 亿多供不上。公司一到货一批货,就会被哄抢,不知道该分给哪些部门、哪些客户。有的客户已经不愿意再排队等待,撤单的消息一个个传过来。
王初长叹了一声," 浪潮今年好不容易有个新的增长点,是英伟达最大的合作伙伴,所以我们拿到的卡是最多的,拿到的订单是最多的,但现在卡一禁售,对我们影响也非常大 "。
处于危机中的还有一些算力租赁公司。他们签下了大量订单,却无力供给,孙文博说:" 有个公司董事长说自己,现在在外面已经签了 10 个亿的合同,结果 1 个亿的货都没有,每天早上一醒来一屁股的债。"
最大的赢家英伟达,也吃了苦头。黄仁勋曾透露,中国市场占英伟达销售额的大约 20%,而美国阻止英伟达向中国销售最先进芯片,如同将 " 双手绑在背后 "。
▲ 图 / 视觉中国
在国内,国产芯片已经瞄准了这块新空出来的市场,比如华为推出了 Atlas 800 AI 训练伺服器,其中包含 8 片昇腾处理器。古希腊神话里,Atlas 是擎天之神,因为反抗宙斯失败,被罚在世界最西处,用头和手撑住天空。这个名字寄托了华为的愿望,也暗示着华为的处境。
但有业内人士评价:" 华为的生态比英伟达差一些,生态的切换是一个庞大且复杂的工程,大家用英伟达的卡和生态太久了,切换起来很困难。"
对算力的信仰,建立在对人工智能的笃定之上,但现在,大模型的乱战,带来的不只有金钱、欲望和争斗,还有一些迷茫。
某 211 高校信息工程学院副教授赵佳有一种被挤压的感觉:" 所有大厂都在做大模型,不知道自己该做什么。" 在这场风刮起来之前,他做的是一些 " 小模型 ",借助少量的算力去实现一些现实中的工程目标,比如在南方没有人烟的地方,不再需要工人去一个个检查电线是否完好,而是换成载着人工智能程式的无人机去 " 巡线 ",判断电线上有没有冰,绝缘子有没有裂缝,精准定位后再报修。但因为算力伺服器价格的暴涨,他的项目预算不够了,只停留在了 " 小模型 " 的阶段,没办法进一步深入。
他对当下数量庞大的大模型感到不理解," 有这么多大语言模型,然后呢?" 在他看来,许多大模型产品更多是一种噱头,没有实际的用处,花掉那么多的钱、资源、算力,几乎是浪费。
在几年前一次人工智能相关的学术会议中,刚入行的王子鹏偶遇一位北大药学院的老教授,他有点疑惑,药学教授怎么来参加人工智能会议?对方回答,人工智能可以在很多领網域里带来革命性的改变,包括制药。那是一种关于可能性的战争,找到符合标准的化合物并不容易,可能在各个环节遭遇失败,一款新药上市可能需要花掉 10 年、10 亿美元。但人工智能可以在各个流程上替人类计算、预测、筛选,最大程度地缩短时间、节省成本。
王子鹏 " 被刷新了认知 ",原来,AI 真的可以改变世界。但几年过去了,他发觉,目前被改变的好像只有商业的世界,那个钱和欲望流动的地方。而对大模型的狂热和对算力的追捧,到底能走到哪一步,谁也没有答案。
(文中受访者均为化名)