今天小编分享的财经经验:风暴中的英伟达,欢迎阅读。
编者按:12 月 10 日,由《巴伦周刊》资深科技作者金泰(Tae Kim)撰写的英伟达商业科技图书 "The Nvidia Way: Jensen Huang and the Making of a Tech Giant"(英伟达之道:黄仁勋和科技帝国的诞生)在海外正式发售。该书的官方简体中文版也由中信出版社同步出版。
恰巧就在近日,英伟达先是被中国市场监管总局依法反垄断调查,随后美最高法院允许投资者对英伟达提起集体诉讼。
就像该书中所描述的,英伟达似乎永远处于风暴中。
而这次,黄仁勋会如何带领英伟达破局?
三十年前,英伟达三位联合创始人之一的普利姆,以 " 先发制人 " 的方式,倒逼黄仁勋和另一位联合创始人马拉科夫斯基分别从原雇主 LSI 公司和太阳微系统公司离职。这便有了之后的英伟达。在英伟达当了三十多年 CEO 的黄仁勋,也成为了科技圈任职时间最长的 CEO。
2022 年 11 月,ChatGPT 的问世让英伟达成为全球瞩目的科技巨星,其市值一度超过微软,两年时间翻了三倍达到三万亿。" 为什么必须是英伟达?"" 为什么其他芯片公司的芯片无法满足训练大模型的极致性能要求?" 这些问题一遍遍被问及。
罗马非一日之工,英伟达能在大模型时代脱颖而出,并非偶然。复盘英伟达从一家名不见经传的小公司到成长为如今的芯片巨头,创造 GPU、提前布局 CUDA 以及黄仁勋的领导力或许是这三十年英伟达成功的关键。
只不过,没有永远的成功,目前摆在英伟达面前的可能是比产品能力更棘手的问题。
创造 GPU
在英伟达之前,世界上没有一个叫 "GPU" 的东西。追溯第一款 GPU 的诞生,要从 "GeForce 256" 说起。GeForce 256 集成了一个硬體光影转换引擎,主要进步是承担了一些原本由 CPU 承担的任务,减轻 CPU 运算负载,提升计算机运行速度。
但英伟达没有以 "GeForce 256" 发布这款具有突破意义的 " 显卡 " —— " 必须找到一种方法,把这个产品定位成比市场上任何其他产品都更好的 3D 图形处理器 "。于是在 30 分钟的头腦风暴过后,英伟达决定:把新的芯片命名为全新产品类别的第一款产品,即图形处理器(GPU),它在图形渲染方面的作用就像 CPU 在所有其他计算任务中的作用一样。
自那之后,GPU 获得了可以明确与 CPU 进行比较的新地位,确切地说是英伟达发明了 GPU。
图形芯片脱颖而出,并且 GPU 的命名也让其与 CPU 的价格差距急剧缩小。
那年是 1999 年 8 月。接下来的几十年,英伟达销售了数亿张显卡。
" 我们不存在只追求市场份额的文化。我们更愿意创造市场。" 英伟达高管杰伊 · 普里说,而这也是黄仁勋经常对英伟达员工传达的价值观。
颠覆性创新最终会创造出新的应用场景,而且初创公司通常能够比暂时领先的公司更快地迭代和创新。现在英伟达做到了。
数据显示,在最近的十年,英伟达在独立显卡 / 集成显卡上的市场份额一直保持 80% 左右。
提前布局:CUDA
当然,英伟达的腾飞并不只是因为发明了 GPU,毕竟这家公司是卖了将近三十年的显卡,才在 ChatGPT 引爆生成式 AI 之后,变得 " 一卡难求 "。报道显示,2023 年年初,各大公司为了训练大模型,英伟达 GPU 曾被炒到十几万一颗。这也是为什么英伟达市值能在短短两三年之内翻三倍。
但需要关注的是,乘上生成式 AI 的风口,并不是因为英伟达有什么天大的好运,也不是因为埋头为游戏行业做了三十年显卡,最重要的是,在生成式 AI 爆发前的十几年前,英伟达看上了 " 将 GPU 用于通用计算 " 的生意,并耗资多年秘密研发 CUDA。
何为 CUDA?
简单来讲,CUDA 是芯片编程模型,即统一计算设备框架,有了这个框架,无论是图形编程专家还是科学家和工程师都可以利用 GPU 的计算能力。相当于在图形计算和非图形的通用计算之间搭建了一个桥梁。彼时,黄仁勋已经认定,GPGPU ( 基于 GPU 的计算通用计算 ) 有可能将 GPU 的市场扩展开来—— GPU 的天花板被加高了。
有意思的是,最初发现 GPGPU 市场的并非英伟达,而是学术界的一些高校和研究机构将 GPU 拿来做相关研究。他们先是破解了 GPU,尝试将非图形计算重构为 GPU 可执行的函数。而后发展到开始形成社区,讨论使用 GPU 编程语言的最佳方法,以将其应用于理解蛋白质折叠或确定股票期权定价。
创造 GPGPU 概念的研究员哈里斯很快成为了英伟达的员工。2006 年 11 月,秘密研发 4 年的 CUDA 连同英伟达第一款具有计算功能的 GPU 芯片 G80 被推出。G80 拥有 128 个 CUDA 内核,通过使用硬體多线程特性,GPU 能够在这些内核上同时运行多达数千个计算线程。相比之下,英特尔当时的 " 酷睿 2"CPU 最多只有 4 个计算线程。
时间推进到 2012 年,多伦多大学教授杰弗里 · 辛顿(没错,就是那个双诺奖得主辛顿)和他的两名学生(没错,其中一位就是伊利亚 · 苏茨克维,那个 OpenAI 前首席科技学家)在李飞飞实验室举办的 ImageNet 影像识别竞赛中取得了重大突破。他们使用基于 CUDA 的深度神经网络 AlexNet,在比赛中以显著优势胜出。
AlexNet 的获胜为英伟达带来了巨大的公关效应,因为辛顿三人仅用一对售价几百美元的消费级 GPU 两周内完成了 AlexNet 的训练。
这次胜利不仅标志着深度学习时代的到来,也展示了 CUDA 在加速机器学习算法方面的巨大潜力。从此,越来越多的研究人员和企业开始采用 CUDA,英伟达也在 CUDA 生态上进行了巨大投入(创建 AI 軟體库、创建支持 CUDA 的框架和工具等),推动人工智能领網域的快速发展。
黄仁勋的领导哲学
无论是发明 GPU 还是发明 CUDA,英伟达并非一帆风顺,甚至数次资金耗尽、濒临破产。但英伟达都以一种奇迹的方式重生了。
英伟达能够一次次度过危机,黄仁勋的领导者角色一次次被凸显。可以毫不夸张地说,黄仁勋对公司文化的深远影响,构成了英伟达成功的核心要素。而一种坚韧不拔、勇于创新的企业精神,不仅塑造了英伟达的企业文化,也激励着每一位员工不断超越自我、追求卓越。
就以 CUDA 的研发过程来说,CUDA 和 G80 耗费大量资金,2008 财年英伟达毛利率从 45.6% 下降到了 2010 财年的 35.4%,2007 年 10 月至 2008 年 11 月,英伟达股价暴跌超过 80%。
即便如此他们依然坚持每款芯片都能兼容 CUDA。黄仁勋后来评价,CUDA 为英伟达的芯片增加了大量成本,但是他确信,加速计算将解决正常计算机无法解决的问题。" 我们必须做出这样的牺牲,我对它的潜力深信不疑。" 黄仁勋说。
英伟达第一款打出名头的产品是 1997 年 4 月游戏开发者大会首次展示的 RIVA 128,该芯片应用了带宽 128 位的内存总线,是消费级个人电腦领網域首次使用该技术的芯片。RIVA 128 物理尺寸大于之前任何成功制造过的芯片,整颗芯片晶体管数量为 350 万个。
RIVA 128 一经推出,芯片基准测试表现超越了当时任何消费级显卡的性能数据,其中包括英伟达最大竞争对手 3dfx 的最好的显卡(后者于 2002 年 10 月正式申请破产,其专利和其他资产被英伟达收购)。这不仅让英伟达获得了来自苏特希尔承诺投资的 180 万美元,也获得了来自 STB Systems 的 3 万颗 RIVA 128 芯片订单,助力英伟达度过生存危机。1997 年第四季度,英伟达实现 140 万美元利润,这是公司成立 4 年来首次单季度盈利。
但大家不知道的是,在 RIVA 128 推出之前,公司刚刚经历了 NV1 的失败。英伟达耗费了 1500 万美元开发的 NV1 遇上了糟糕的销售结果,公司陷入现金危机。当时黄仁勋面临两个事实:一是大多数图形芯片从概念到上市需要 2 年时间。二是英伟达资金只能再撑 9 个月。
如何以 " 光速 "、以史无前例的速度将显卡推向市场?
抛开对芯片研发、测试流程不谈,英伟达采取了各种方式突破极限。
3dfx 破产后,原 3dfx 工程师入职英伟达,但他们惊奇地发现,这里并没有什么秘密武器。" 只是最大限度地努力工作和严格执行时间表。" 该工程师说。而正是因为这次 RIVA128 的攻坚,黄仁勋明白自己不仅是一名技术工程师,更应该做好的是一名管理者和领导者。
2024 年 11 月,获得港科大工程学荣誉博士学位的黄仁勋谈及自己的领导哲学。他说,作为 CEO 和领导者,学到的一个关键点是:你不需要知道一切。" 你可以对自己的方向充满信心,但同时也要允许存在不确定性。第二点,作为领导者,需要展现力量,因为团队成员会从你的力量中获得信心。然而,力量并不意味着不能表现脆弱。最后一点非常重要:不要为了自己而做,而是为了他人。真正被信任的领导者是那些每一个决定都以团队使命、他人成功为导向的人。"
直接管理 60 位高管,透明度是关键。当公司需要确定方向、制定策略或做出决定时,他不会一个人进入 " 森林 " 深思熟虑,然后带着答案回来告诉大家该怎么做。相反,我们会一起推理、讨论,最终得出结论。" 我通常是最后一个总结发言的人,我的职责是确保每个人都听到并理解相同的信息,消除任何可能的歧义。"
经历风暴
就在发稿前一周,12 月 9 日,英伟达因涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告〔2020〕第 16 号),市场监管总局依法对英伟达公司开展立案调查。
消息一出,英伟达股价当天收跌 2.55%,第二日续跌 2.69%,两日跌去超 800 亿美元市值。在随后的回应中,英伟达发言人表示,乐于回答监管机构关于业务提出的任何问题,但强调英伟达凭借优势在市场中取胜,且努力在每个地区提供最好产品、履行承诺。
随后的 12 日,英伟达中国官方微博再发声明,辟谣英伟达断供中国的的不实传闻,并表示,中国是 NVIDIA 重要的市场,未来将持续为中国客户提供高质量服务。同日,媒体报道,英伟达今年在中国加大招聘力度,以增强研发能力并专注于最新的自动驾驶技术。但这些显然都不够,12 月 13 日,在经历了小幅微涨的短暂行情之后,英伟达收盘再跌 2.25% 至 10 月 31 日以来的最低水平。上周共计下跌 5.75% 至 134.25 美元 / 股。
与此前任何一次危机一样,英伟达似乎又到了一个 " 谷底时刻 "。英伟达历经 30 年在 GPU 技术上的积累,已经让其成长为了一个 GPU 巨头。" 涉嫌垄断 " 是英伟达当下挥之不去的达摩克利斯之剑,使其处于新的风暴中。
中国被认为是 AI 应用最火热的地区,除非英伟达要放弃这一潜力巨大的市场,否则如何公平地满足中国爆发的 GPU 需求,将是英伟达作为芯片巨头必须妥善解决的问题。
放眼全球,不止中国对其展开反垄断调查,美最高法院近日也允许投资者对英伟达提起集体诉讼,并驳回了英伟达的上诉请求。这是继法国、欧盟、中国对英伟达展开 " 反垄断调查 " 以来,英伟达陷入的最新司法纠纷。
英伟达该如何破局?
可以看到,黄仁勋近期正频繁在公共场合露面,并强调英伟达 GPU 对于当前 AI 时代的重要性。黄仁勋曾表示,有两大趋势正在推动英伟达芯片在全球的普及:首先,整个计算领網域从 CPU 支持的编程转向 GPU 支持的机器学习;其次,AI 领網域的产业发展。他表示,随着基础模型制造商扩大 AI 预训练、训练后以及云端 AI 推理算力的部署规模,市场对 Hopper 芯片和对 Blackwell 芯片的需求将持续增长。
Hopper 芯片在 ChatGPT 爆发后变得炙手可热,H100 芯片在全球上演一卡难求;而 Blackwell 芯片,则是英伟达被寄予厚望的新一代芯片。按照此前英伟达产品沿革的惯例,如若 Blackwell 芯片能够获得较好的市场反馈,英伟达有望一扫阴霾。
但 Blackwell 芯片在今年年中曾出现设计瑕疵,生产和交付时间因此推迟了至少三个月。并且,该产品生产初期的成本一度压低了英伟达三季度的毛利率。
据黄仁勋最新透露的消息,瑕疵问题目前已彻底解决,且谷歌、微软和 Meta 等公司都计划购买新芯片,在性能上,Blackwell 运行成本比之前 AI 模型的成本的 Nvidia H100 低 25 倍。同时,Oracle 已经为其 Zettascale 超级计算集群订购了约 131,000 块 Blackwell GPU(尚未交付)。分析师预计,待 Blackwell 芯片产能爬坡,英伟达利润率或实现回升。(本文首发于钛媒体 APP,作者 | 秦聪慧,注:本文关于英伟达创业历史主要参考新书《英伟达之道》(中信出版社出版))