今天小编分享的科技经验:英伟达杀疯了!连投三家生成式AI独角兽,加单带飞台积电5nm产能,欢迎阅读。
谁能挑战英伟达?
作者 | ZeR0
编辑 | 漠影
芯东西 6 月 30 日消息,不管是今年上半年,还是本周,英伟达都是妥妥的大赢家。
在由生成式 AI 掀起的新一波人工智能热潮中,英伟达已经成为最热门的股票之一,今年迄今股价暴涨 185%,市值突破 1 万亿美元,并在支持生成式 AI 及大模型研发的硬體竞赛中遥遥领先。
围绕生成式 AI 创企投资,英伟达的存在感也越来越让人难以忽视。本周四,美国 AI 聊天机器人创企 Inflection AI 宣布获得 13 亿美元新融资,估值升至约 40 亿美元;美国 AI 文生视频创企 Runway 宣布完成 1.41 亿美元新融资,估值升至约 15 亿美元。而英伟达均在这两笔融资的投资方之列。
另据市研机构 TrendForce 预测,因 AI 相关芯片部署刺激了营收增长,英伟达有望在 2023 年第二季度取代高通登顶全球最大芯片设计公司。
一边在 AI 芯片市场接单接到手软,另一边面向生成式 AI 赛道加码重金投资,英伟达的 AI 如意算盘正打得越来越响。
01.
连投生成式 AI 独角兽
英伟达闪电扩张 AI 投资版图
英伟达最新参投的两家生成式 AI 独角兽——打造出类 ChatGPT 产品的大型语言模型创企Inflection AI和让用户输入文字就能轻松创作短视频的 AI 视频编辑軟體创企Runway,这两家都云集了非常强大的明星投资阵容。
除了英伟达之外,Inflection AI 新一轮融资还获得了LinkedIn 联合创始人 Reid Hoffman、微软联合创始人比尔 · 盖茨、谷歌前 CEO Eric Schmidt等科技巨头及大佬的注资。Runway 最新融资的投资方则包括谷歌、Salesforce等科技巨头,累计融资已经有约 2.37 亿美元。
更早之前,今年 6 月 9 日,同样在做类 ChatGPT 聊天机器人的加拿大 AI 创企Cohere宣布完成 2.7 亿美元 C 轮融资,估值约 22 亿美元,英伟达、甲骨文、Salesforce等均参与了该轮融资。
尤其值得一提的是 Inflection AI,由 DeepMind 联合创始人 Mustafa Suleyman 于 2022 年联合创办并担任 CEO,在推出 Pi 聊天机器人后收到了大量报价,继而获得了这一笔高额融资,而且英伟达是这轮唯一的新投资者。至此,这家独角兽企业超过 Cohere,成为估值仅次于 OpenAI 和 Anthropic 的全球第三大生成式 AI 独角兽。
Inflection AI 最近推出了其首个专有语言模型 Inflection-1,并称该模型是在非常大的数据集上使用数千个英伟达 H100训练的,性能与 GPT-3.5、Chinchilla 和 PaLM-540B 相当。
▲ Inflection-1、GPT-3.5、LLaMA-65B 多任务准确率对比(图源:Inflection AI)
02.
11 分钟训练 GPT-3
英伟达 GPU 强势霸榜大模型基准测试
Inflection AI 正与英伟达合作构建用于训练 AI 大模型的全球最大 GPU 集群之一。通过与英伟达和云服务提供商 CoreWeave 的合作,其超级计算机将扩展至包含22000 个 H100,这一数量远超 Meta RSC 超算集群的 16000 个 A100。
CoreWeave 成立于 2017 年,号称可提供 " 比传统云提供商便宜 80%" 的计算能力。英伟达之前曾向 CoreWeave 投资 1 亿美元。据外媒今年 6 月报道,微软同意在未来数年内向 CoreWeave 投资数十亿美元,用于云计算基础设施建设。
在最新发布的权威 AI 性能基准测试 MLPerf 中,英伟达和 CoreWeave 合作构建的拥有 3584 个 H100 的集群,仅用不到 11 分钟就训练完 GPT-3 大型语言模型。
▲英伟达 H100 在最新 GPT-3 训练基准测试的表现
毫无意外的,英伟达凭借旗舰计算芯片 H100 GPU 继续霸榜各项基准测试。
▲英伟达 H100 在 8 项 MLPerf 基准测试的性能表现
最新 MLPerf 训练 3.0 新增了 GPT-3 大模型基准测试,而英伟达和英特尔成为唯二的参赛者。英伟达用 3584 个 GPU 创下了最快的 GPT-3 训练纪录,英特尔 AI 芯片 Habana Gaudi2 则通过在更小的系统上跑 GPT-3 展示在易用性和性价比方面的竞争力,包括在 384 个 Gaudi2 芯片上训练总时长为 5 个多小时,在 256 个 Gaudi2 芯片上训练总时长为 7 个多小时。
▲ GPT-3 训练基准测试结果对比,深红色图例为英伟达 H100,浅红色图例为英特尔 Gaudi2(图源:IEEE Spectrum)
在一些测试中,Gaudi2 训练性能超过了英伟达 A100 GPU。英特尔还计划通过軟體优化进一步缩小 Gaudi2 与 H100 的差距,将于 9 月份发布对 FP8 的軟體支持与新功能,并预告届时 Gaudi2 性能和性价比将超过 H100。另一个被视作英伟达强劲竞争对手的 AMD 则并未提交测试成绩。
▲ Gaudi2 跑 4 款模型性能超过 A100(图源:英特尔)
MLPerf 基准测试的结果由 MLCommons 发布。据 MLCommons 执行董事 David Kanter 透露,GPT-3 是 MLPerf 基准测试中对计算要求最高的,MLPerf 中的大多数基准网络都能在单个处理器上运行,但 GPT-3 至少需要 64 个处理器。
03.
AI 大模型军备竞赛白热化
大算力 AI 芯片需求暴涨
科技企业正积极将 AI 融入其产品和服务中,投资者对生成式 AI 创企的投资热情不减,显然没有谁愿意因为计算速度落后而错过这一波潜在的历史性增长机遇。
仅是在本周,国内外均诞生了迄今最大的生成式 AI 并购案:美国大数据超级独角兽 Databricks 同意以 13 亿美元(约合 94 亿人民币)收购美国大型语言模型创企 MosaicML,美团昨日宣布以 20.65 亿元收购由美团联合创始人王慧文创办的大模型创企光年之外。
训练生成式 AI 模型离不开昂贵的数据中心计算芯片。大模型军备竞赛白热化背景下,大算力 AI 芯片市场需求持续高涨。而目前训练 AI 大模型的真正芯片赢家只有一家——英伟达。
去年 11 月,甲骨文宣布购买数万个 A100 和 H100 搭建新计算中心。谷歌在今年 5 月的 I/O 开发者大会上宣布推出了一台拥有 26000 个 H100 的 AI 超级计算机 A3。本周甲骨文被外媒报道正在花费数十亿美元采购英伟达的芯片,以扩展针对新一波 AI 浪潮的云计算服务。
英伟达未来能否继续赢麻,还与中国市场息息相关。根据财报,去年来自中国大陆和香港的收入占英伟达收入的 22%。据《晚点 LatePost》报道,今年春节后,拥有云计算业务的中国各互联网大公司都向英伟达下了大单,字节今年向英伟达订购了超过 10 亿美元的 GPU,另一家互联网大厂今年至少已给英伟达下了万卡级别订单,按目录价估算价值超 10 亿元人民币。仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。不算今年的新增订单,字节 A100 和前代产品 V100 总数接近 10 万块;字节到货和没到货的 A100 与 H800 总计有 10 万块。
在本周出现美国商务部考虑进一步限制对华出口英伟达 A800 和 H800 的传闻后,英伟达首席财务官 Colette Kress 警告说:" 从长远来看,禁止向中国销售我们的数据中心 GPU 的限制,如果实施,将导致美国工业永久失去在世界上最大的市场之一竞争和领先的机会,并影响我们未来的业务和财务业绩。"
04.
结语:距离登顶全球最大芯片设计公司
只差临门一脚
无论从产品性能、新增订单、业绩进展、股市表现、生态扩张还是投资布局来看,英伟达都已经肉眼可见的赢麻了。
5 月 25 日,英伟达发布 2024 财年第一季度财报中,其单季度实现营收 71.9 亿美元,并预测其第二季度的收入将达到 110.0 亿美元。6 月 12 日,据台媒报道,在英伟达 AI 芯片加单的带动下,台积电先进制程利用率大幅提升,5nm 产能利用率从五成多提升至七八成。
据近日市研机构 TrendForce 发布的数据,受益于生成式 AI 和云端算力需求爆发以及新款 GeForce RTX 40 系列新品上市,英伟达在 2023 年第一季度营收环比增长 13.5% 至 67.3 亿美元,其全球芯片设计市场份额提升至 19.9%。
▲ 2023 年第一季度全球前十大芯片设计公司排名,部門:百万美元(图源:TrendForce)
TrendForce 预测,因 AI 相关芯片部署刺激了营收的增长,增速明显,在 2023 年第二季度,英伟达有望取代高通成为全球最大的无晶圆厂芯片设计公司。
在英伟达俨然已是生成式 AI 时代最大受益者的背景下,英特尔、AMD 等芯片巨头正虎视眈眈,试图通过软硬體协同优化分食 AI 计算市场。与此同时,国产 AI 芯片公司能否接住这一波大模型训练及部署红利,也成为业界关注的焦点。
>