今天小编分享的科技经验:英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心,欢迎阅读。
本文来源:时代财经 作者:谢斯临 实习生卢倩莹
图片来源:Pixabay
算力芯片的火,从 2023 年一直燃烧到 2024 年。
开年不久,英伟达 CEO 黄仁勋时隔四年到访中国大陆,还穿上了东北大花袄与国内员工共舞,气氛无比热络,似乎是在对自家芯片遇冷的传言进行某种回应。
2023 年,英伟达的 AI 芯片成了科技界的硬通货,一度一片难求,英伟达业绩也水涨船高,其 2024 财年第三季度财报显示,期内英伟达录得营收 181.2 亿美元,比去年同期增长 206%,远高于市场预期的 162 亿美元,创纪录新高。
但近期,情况似乎发生了变化。据参考消息网,自去年 11 月以来,中国互联网大厂就开始在测试英伟达 " 中国特供版 "AI 芯片样品,结果并不理想——由于算力不足,相关公司已暗示英伟达,今年订购的英伟达芯片数量将远少于原计划。
因此,黄仁勋在这个特殊时间节点突然到访,引发了市场诸多猜测与遐想。有业内人士认为,在国内厂商不愿购买性能缩水的英伟达特供版芯片的情况下,黄仁勋来到中国大陆,很有可能是为了稳住国内团队和头部客户,并了解市场对英伟达产品的需求和反馈,以便进行相应的产品和策略调整。
对此,英伟达方面也回应媒体称,黄仁勋的到访并未涉及与政府官员的会面,也没有重大的商业发布,最主要的目的是与中国员工 " 欢度美好时光 "。
" 这反映出我国相关产业在国际竞争中的地位逐渐上升。" 深度科技研究院院长张孝荣向时代财经记者分析表示,在政策端的支持以及国内企业的不断努力下,国内外芯片算力的差距已在不断缩小,这给予了国内头部大模型厂商转投国产芯片的底气,也为英伟达敲响了警钟。
H20" 遇冷 " 真相
2023 年 10 月,为了绕过限制并满足中国大陆市场需求,英伟达着手推出三款基于其 AI 芯片 H100 的 " 降级版 " 芯片:H20、L20 和 L2,并计划在今年二季度量产。
然而这一针对中国市场研发的特供芯片未获市场认可。性能上的不足,被普遍认为是英伟达芯片遇冷的主要原因。
官方资料对比显示,H20 为三款芯片中性能最佳的一款,更适用于垂类模型的训练、推理。H20 的内存高达 96GB,整数精度(INT8)算力为 296TOPS;L20 则配有 48 GB 内存,整数精度(INT8)算力为 239TFLOP;L2 配置为 24GB 内存以及算力为 193TFLOP。
然而即便是三款芯片中最强大的是 H20 芯片,其运算能力与 H100 相比还是大幅缩水。
半导体研究机构 Semianalysis 调研报告曾显示,理论上 H20 整体算力比英伟达 H100 下降 80% 左右,但在大语言模型(LLM)推理方面的性能比 H100 快 20%,同时配置的 HBM3 显存和 NVLink 互联模块增加了不小成本。
此外,多位业内人士向时代财经记者分析表示,性能表现不及预期,并非 H20 在华遇冷的唯一原因。
华芯金通半导体产业研究院院长吴全向时代财经记者指出,从 2023 年大模型爆火以来,国内一众云计算、大模型厂商就已经开始积极囤货,大批量购买 A800、H800 等英伟达芯片,目前已部署的伺服器总量尚能支撑市场需求,故而对 " 减量不减价 " 的 H20 兴致缺缺。
而前人工智能 NLP 企业首席科学家、千芯科技董事长陈巍进一步向时代财经记者透露,国内交易市场中还囤积有大量英伟达 GPU 芯片等待消化。这也给予国内大模型厂商一定的选择余地。
" 估计还有 20% 的存货没有出清。" 陈巍表示。
时代财经记者通过询问小红书、闲鱼 APP 等线上渠道,以及线下走访华强北芯片交易市场后发现,相比半年前囤货惜售的场景,现在经销商手中英伟达存货普遍较多,侧面印证了陈巍的说法。
多位卖家向时代财经记者透露,其目前拥有 A100 芯片现货在 50 个以上,配置不同报价略有波动,单个售价集中在 12 万到 18 万元区间内,相较去年下半年价格维持稳定。也有卖家要求 50-100 个起售,交货周期为 1 个月,可在中国香港、日本、新加坡进行交易。
此外,陈巍强调,当下市场的观望态度也与英伟达自身的动作息息相关。
除 H20 外,2023 年底,英伟达中国又在官网发布了定制的 GeForce RTX 4090 D。随后,又于今年 1 月初,推出了全新消费级显卡 GeForce RTX 40 SUPER 系列,包括 RTX 4080 SUPER、RTX 4070 Ti SUPER 和 RTX 4070 SUPER 三款 GPU,均具备强劲的生成式 AI 性能。英伟达副总裁 Justin Walker 在发布会上强调,英伟达发布的新显卡符合出口要求,可以提供给中国大陆消费者。
陈巍认为,考虑到多数国内大模型厂商的发展趋势是针对垂直领網域开发数十亿参数量级或百亿参数量级的中小模型,而不是开发类似 GPT-3.5 175B 这样的千亿级大模型。因此对于云计算和 IDC 厂商来说,4090D 等消费级显卡在云部署与推理计算上更具备性价比,H20 的吸引力进一步下降。
国产自研 AI 芯片加速
在爆出 H20 等 " 降级版 " 芯片在华遇冷的同时,参考消息网的相关报道称," 短期来看,英伟达降级版芯片与中国本土芯片在性能上的差距不断缩小,增强了中国自产芯片的吸引力。据知情人士称,阿里巴巴和腾讯正将一部分高性能 AI 芯片的订单转给本土企业,并更多地依赖内部自研芯片。中国另外两大芯片买家字节跳动和百度也是如此。"
时代财经记者通过采访以及公开资料梳理发现,目前国产 AI 芯片主要可以分为三类:其一是大型科技企业自研的 AI 芯片,二是海光信息这类国资背景的科技公司,三是壁仞科技、天数智芯、摩尔线程、燧原科技、寒武纪等创业型芯片公司。
据晚点统计,上述芯片峰值算力大多相当于英伟达 A100 的 41% 到 82%。
从实际落地情况来看,绝大部分厂商仍处在商业化应用的早期阶段,仍停留在具体场景下的应用。
目前,国内已有科技企业具备全栈 AI 软硬产品,能够真正大规模量产并投入业务使用。其研发的核心产品被普遍认为是性能表现最接近英伟达的国产 AI 芯片。科大讯飞副总裁江涛曾在一次业绩说明会上透露,该芯片的能力已经基本做到可对标英伟达 A100。
而据时代财经不完全统计,科大讯飞、百度、360、云从科技、智谱 AI 等多家科技企业已在使用该芯片。
事实上,AI 芯片的算力比拼只是第一步,对于国产厂商而言,接下来的生态构建又是新的挑战。多位从业人士、分析师也一致认为,从配套生态、供应链等多个角度看,大模型厂商依旧难以彻底摆脱对英伟达 GPU 的依赖。
这不是一家国内厂商的难题。一位 AI 芯片设计相关的从业者向时代财经记者表示,英伟达于 2006 年发布的 CUDA 平台早已成为应用最为广泛的 AI 开发生态系统,这导致开发者难以脱离英伟达芯片,进行生成式 AI 的研发以及训练。
" 从这个维度看,几乎没有芯片公司可以撼动英伟达的统治地位。" 上述从业者说。
还有上市 AI 企业高管向时代财经记者透露,目前,国产芯片价格基本与英伟达产品一致,且产能出货也难达预期。" 只有成为生态合作伙伴,才能勉强保证供应。"
" 只要渐进就是一个好的趋势 "
对国内大模型厂商而言,增加国产 AI 芯片比重仍是必然之举。
" 保供已经成为一项关键的问题。一方面,美国很有可能会采取各种手段保证自身在人工智能领網域的优势;另一方面,全球局势也可能会影响供应链的稳定。基于这样的预期,市场需要尽早寻得新的方案,这将成为国产 AI 芯片发展的机会。" 陈巍认为。
为抓住这一机会,一众国产 AI 芯片厂商都在重点发力,拓展市场。据寒武纪向时代财经记者提供的资料,旗下思元芯片近期接连宣布与百川智能、智象未来等厂商旗下大模型完成全面适配。
" 生态构建是目标,芯片只是基础,更重要的是在芯片之上构建函括架构平台、軟體工具、作業系統和应用场景等一系列生态体系。英伟达起步早,国产厂商需要快速追赶。" 吴全向时代财经记者分析道。
国际数据公司(IDC)披露数据显示,2023 年上半年,中国加速芯片的市场规模超过 50 万张。在陈巍看来,这是一个能够让那个国产市场份额拉升的机会。" 只要渐进就是一个好的趋势。AI 芯片要在实际应用中才能够发现问题、加快迭代。我们一般认为,市场份额占比超过 15% 之后,生态建设才能真正跑起来。"
吴全形象地将国产 AI 芯片的发展比喻为树木的成长," 目前我们只是种下了一颗小小的树苗,完成了最基本的培育工作。国内企业仍需在技术创新、人才培养、产业链完善等方面付出更多努力。"