美国AI务虚，中国AI务实？我对这个观点不敢苟同

今天小编分享的科技经验：美国AI务虚，中国AI务实？我对这个观点不敢苟同，欢迎阅读。

文 / 观察者网专栏作者余鹏鲲】

自从 ChatGPT 面世以来，大部分 AI 相关新闻的热点版面都被美国企业和它们的技术突破霸占了。通过世界各国媒体的介绍，美国企业的 " 文生文 " 以及 " 文生视频 " 的 AI 模型已然是家喻户晓。农历新年之后，美国 AI 的热度依然居高不下。

2 月 12 日，英伟达 CEO 黄仁勋在迪拜举行的世界政府峰会中呼吁世界各国构建自己的主权 AI 基础设施。在与阿联酋人工智能大臣奥马尔 · 奥拉马的公开谈话中，黄仁勋认为：每个国家都需要拥有自己的 AI 基础设施，以便在保护自己文化的同时利用其经济潜力。

迪拜作为本届世界政府峰会的主办方，认为 " 塑造未来政府 " 的主题与人工智能息息相关。而目前世界上大部分的 AI 算力，都是由英伟达的显卡提供的，黄仁勋虽然不是国家和非政府组织的领导人，也受邀参加了此次峰会。

当地时间 2 月 15 日，旧金山的科技企业 OpenAI 发布了 " 文生视频 " 模型 Sora。通过 Sora 生成的视频不仅真实感强，而且支持多视角，时间成本也有所减少。这样的效果极大地震撼了对 AI 所知不多的普通人，甚至让一些人产生了工作即将被 AI 代替的焦虑。

Sora 生成的视频中的一帧（图自 OpenAI 官网）

与百花齐放的 AI 模型相比，AI 硬體基本上是英伟达一家独大，AI 的编程模型也十分依赖英伟达的 CUDA 作为应用程式的开发接口（API）。因此，很多 AI 应用的开发者十分期待出现一个能与英伟达分庭抗礼的 AI 硬體厂商。

英伟达构建的显卡计算生态

近期，多家媒体报道了一家名为 Groq 的加州 AI 企业。据称该企业研发的加大语言处理单元（LPU）芯片，在与英伟达 H100 显卡同样进行生成式 AI 推理时，推理速度快了 10 倍，消耗电能却只有 1/10。

经过笔者的查证，其实该公司在去年 11 月底就发布了这一成果。重新引发关注的原因，可能是该公司宣称 LPU 的提出受到了中国正在研发的 " 神威 · 海洋之光 " 超级计算机的启发。

不过当时就有媒体指出：AI 领網域的初创公司 " 都声称性能比英伟达好 10 倍 "。曾任阿里技术副总裁的贾扬清算了一笔账，Groq 的 LPU 在大部分情况下的拥有成本和采购成本，还是明显高于 H100 显卡。

因此目前看来，英伟达和 CUDA 生态是难以撼动的。这一点也体现在英伟达的财报上。

2 月 22 日，英伟达发布了 2024 财年第四季度及全年财务业绩，全年净利润增长近 6 倍。除了利润增长高得吓人，2024 财年的毛利率也达到了 72.7%，充分体现了高科技行业的高收益。

英伟达财务摘要

受 " 完美财报 " 影响，2 月 22 日英伟达股票暴涨 16%，市值增加了 2733 亿美元，约合人民币 2 万多亿。按市值算，相当于 1 天就创造了 1 个贵州茅台或 3 个宁德时代。

美国 AI 大模型频频登上热搜，美国的 AI 芯片厂商又是如此强势。于是自然有人提问：为什么人工智能的突破进展总是出现在美国？还有这样一种担心：Sora 等模型产品出现在美国，中国 AI 的发展变被动了么？

针对这些问题，《环球时报》采访了全国政协委员、360 创始人周鸿祎，他认为中美 AI 的差距主要在 " 确定技术方向 " 上，中国的优势是学习能力很快，中美在 AI 上的差距应该能在一两年内追上。

但周鸿祎的说法毕竟只是一家之言，美国 AI 企业在确定技术方向上的能力到底强不强？如果确实强，那又是强在哪里呢？

确定技术方向，确有过人之处

与周鸿祎相反，部分网民出于朴素的民族感情，认为以 ChatGPT 为代表的 " 文生文 " 模型，以及 Sora 等 " 文生视频 " 模型缺乏明确地工业适用场景，是一种屠龙术式的技术突破。尽管显得技术高超，实际作用却很小。甚至有人明确提出：美国 AI 务虚，中国 AI 务实，并认为中国 AI 发展路线远较美国为强。

从细节上讲，这样的说法是有道理的。在 AI 产业中，热门的研究问题通常具有两个特征：

1. 人类不擅长，而计算机擅长；

2. 人类由于定势思维和文化传统，错误地认为这些问题集中体现了人类的 " 高级智慧 "，是人类擅长的问题。

从 AlphaGo 开始，到最近的 ChatGPT 和 Sora，都体现了这一规律。

例如，围棋从来都不是人类擅长的，普通人早就下不过 AI 了。只是围棋在东亚社会文化上具有较高的社会影响力，吸引了一大批记忆力远超于常人的天才投身到这项运动中，使得 AI 需要发展这么多年，才能追上人类最高水平选手。

围棋在中日韩具有崇高的文化地位

同时，几乎所有国家的传统都认为在棋类运动中领先，需要较强的把握局面的能力以及深谋远虑。并衍生出 " 入界必缓 "、" 攻彼顾我 "、" 势孤取和 "、" 棋品如人品 " 等等文化谚语。但实际上，棋类比赛往往需要的是记忆和检索大量信息的能力，而这显然是计算机擅长的。

对于 ChatGPT，网民有这样一个玩笑：" 除了用于工作的时候，ChatGPT 还挺智能的 "。虽然是玩笑，但精准反应了目前 " 文生文 " 模型的缺点。对内容相对固定的上传下达等工作，这些技术还十分有用。一旦对内容的正确性和风格有要求，相关技术的效率就直线下降。

因此，这些模型只是基础，还需要大量的标记和重新训练，才能应用到实际的工业场景。

但若是据此得出结论：美国 AI 务虚，中国 AI 务实，笔者就很难苟同了。因为这正是美国 AI 厂商希望看到的。

黄仁勋呼吁各国建立主权 AI 基础设施，他说：" 它编纂了你的文化、你的社会智慧、你的常识、你的历史——你拥有你自己的数据 "。

从表面上看，这没错，ChatGPT 也好，Sora 也罢。如果能用各国本地语言重新进行标记和训练，当然比依赖翻译输入的方式更好。

如果按黄仁勋的提议，各国都建立了主权 AI。人们难免会好奇美国的主权 AI 和其他国家的主权 AI 有什么区别。

显然，美国主权 AI 是扩张性的，在这里投入的每一分钱，都能从国际上赚来多得多的钱。美国的主权 AI 具有最强的基础功能性和技术扩散性，各国的主权 AI 能达到什么水平和效率，深度依赖美国主权 AI 提供的工具。

很多国家即使主权 AI 建设成功，也是防御性的、自保性的、甚至面子性的，很多投入最后仅仅变成了一种消费，购买的还是美国的 AI 商品。同时，如果各个发展中国家把 AI 主权化，互不共享市场，必然造成大量的重复建设，美国 AI 芯片厂商则在这个过程中赚的盆满钵满，这才是真正的关键！

随着一些媒体，尤其是美国媒体对 AI 可能侵犯隐私权、AI 应用存在伦理风险、AI 威胁人类、AI 应用收益巨大等方面的过度渲染。AI 应用获取必要数据的法律门槛和实际成本正在上升，这也为 AI 应用企业的未来发展蒙上了阴影。

同时，如果中国 AI 局限于应用，那就只能赚一点辛苦钱。AI 的落地需要海量数据以及冗繁复杂的数据标记。在目前 AI 应用的模式下，数据训练的通用性不强。换一个行业甚至应用场景，就意味着基本需要重头开始。因此 AI 应用企业做的再大，也还是劳动密集型的，这与产业转型的方向背道而驰。

而只有做 AI 模型和做 AI 硬體的，因其技术扩散性强，才有可能实现 72.7% 的毛利率。中国产业链的 " 由大到强 "，从资本指标的角度上说，就是要把利润率和产业规模都提高上去，因此中国 AI 的未来也要做关键技术（如 " 文生文 " 模型）和关键硬體。

因此，正如周鸿祎所说：" 我一直坚持这么说，看到差距才知道怎么迎头赶上。承认差距不是坏事，认为我们所有都遥遥领先了，那就（不行了）"。中美 AI 企业的差距，尤其是在确定关键技术上的差距，是客观存在的，不是宣传出来的，更不是凭空造出来的。

前置技术起步早，是美国 AI 硬體强的最主要原因

与很多芯片相比，显卡和大部分 AI 軟體使用的 GPU 芯片很晚才步入高速发展期。现在如日中天的英伟达，其实直到 1993 年才创立，1997 年才第一次推出高性能的 GPU 芯片，而 CPU 的巨头英特尔早在 1968 年就创立了。即使是 2008 年前的英伟达，为 AMD 生产 PC 主機板也是其重要业务，并不是一家纯粹的 GPU 设计企业。

因此在一些人看来，中国是有可能赶上 GPU 时代的，他们将现状简单地归结为 " 管得太宽 " 和 " 道德审判 " 影响了中国游戏的发展，进而拖累了 GPU 芯片和 AI。

这种说法是不客观的。美国计算机发展很早，人才储备相对充分。20 年前中国计算机人才相当匮乏，因此首先要布局门槛较低、应用性较强的领網域，先把规模做大。然后就是要对产业的 " 制高点 " 集中精力进行突破，避免被先发国家卡脖子。既不可能盲目追求 " 高精尖 "，也不可能只布局新技术。

冯诺依曼的计算机结构体系决定了 CPU 和内存是计算机硬體的核心。其中内存领網域竞争相对充分，其技术分散在多个国家，通过内存 " 卡脖子 " 难度较大。而高性能的 CPU 基本上被美国垄断了，也经常成为美国技术禁运的对象。

因此在新世纪之初，中国不得不首先集中精力，攻克高性能 CPU 的问题。龙芯、申威、飞腾等项目都是为了这一目的而生的。纵观世界，不管是有发达游戏产业的日本，还是没有发达游戏产业的俄罗斯均遵循了这一思路。即使有发达的游戏产业，日本过去仍然将自主 CPU 作为日本信息产业重点突破瓶頸的项目，中国没有在上世纪 90 年代和本世纪初重点发展 GPU 也就不足为奇了。

甚至美国的另一个芯片巨头 AMD，也是在 CPU 有了较强的竞争力后，才收购 ATI 进入 GPU 芯片设计领網域，并在今天成为一个虽与英伟达有较大差距，却稳居综合实力第二的 GPU 巨头。

而且做 GPU 芯片的难度主要体现在軟體生态和商业运作上，把性能做到与目前顶尖水平差距不超过 10 倍，难度并没有那么大。正如龙芯总裁胡伟武所说：有了高性能 CPU，再做 GPU 就不难了。中国很早就解决了军用 GPU 芯片的问题，甚至都没引起多大的关注。

2022 年 10 月，英特尔时隔多年再次涉足游戏独立显卡，其最高端的 A770 的理论性能几乎达到了英伟达当时中高端游戏显卡的水平。国内的摩尔线程也紧随其后发布了国产显卡天花板 MTT S80（售价 1199 元，少量发售），理论性能达到了当时英伟达的甜品卡水平。

国产显卡天花板 MTT S80

当然在实际游戏中，A770 体现不出理论性能，驱动也不够完善。而国内的 MTT S80 则距离理论性能更远，驱动更不稳定。但值得一提的是，通过一年多坚持完善驱动，MTT S80 在许多游戏中的性能有了成倍的提高，发展势头令人欣喜。

定量地说，前文提到的 H100 单精度性能为 66.91TFlops。但这是英伟达专为 AI 设计的芯片，价格高达 2.4 万美元，功耗达到 700W，十分夸张。当时英伟达最强的游戏显卡 RTX 3090 Ti 的单精度性能为 40.00TFlops，而英特尔的 A770 为 17.20TFlops，摩尔线程的 MTT S80 为 14.40TFlops。

可以说中国的显卡与国际先进水平已不存在代差，而中国也成为美国之外唯一同时具备高性能自主 CPU 和自主 GPU 的国家。同时也说明了，中国在当时条件下的信息产业决策是没有太大问题的。

至于美国 AI 芯片强一些，主要是由于先发优势较大造成的。而中国的相对落后，主要是历史上 " 缺课 " 太多，" 补课 " 的影响太大造成的，对游戏监管较严的影响被高估了。

监管弹性大，" 助攻 " 英伟达的发展

不过站在英伟达的角度，它能成长为今天的巨头，与美国对游戏灵活的监管态度是密不可分的。

黄仁勋决定做英伟达时，已经在一家芯片设计企业 LSI Logic 做到了主管，并且有一儿一女，家庭也需要照顾。在做决定前，作为华裔，黄仁勋与父母有过一番沟通。当知道影像芯片的主要功能是玩游戏时，他母亲不禁发问：" 为什么不找一份工作呢？"

黄仁勋回忆创业时与家人的谈话（字幕由 Web3 天空之城制作）

显然，如果黄仁勋母亲的观点在社会上占据了压倒性的地位，美国的 GPU 芯片和游戏产业是无论如何发展不到今天的程度的。

事实上，为了阻止孩子沉迷游戏，美国家长采取过包括公开宣传、游说立法、抗议示威、要求通过相关法律、起诉游戏开发商等等手段。作为教育的一种方式，部分家长采取了强制孩子参加夏令营等方式，希望他们能够远离 " 不良诱惑 " 和 " 电子垃圾 "。

伴随着对游戏的抵制，美国社会同样存在着反对过分限制游戏的声音。德州大学的经济学家迈克尔 · 沃德以坚持用数据衡量游戏的影响而闻名一时，根据他的研究，暴力游戏从总体上与犯罪率无关。

最终美国对游戏采取了灵活管控策略，像《Manhunt》这样的游戏，不仅血腥暴力，而且推崇通过猎奇的方式杀害游戏中其他对象，还会诱导玩家消除痕迹，就被严格禁止。如果一款游戏，已经出现了高度明确的模仿作案，也很有可能被禁止。

一些性质类似，但程度较轻的游戏，则会被要求整改。为了避嫌，美国游戏行业创造了 ESRB 等游戏分级制度，通过互相监督的方式评级，对可能接触暴力情节的玩家年龄进行了限制。未经分级的游戏，则几乎难以流通和购买。

此外，中国对游戏限制也引得不少美国家长热议：应当限制未成年人每日电子游戏的时间。

目前对 AI 也有很多质疑甚至阴谋论的成分。AI 的缺点和弱点被淡化了，而优点则被不合常理的夸大了。影响最大的是几乎不提目前 AI 应用的庞大成本，而无限拔高对产值的刺激作用。这种误解深入人心，就很可能制约传统企业与 AI 应用开发公司达成合作。

高效的投资孵化环境使新技术难被埋没

对于美国 AI 企业而言，学术界和产业界的区别很小，甚至可以说先天就是高度联合的。但这种联合不是平等的联合，创造商业价值的重要性明显更突出一些。

Sora 模型的提出者 OpenAI 旗下的很多研究员发表过不少高水平的论文，但主要是写作时间较短的会议论文，更耗时间的期刊论文则几乎没有检索到。OpenAI 团队曾将构建 Sora 模型的技术基础投稿到知名会议 CVPR 2023，结果被以 " 缺乏创新 " 为由拒绝了，但最终被 ICCV 2023 接收。

论文首图过于跳脱和行文不够学术的风格，可能是被拒的重要原因

我想即使所有知名的学术会议都认为这项工作缺乏创新，OpenAI 的团队也不会气馁，因为他们已经在商业上证明了自己。整个 Sora 研发中烧掉的经费可能达到数亿美元，大部分团队没有这样的机会。

重仓 Sora 这样一个还存在许多未被解决的重大挑战的模型，而且商业前景尚不明朗，每个投资人恐怕都需要慎重地思考。但没有这样的风险投资，科技进步的速度就不会这么快。

市场和高校两条腿走路，有利于促进科技创新。如果市场对技术前景的甄别作用不强，或者干脆放弃投资前人没有做过的东西。那么即使出现一些产业化特色强的研究，也往往是 " 功夫在诗外 " ——强调产业应用特色是为了获得更好的论文发表机会，最终还是难免科研与产业两张皮的问题。

英伟达当时也是被孵化的幸运儿，作为第一家明确提出以开发 3D 影像处理芯片为己任的公司，几乎没有投资者知道这样的芯片有什么用。当时的 2D 影像处理芯片已经比较完善了，而且 2D 影像处理芯片的市场潜力好像已经不大了。根据亲历者的回忆，很多投资人是在不理解的情况下，通过过去风险控制评估经验，并基于对黄仁勋等创业者的信任进行了投资。

这样的投资一定是有风险的，可是有相当一部抽成功了，而且回报巨大。不难想象，在这样的环境中一种具备产业前景的新技术是很有可能得到大规模应用的。

坦白地说，目前我们的高技术投资环境与这样的目标还存在着差异。但笔者对未来充满着信心。

如果说过去没有首先发展 GPU 芯片，是 " 补课 " 的需要和时代的局限，那么投资环境也不是一成不变的。随着高等教育率的提高，以及成熟领網域的商业竞争愈发白热化，国内投资的品味和风险偏好也必然向科技驱动转变，而且可能很快就会发生。