大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科技

DeepSeek+华为,能不能超越英伟达和Open AI?

2025-02-26 简体 HK SG TW

今天小编分享的科技经验:DeepSeek+华为,能不能超越英伟达和Open AI?,欢迎阅读。

‍‍‍

DeepSeek 开源动作仍在持续,引发了 AI 圈又一轮震荡。

2 月 21 日 12 点,DeepSeek 团队在 X 平台发布了一段英文内容。简单解释一下,其实说的就是:" 从下周开始,我们将开源 5 个代码仓库,以完全透明的方式分享我们微小但真诚的进展。"

紧接着在 2 月 24 日,DeepSeek 就开源了首个代码库 FlashMLA。

用咱们得到 App  AI 学习圈主理人快刀青衣老师的话说,能做出这样的行动,是非常有魄力的。他打了一个比方:之前开源的是工作成果,就像一个老师傅,把他所有的经验无私传授给你。而现在,你不但能拿到老师傅的秘籍,还能看到老师傅在过程中是怎么干活儿的。这对很多人来说,会比结果更有价值。

当然,各国网友对 DeepSeek 这一动作都不乏赞美之辞,反响十分热烈。

今天我们先不细究代码库 FlashMLA 的工作原理,而是想来聊一下,从 DeepSeek R1 发布以来许多人在思考的一个问题:真正具有 " 开源精神 " 的DeepSeek 加上华为,能不能超越英伟达和 Open AI?

正好前不久,咱们得到的万维钢老师,在他的专栏里花大篇幅回答了这个问题。本文选自《万维钢 · 精英日课 6》,文中万老师用更全面、更长远的视角,探讨了为什么 AI 需要越来越强的算力,以及中国为什么要突破芯片技术限制、坚持长期投入通用人工智能研发等问题。

下面,请万维钢老师为你分享:

作者:万维钢

来源:《万维钢 · 精英日课6》

01

对算力的需求永无止境

DeepSeek 采用了一些巧妙的优化方法,能够用比较少的算力实现 o1 级别的功能,这非常了不起,这对中国——也对美国——的大模型研发者都是天大的好消息。

但这绝不是说以后英伟达那种高级芯片就没用了,咱国产芯片就够用了。现在 AI 缩放定律远远没有看到尽头,更高的智能要求更高的算力这个根本原则并没有变。

要知道就算没有 DeepSeek,别家公司和科研团队,包括 OpenAI 自己,也在优化模型性能,再考虑到英伟达芯片更新,用山姆 · 奥特曼的话说就是 " 模型输出成本每年都会降低十倍 "(即降至原来的十分之一)。

假设 DeepSeek 突破之前那一刻,OpenAI 用 100 的算力得到 100 的智能,DeepSeek 突破了,大家用 10 的算力就能得到 100 的智能——但你的目标不是 100 的智能,而是一万、甚至一百万的智能,所以你仍然需要比目前高出百倍千倍的算力。

所以对算力的需求目前来说还是无止境的。

但英伟达并非高枕无忧,美国有好几家公司在做自己的 AI 芯片,中国也有包括华为、寒武纪、百度、壁仞科技等等正在追赶。那么国产 AI 芯片的水平相对于英伟达来说到底如何呢?国产最强的是华为昇腾。

我让 ChatGPT Deep Research 调研并且制作了下面这张表格,把华为昇腾和英伟达近几年的主流 GPU 做了个对比——

这个结果可以说是既不让人悲观,又不让人乐观。当前能用的最强国产 GPU 是 2022 年发布的华为昇腾 910B,它的性能在某种意义上已经略微超过目前仍然被很多 AI 公司广泛使用的、英伟达 2020 年发布的 A100。这很重要,这说明就算美国对中国搞全面断供,中国也能继续训练 AI。

但 910B 比英伟达目前的当家芯片,2023 年发布的 H200 和 24 年发布的 B100,就差距比较大了,算力大致相当于英伟达的二分之一到四分之一。华为 2025 年即将量产昇腾 910C,基础算力与 910B 差不多,推理性能据说达到英伟达之前 H100 的 60%。但英伟达 2025 年会推出 GX200,算力预估是 910C 的五倍。

02

高级智能一定是通用智能

为什么英伟达在继续突飞猛进,而华为有点接近极限的意思?

这里最重要的原因就是光刻制程。

英伟达 A100 和华为昇腾系列都是 7 纳米制程,在这个尺度上中芯国际能做。只是在 910C 这个级别要求 N+2 制程,中芯国际的良率据说很低,这意味着生产成本高。而英伟达 H 系列、B 系列、GX 系列分别是 5 纳米、4 纳米、3 纳米制程,中芯国际做不了。

因为中国大陆没有极紫外光刻机。《精英日课》讲《芯片战争》一书的时候说过,极紫外光刻机极其不可能靠一个国家完全独立自主造出来,现在看至少未来十年之内可能性不大。

所以当前最可行的办法,还是从英伟达买。

那你说现在 DeepSeek 已经很好用,我们就在这个基础上提升性能行不行,何必非得追求最高的性能呢?我认为那是万万不行的。

要知道 DeepSeek 是个相对比较小的模型,它是可以跟 o1 对标,但 o1 也不是超大模型。

就在 2025 年下半年,也许更早,OpenAI 会推出 GPT-5,那将是一个超大的模型。它会像现在 GPT-4o 一样拥有端对端训练出来的多模态,它将不但能阅读影像,而且能阅读视频和音频,它将能处理海量的数据——所以它需要很多张 GPU。DeepSeek 不会放弃这种模型。

再者,更重要的是,AGI、以及紧接着更重要的 ASI,就是需要超大的算力—— 因为高级智能一定是通用智能。

DeepSeek R1 的效率高,有很多独创性的技术,但是我们也不能否认,其中有一定以牺牲宽度换取效率的成分。

R1 和之前的 V3 都是「混合专家(mixed experts)」模式,是可能最早法国的 Mistral 模型先采用的,是把智能分散开成若干个专家模块,每次遇到新任务就只调用相关的模块,而不必「全腦」一起思考,这就大大节省了算力。

这个做法相当于你问我数学题我就用数学模块,问我古诗词我就用古诗词模块。但我们设想,对于更复杂的问题,也许就是需要同时调用几个领網域的知识和思维模式才能解决。

特别是创造力总是来自不同想法的连接,那么这个模块分割法就会限制发挥。再者,DeepSeek 专注于数学、编程和语言处理这几个领網域,也是为了节省算力不得不为之。

就在最近,斯坦福大学李飞飞的团队发明了一个更激进的做法,号称只用不到 50 美元(有个说法是 6 美元)的训练费用就弄出一个数学解题水平跟 R1、o1 差不多的推理模型,叫 S1。他们是怎么做的呢?

第一,从开源的通义千问(qwen)的一个小版本语言模型开始,省去前期大规模的训练;

第二,用一千道精选数学题专门训练数学解题能力,且只训练数学能力;

第三,用 Google Gemini 的一个推理版本的推理过程的蒸馏数据来训练自己的推理能力。

这个做法,就如同找个腦子快的孩子,给他一套精选习题集,让他背诵别人的解题套路。这样训练做题家当然快,但是这除了快没有别的贡献。这个做法不会像 R1 那样涌现出任何新能力,不会给你任何惊喜。

这不是通往 AGI 之路。

03

更多的参数 + 更长的思考时间 = 更好的答案

梁文锋胸怀大志,绝对不只是想提供一个便宜的做题家,而是想做 AGI。接下来的情形,我估计,差不多是下面这样的——

对于一般的日常任务,比如一般编程、搞个会议纪要、写个汇报工作的发言稿、弄个报表之类,只要用普通模型就可以,中国不但没问题而且可能有价格和服务上的优势,也许中国的模型是最好的。

但对于科研任务,特别是探索最前沿突破,你需要能想得很广而且很深,你需要尽可能地堆积算力。我有个说法是如果一个科研团队愿意花 5000 美元问 ChatGPT 一个问题,而另一个同样水平的科研团队愿意花一万美元,那么后者将得到更好的答案——仅仅是因为模型愿意为他们思考更长时间。

只要缩放定律仍然有效,那么,更多的参数 + 更长的思考时间 = 更好的答案

也是更值钱的答案。接下来 AI 在科研领網域会大有作为,科研发现的速度会加快,所以争夺会非常激烈。一种新药只能被发现一次,谁先做出来就是谁的。

还有一个在我看来最重要的考虑,是谁先达到 ASI。

我们这里不妨定义ASI 是「自己可以训练自己」的超级人工智能。那么谁先达到 ASI,谁就等于是获得了一个绝对的领先优势。这就相当于战略游戏里谁先造出「奇观」来,能大大加强自己的战略优势。

试想如果美国率先达到 ASI,那就意味着以后的路全打通了,剩下的事只是给 AI 喂芯片喂电力而已,不需要人类科学家再有奇思妙想,可谓是高枕无忧——那到时候中国怎么办呢?还靠一帮人努力追赶吗?

庆幸的是中国有个 DeepSeek。就在 DeepSeek 的论文中,已经透露出一点迹象,模型自己给自己提出了一个算力优化策略。你可以说梁文锋已经看到了 ASI 的光线。我们设想 OpenAI 肯定也有类似的东西,但他们从未公开过。

DeepSeek 震撼美国这段时间,Anthropic CEO 达里奥 · 阿莫迪(Dario Amodei)有一些公开言论,很耐人寻味。他说如果不限制中国发展 AI,那会对全人类都有好处,我们会迎来突飞猛进的十年——但是中国会把 AI 用于军事,而这对美国很不利,所以他呼吁美国政府加强对中国 AI 的限制。他还说,真希望 DeepSeek 团队到美国来为他们公司工作。

这些言论在 X 上遭到了美国网友的围攻。首先你作为一个科技公司 CEO 去强调地缘政治,这本身就是错的:科技应该为全人类服务。再者你咋这么会想呢?人家 DeepSeek 凭啥到美国来帮你干?

这些言论进一步说明了 DeepSeek 的战略意义。接下来美国政府有可能加强对中国 AI 的限制,甚至完全脱钩,但也有可能松动英伟达的出口管制,毕竟跟特朗普什么都可以谈。不论如何,我们必须认准 ASI 这个大方向,而绝对不能满足于解解数学题、日常编程那些任务。

总想四两拨千斤、少花钱多办事儿、以 20% 的投入解决 80% 的问题,那是走不远的。

中国必须有人宁可选择费力又费钱的路。

万老师是前物理学家,现科学作家,得到 App《万维钢 · 精英日课》主理人。万老师从 2016 年起,在得到 App 开设《精英日课》年度专栏,至今已更新到第 6 季,累计超过 70 万人次订阅追随。欢迎你加入正在更新的《万维钢 · 精英日课 6》。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們