DeepSeek头号黑粉这下爽到了

今天小编分享的科技经验：DeepSeek头号黑粉这下爽到了，欢迎阅读。

还真让 DeepSeek 头号黑粉美到了。

北京时间 2 月 25 日，Anthropic 传来两个好消息。

第一个好消息是，Anthropic 发布首个 " 混合模型 "Claude 3.7 Sonnet。在腾讯、阿里、xAI 等纷纷跟上 DeepSeek 的脚步，推出推理模型的时候，Anthropic 说 " 我都要 "，将及时应答和深度思考结合，抛弃了多模型堆砌的做法。

第二个好消息是，在 Claude 3.7 Sonnet 发布的几乎同时，《华尔街 . 日报》称 Anthropic 接近完成 35 亿美元的新一轮融资，估值可能达到 615 亿美元，是此前 180 亿美元估值的 3 倍有余。

Anthropic 有很多头衔。这家公司是 OpenAI" 叛军 " 代表，是硅谷明星人工智能初创公司。同时，在近一个月，该公司还成为了 "DeepSeek 头号黑粉 "，不仅质疑 V3 的 600 万美元训练成本，还由联合创始人之一亲自上阵撰写檄文，呼吁加强美国的芯片出口管制。

如今新模型发布，再加上融资即将超额完成的消息，Anthropic 暂时顶住了 DeepSeek 带来的压力。

这不仅是属于 Anthropic 的好消息，实际上，在华尔街和大众都因 DeepSeek 质疑硅谷的高支出 AI 战略时，Anthropic 的表现证明着神话还未破灭。对 OpenAI 等也在融资的企业来说，也无疑是一个积极的信号。

一

DeepSeek R1 推理模型的推动下，OpenAI 火速上线 o3 mini，马斯克的 xAI 也在上周发布 Grok 3 时带上了 Grok Reasoning。

而 Anthropic 此时选择：来个混合大招。

此前一直传闻 Claude 4 即将发布，但 Anthropic 这次实际上发布的是 Claude 3.7 Sonnet。

Anthropic 称，Claude 3.7 Sonnet 是市面上首款 " 混合模型 "，并将立即投入使用。

此 " 混合 "，指的是业界首个在单一架构上整合实时应答和深度思考的模型。相比而言，不管是 DeepSeek 的 R1 模型，还是 OpenAI 的 o3-mini，都是严格的推理模型。

在使用 R1 和 o3-mini 时，思考过程是强制的，用户只能等待，由此拖慢获取答案的时长。但有的问题实际上并不需要长时间地思考，这时候需要用户来判断并切换到及时应答的模型。

但在 Claude 3.7 Sonnet 这种混合模型中，用户不必切换即可获取实时应答或者深度思考。

" 这个模型融合了所有功能——我们的目标是拥有一个统一的 AI，能适用于各种场景。这样对我们的客户而言会更简单一些。"Anthropic 联合创始人兼首席科学家贾雷德 · 卡普兰表示。

卡普兰将其比作人类大腦的运行方式：有的问题需要深度思考，有的问题需要快速作答。Claude 3.7 Sonnet 将这两种能力整合在同一个模型中，而不是完全分开。

除此之外，用户可以利用 " 草稿 " 功能，在问题比较复杂时，指导模型进行更准确的思考；API 用户还可以精细控制 Claude 3.7 Sonnet 的思考时长，甚至控制思考的预算，如告诉 Claude 在回答时最多思考多少个 tokens。

在模型表现上，相较于上一代 Claude 3.5 Sonnet："Claude 3.7 Sonnet 在遵循指令、一般推理、多模态能力和自主编码方面表现出色，扩展思维在数学和科学方面提供了显著提升。" 值得一提的是，其数学、编码能力提高 10%。其中编码能力尤为突出，在多个测试中有所展现。

根据 SWE Bench 测试数据，Claude 3.7 的代码能力大幅超越 DeepSeek R1、OpenAI 的 o1、o3 模型。专注 AI 编程的 Cursor 已经宣布集成 Claude 3.7 Sonnet。

Claude 3.7 Sonnet 已经全面上线，支持免费版、专业版、团队版和企业版，此外可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用。不过免费用户目前无法使用扩展思考模式。

在定价方面，Claude Sonnet 3.7 的价格为：输入 3 美元 / 百万 tokens，输出 15 美元 / 百万 tokens。这与前代模型保持一致，并显著高于竞争对手的纯推理模型，如 OpenAI o3 mini 和 DeepSeek R1。

在此基础之上，Anthropic 也同步发布了专注于代码的 Agent Claude Code，可以直接在终端运行，帮开发者完成编程任务。

从搜索、阅读代码、编辑檔案、编写代码、运行测试，一直到将代码提交到 GitHub。不过，目前 Claude Code 仅作为有限的研究预览版提供。

二

在发布大模型的同时，Anthropic 正在进行的融资也传来好消息：

《华尔街 . 日报》报道："Claude 背后的公司克服了因中国 DeepSeek 的成功引发的投资者担忧，估值达到 615 亿美元。"

据称，Anthropic 即将完成一轮 35 亿美元的融资，估值将达到 615 亿美元。最新一轮融资的投资者包括风投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。总部位于阿布扎比的投资公司 MGX 也在洽谈参与事宜。

这个数字虽然离 OpenAI 的 1570 亿美元估值还有距离，但是超过了 xAI 去年底的 400 亿美元估值。xAI 也正在寻求融资，预计估值 750 亿美元。

要知道，这次融资之前 Anthropic 的估值还只有 180 亿美元。

知情人士向《华尔街 . 日报》透露，Anthropic 最初计划筹集 20 亿美元，但在和投资者谈判期间成功提高了这一数额。

Anthropic 迎头赶上，甚至拿出 " 要超越你们所有人 " 的架势，这并不令人意外。可以说，今天的两个好消息，都在夯实 Anthropic 被贴在身上的标签。

Anthropic 自 2021 年成立之初，就因其由 OpenAI 前员工创办，而喜提 "OpenAI 叛军 " 的称号。

之前 Anthropic 已经多次抢先 OpenAI 一步。如去年的 " 代理 " 功能，OpenAI 在 Anthropic 之后跟进。

这次发布混合模型，高举 " 反多模型堆砌方案 " 的大旗，也不禁让人想到了 OpenAI CEO 山姆 · 奥特曼前不久发布的 GPT 5 计划。彼时奥特曼就表示，意识到模型和产品功能太复杂，未来将统一。不承想又被 Anthropic 抢先一步了。

Anthropic 的联合创始人卡普兰和迈克 · 克里格都表示，预计竞争对手很快也会转向这种混合模型的方向。

另一方面，在 DeepSeek R1 横空出世之后，Anthropic 俨然化身 "DeepSeek 头号黑粉 "。

对 DeepSeek 的态度，硅谷大佬们大多是赞许中带着苦涩，但言语上还算客气。

如马斯克在 Grok 3 发布前，一边赞许 DeepSeek R1 很强，给中国工程师点赞，但也表示 DeepSeek 带来的不算 AI 领網域的一次突破，并顺势夸赞了自家的模型。

奥特曼一边大赞 DeepSeek" 无疑是令人印象深刻的模型 "，一边暗戳戳地表示 DeepSeek 用 OpenAI 专有模型训练自己的模型，可能违反了其服务条款。后来又 " 大方 " 表示 " 没有起诉 DeepSeek 的计划 "。

而 Anthropic 就很不客气了，不仅压根不相信 DeepSeek V3 的训练成本仅有 600 万美元，甚至创始人之一的达里奥 · 阿莫迪还发布了檄文《关于 DeepSeek 和出口控制》。

文章的核心思想就是，由于 DeepSeek V3 不可能只花了 600 万美元成本，而咱们又听说他们走私了芯片，因此咱们得好好管制一下芯片出口。之前只管 H100 和 H800 这些高端芯片显然是不够的，咱得把 H20 也管起来。

Anthropic 当然不愿意认，虽叫 "OpenAI 叛军 "，但背靠巨头烧钱这方面，二者如出一辙。OpenAI 前有微软后有软银，而 Anthropic 则抱上了谷歌和亚马逊的大腿。

尤其是亚马逊，2023 年就向 Anthropic 投资了 40 亿美元，2024 年又承诺投资 40 亿美元。

而 DeepSeek 的大火又恰逢 Anthropic 进行新一轮融资之时，着急上火也是情理之中的。左手檄文打压 DeepSeek，右手发布及时应答 + 深度思考的混合模型，总算稳住了局面，如果不出意外，这一轮 Anthropic 将超额完成融资目标。

三

Anthropic 的两个好消息，也可以让硅谷暂时松口气了。

正在融资的不止有 Anthropic。

据《华尔街 . 日报》等媒体，OpenAI 正在洽谈巨额融资，拟融资额至多 400 亿美元，估值可能被推高至 3000 亿美元。此外，xAI 也在进行新一轮融资，以 750 亿美元估值寻求 100 亿美元融资。他们无疑也都感受到了 DeepSeek 带来的投资者担忧。

Anthropic 至少证明了，在当下硅谷搞投入的 AI 路径尚未神话破灭，" 大力出奇迹 " 在某种程度上依然可以打动人心，虽然可能需要付出比之前多的游说成本。

但战争远没有结束。

一方面，Anthropic 依然面临着商业化难题，而这一点在后 DeepSeek 时代显得更加刺眼。Anthropic 此前估值和收入比达到 68.6 倍，而 OpenAI 大概在 42.4 倍的水平。

据 The Information，Anthropic 的收入预计将从 2025 年的 22 亿美元激增到 2027 年的 120 亿美元。挑战在于开支，今年 Anthropic 预计 " 烧钱 "30 亿美元，已经比前一年的 56 亿美元低了。公司高层表示，预计到 2027 年可以停止赤字开支，实现盈利。

另一方面，自身商业化难解的同时，外部竞争也在加剧。

Grok 3 刚刚发布，Anthropic 发布混合模型，紧接着谷歌的视频生成模型 Veo 2 API 也曾宣布在年初发布，还有 OpenAI 的 GPT-4.5 随时可能降生，以及 GPT-5 预计在 5 月底发布。

开源的战场也越来越热闹。马斯克的 xAI 延续新代发布、开源上一代模型的做法，宣布将开源 Grok 2。而 OpenAI ——此前和 Anthropic 一起被视为 " 闭源 " 的代表——也松了口，奥特曼面对 DeepSeek 的大火，直接坦言过去站在了 " 错误的一边 "，在社交媒体上发起投票，释放将有一个 " 开源项目 " 的信号。

而眼下，DeepSeek 也没有坐以待毙，而是宣布启动 " 开源周 "，目前已经开源 FlashMLA 的代码，以及 EP 通信库。

Anthropic 顶住了 DeepSeek 的压力，发布混合模型、传出超目标融资的消息。但要让好消息延续，仍有诸多挑战。