今天小编分享的科技经验:DeepSeek头号黑粉这下爽到了,欢迎阅读。
还真让 DeepSeek 头号黑粉美到了。
北京时间 2 月 25 日,Anthropic 传来两个好消息。
第一个好消息是,Anthropic 发布首个 " 混合模型 "Claude 3.7 Sonnet。在腾讯、阿里、xAI 等纷纷跟上 DeepSeek 的脚步,推出推理模型的时候,Anthropic 说 " 我都要 ",将及时应答和深度思考结合,抛弃了多模型堆砌的做法。
第二个好消息是,在 Claude 3.7 Sonnet 发布的几乎同时,《华尔街 . 日报》称 Anthropic 接近完成 35 亿美元的新一轮融资,估值可能达到 615 亿美元,是此前 180 亿美元估值的 3 倍有余。
Anthropic 有很多头衔。这家公司是 OpenAI" 叛军 " 代表,是硅谷明星人工智能初创公司。同时,在近一个月,该公司还成为了 "DeepSeek 头号黑粉 ",不仅质疑 V3 的 600 万美元训练成本,还由联合创始人之一亲自上阵撰写檄文,呼吁加强美国的芯片出口管制。
如今新模型发布,再加上融资即将超额完成的消息,Anthropic 暂时顶住了 DeepSeek 带来的压力。
这不仅是属于 Anthropic 的好消息,实际上,在华尔街和大众都因 DeepSeek 质疑硅谷的高支出 AI 战略时,Anthropic 的表现证明着神话还未破灭。对 OpenAI 等也在融资的企业来说,也无疑是一个积极的信号。
一
DeepSeek R1 推理模型的推动下,OpenAI 火速上线 o3 mini,马斯克的 xAI 也在上周发布 Grok 3 时带上了 Grok Reasoning。
而 Anthropic 此时选择:来个混合大招。
此前一直传闻 Claude 4 即将发布,但 Anthropic 这次实际上发布的是 Claude 3.7 Sonnet。
Anthropic 称,Claude 3.7 Sonnet 是市面上首款 " 混合模型 ",并将立即投入使用。
此 " 混合 ",指的是业界首个在单一架构上整合实时应答和深度思考的模型。相比而言,不管是 DeepSeek 的 R1 模型,还是 OpenAI 的 o3-mini,都是严格的推理模型。
在使用 R1 和 o3-mini 时,思考过程是强制的,用户只能等待,由此拖慢获取答案的时长。但有的问题实际上并不需要长时间地思考,这时候需要用户来判断并切换到及时应答的模型。
但在 Claude 3.7 Sonnet 这种混合模型中,用户不必切换即可获取实时应答或者深度思考。
" 这个模型融合了所有功能——我们的目标是拥有一个统一的 AI,能适用于各种场景。这样对我们的客户而言会更简单一些。"Anthropic 联合创始人兼首席科学家贾雷德 · 卡普兰表示。
卡普兰将其比作人类大腦的运行方式:有的问题需要深度思考,有的问题需要快速作答。Claude 3.7 Sonnet 将这两种能力整合在同一个模型中,而不是完全分开。
除此之外,用户可以利用 " 草稿 " 功能,在问题比较复杂时,指导模型进行更准确的思考;API 用户还可以精细控制 Claude 3.7 Sonnet 的思考时长,甚至控制思考的预算,如告诉 Claude 在回答时最多思考多少个 tokens。
在模型表现上,相较于上一代 Claude 3.5 Sonnet:"Claude 3.7 Sonnet 在遵循指令、一般推理、多模态能力和自主编码方面表现出色,扩展思维在数学和科学方面提供了显著提升。" 值得一提的是,其数学、编码能力提高 10%。其中编码能力尤为突出,在多个测试中有所展现。
根据 SWE Bench 测试数据,Claude 3.7 的代码能力大幅超越 DeepSeek R1、OpenAI 的 o1、o3 模型。专注 AI 编程的 Cursor 已经宣布集成 Claude 3.7 Sonnet。
Claude 3.7 Sonnet 已经全面上线,支持免费版、专业版、团队版和企业版,此外可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用。不过免费用户目前无法使用扩展思考模式。
在定价方面,Claude Sonnet 3.7 的价格为:输入 3 美元 / 百万 tokens,输出 15 美元 / 百万 tokens。这与前代模型保持一致,并显著高于竞争对手的纯推理模型,如 OpenAI o3 mini 和 DeepSeek R1。
在此基础之上,Anthropic 也同步发布了专注于代码的 Agent Claude Code,可以直接在终端运行,帮开发者完成编程任务。
从搜索、阅读代码、编辑檔案、编写代码、运行测试,一直到将代码提交到 GitHub。不过,目前 Claude Code 仅作为有限的研究预览版提供。
二
在发布大模型的同时,Anthropic 正在进行的融资也传来好消息:
《华尔街 . 日报》报道:"Claude 背后的公司克服了因中国 DeepSeek 的成功引发的投资者担忧,估值达到 615 亿美元。"
据称,Anthropic 即将完成一轮 35 亿美元的融资,估值将达到 615 亿美元。最新一轮融资的投资者包括风投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。总部位于阿布扎比的投资公司 MGX 也在洽谈参与事宜。
这个数字虽然离 OpenAI 的 1570 亿美元估值还有距离,但是超过了 xAI 去年底的 400 亿美元估值。xAI 也正在寻求融资,预计估值 750 亿美元。
要知道,这次融资之前 Anthropic 的估值还只有 180 亿美元。
知情人士向《华尔街 . 日报》透露,Anthropic 最初计划筹集 20 亿美元,但在和投资者谈判期间成功提高了这一数额。
Anthropic 迎头赶上,甚至拿出 " 要超越你们所有人 " 的架势,这并不令人意外。可以说,今天的两个好消息,都在夯实 Anthropic 被贴在身上的标签。
Anthropic 自 2021 年成立之初,就因其由 OpenAI 前员工创办,而喜提 "OpenAI 叛军 " 的称号。
之前 Anthropic 已经多次抢先 OpenAI 一步。如去年的 " 代理 " 功能,OpenAI 在 Anthropic 之后跟进。
这次发布混合模型,高举 " 反多模型堆砌方案 " 的大旗,也不禁让人想到了 OpenAI CEO 山姆 · 奥特曼前不久发布的 GPT 5 计划。彼时奥特曼就表示,意识到模型和产品功能太复杂,未来将统一。不承想又被 Anthropic 抢先一步了。
Anthropic 的联合创始人卡普兰和迈克 · 克里格 都表示,预计竞争对手很快也会转向这种混合模型的方向。
另一方面,在 DeepSeek R1 横空出世之后,Anthropic 俨然化身 "DeepSeek 头号黑粉 "。
对 DeepSeek 的态度,硅谷大佬们大多是赞许中带着苦涩,但言语上还算客气。
如马斯克在 Grok 3 发布前,一边赞许 DeepSeek R1 很强,给中国工程师点赞,但也表示 DeepSeek 带来的不算 AI 领網域的一次突破,并顺势夸赞了自家的模型。
奥特曼一边大赞 DeepSeek" 无疑是令人印象深刻的模型 ",一边暗戳戳地表示 DeepSeek 用 OpenAI 专有模型训练自己的模型,可能违反了其服务条款。后来又 " 大方 " 表示 " 没有起诉 DeepSeek 的计划 "。
而 Anthropic 就很不客气了,不仅压根不相信 DeepSeek V3 的训练成本仅有 600 万美元,甚至创始人之一的达里奥 · 阿莫迪还发布了檄文《关于 DeepSeek 和出口控制》。
文章的核心思想就是,由于 DeepSeek V3 不可能只花了 600 万美元成本,而咱们又听说他们走私了芯片,因此咱们得好好管制一下芯片出口。之前只管 H100 和 H800 这些高端芯片显然是不够的,咱得把 H20 也管起来。
Anthropic 当然不愿意认,虽叫 "OpenAI 叛军 ",但背靠巨头烧钱这方面,二者如出一辙。OpenAI 前有微软后有软银,而 Anthropic 则抱上了谷歌和亚马逊的大腿。
尤其是亚马逊,2023 年就向 Anthropic 投资了 40 亿美元,2024 年又承诺投资 40 亿美元。
而 DeepSeek 的大火又恰逢 Anthropic 进行新一轮融资之时,着急上火也是情理之中的。左手檄文打压 DeepSeek,右手发布及时应答 + 深度思考的混合模型,总算稳住了局面,如果不出意外,这一轮 Anthropic 将超额完成融资目标。
三
Anthropic 的两个好消息,也可以让硅谷暂时松口气了。
正在融资的不止有 Anthropic。
据《华尔街 . 日报》等媒体,OpenAI 正在洽谈巨额融资,拟融资额至多 400 亿美元,估值可能被推高至 3000 亿美元。此外,xAI 也在进行新一轮融资,以 750 亿美元估值寻求 100 亿美元融资。他们无疑也都感受到了 DeepSeek 带来的投资者担忧。
Anthropic 至少证明了,在当下硅谷搞投入的 AI 路径尚未神话破灭," 大力出奇迹 " 在某种程度上依然可以打动人心,虽然可能需要付出比之前多的游说成本。
但战争远没有结束。
一方面,Anthropic 依然面临着商业化难题,而这一点在后 DeepSeek 时代显得更加刺眼。Anthropic 此前估值和收入比达到 68.6 倍,而 OpenAI 大概在 42.4 倍的水平。
据 The Information,Anthropic 的收入预计将从 2025 年的 22 亿美元激增到 2027 年的 120 亿美元。挑战在于开支,今年 Anthropic 预计 " 烧钱 "30 亿美元,已经比前一年的 56 亿美元低了。公司高层表示,预计到 2027 年可以停止赤字开支,实现盈利。
另一方面,自身商业化难解的同时,外部竞争也在加剧。
Grok 3 刚刚发布,Anthropic 发布混合模型,紧接着谷歌的视频生成模型 Veo 2 API 也曾宣布在年初发布,还有 OpenAI 的 GPT-4.5 随时可能降生,以及 GPT-5 预计在 5 月底发布。
开源的战场也越来越热闹。马斯克的 xAI 延续新代发布、开源上一代模型的做法,宣布将开源 Grok 2。而 OpenAI ——此前和 Anthropic 一起被视为 " 闭源 " 的代表——也松了口,奥特曼面对 DeepSeek 的大火,直接坦言过去站在了 " 错误的一边 ",在社交媒体上发起投票,释放将有一个 " 开源项目 " 的信号。
而眼下,DeepSeek 也没有坐以待毙,而是宣布启动 " 开源周 ",目前已经开源 FlashMLA 的代码,以及 EP 通信库。
Anthropic 顶住了 DeepSeek 的压力,发布混合模型、传出超目标融资的消息。但要让好消息延续,仍有诸多挑战。