今天小编分享的互联网经验:Anthropic新模型发布在即!“滑动比例”助企业降本增效,编程能力超o3-mini,欢迎阅读。
本文作者:房家瑶
来源:硬 AI
美东时间 2 月 13 日,据 The Information 报道,人工智能初创公司 Anthropic 计划在未来几周内推出一款创新的混合 AI 模型。
这款模型的独特之处在于,它可以在深度推理和快速回复之间动态切换,为开发人员提供一个多功能工具。根据一位使用过该模型的人士透露,Anthropic 的新模型在处理复杂问题时,可以调动更多计算资源进行深入推理,而面对简单任务时,模型又能够像传统大语言模型一样快速处理,无需额外计算。
最重要的是,它提供一种新颖的 " 滑动比例 " 功能,开发者可以通过滑动条精准控制模型在处理查询时使用的计算资源量,从而调整推理深度和模型的 " 思考 " 时间。例如,将滑动条設定为 "0" 时,模型将作为普通的非推理 AI 运行,类似于 OpenAI 的 GPT-4o。
这为开发者提高了成本效益,使他们能够根据具体需求平衡成本、速度和性能。相比之下,OpenAI 在推理能力上的设计选择较为简单。公司目前提供的是 " 低 "、" 中 " 和 " 高 " 三个固定設定。一些开发者反映,预测模型在不同级别下实际处理的 tokens 数量仍然充满不确定性,这使得他们很难估算单次查询的成本。
从产品设计来看,OpenAI 似乎更注重面向普通消费者和个人专业用户,因此采用简单易懂的 " 低 - 中 - 高 " 命名方式,而 Anthropic 则更专注于企业市场,其推出的精细化控制功能,允许开发者通过滑动条来调节 AI 模型的计算资源,使得企业能够在成本、速度和性能之间找到最佳平衡点。
社交媒体 X 上有用户表示:
" 鉴于 Claude 已经引起轰动,这可能会改变游戏规则。"
" 准备好被另一个人工智能模型震撼吧!Anthropic 即将推出一个混合天才,他可以深度思考,反应速度比你说 " 创新 " 还快。"
Anthropic 编码能力超过 OpenAI 的 o3-mini?
去年秋季,OpenAI 率先发布了具有推理能力的模型,随后谷歌、阿里巴巴和高飞资本管理等公司纷纷跟进,推动了推理模型的竞赛。
而在这场竞赛中,Anthropic 则保持低调,选择了一条不同的技术路线。如今,它终于揭开了这一谜底,计划通过这款新模型实现雄心勃勃的营收目标。根据 The Information 的报道,Anthropic 的目标是超越 OpenAI,成为应用开发者的首选 AI 供应商。
根据 OpenAI 首席执行官 Sam Altman 在社交媒体 X 上的最新透露,OpenAI 将推出 GPT-4.5,这将是一个传统的非推理模型。接下来,OpenAI 计划将 GPT 模型与 "o" 推理模型整合为单一 AI 系统,这一举措似乎借鉴了 Anthropic 的研发路径。
值得一提的是,Anthropic 的新模型在编程方面取得了显著进步。生成式 AI 在企业应用中,编程已成为最强大的应用领網域之一。一位使用过该模型的人士表示,当模型被允许以最长时间 " 思考 " 时,在某些编程基准测试中,其表现超过了目前客户可以使用的最先进的 OpenAI 推理模型(即設定为 " 高 " 推理级别的 o3-mini 模型)。
与 OpenAI 的推理模型更擅长处理学术性编程问题不同,Anthropic 的模型更适合企业工程师的日常编程任务。特别是在处理复杂的代码库时,Anthropic 的模型能更好地理解由数千个檔案组成的复杂代码库,并且能够生成首次即可运行的完整代码行。
这一特性尤其值得关注,因为 AI 模型在面对复杂编程问题时往往会 " 偷懒 ",仅提供注释而非实际代码。
目前,关于 Anthropic 新模型的定价问题仍未明确。业内普遍关注其是否能比 OpenAI 最近发布的 o3-mini 推理模型更加经济实惠,后者已被认为具有较高的性价比,吸引了大量开发者。
随着像 DeepSeek 和谷歌最新的 Gemini 模型等低价 AI 产品的推出,整个市场是否会趋向低价化,仍然是业内关注的热点问题。目前,AI 模型市场可能分为两个阵营,一是前沿开发,即持续改进推理或编程能力的模型仍具有定价优势。二是 " 足够好 " 模型,它们在价格上可能会相互压低,形成激烈的竞争。