今天小编分享的互联网经验:Claude炸场,最焦虑可能不是OpenAI,欢迎阅读。
图片来源 @视觉中国
文 | 硅基研究室,作者 | kiki
「游戏开始(game on)。」
这是 Runway 联合创始人写在 OpenAI 发布 Sora 后的一句感言,某种程度上,这句话也可以送给此刻的 OpenAI 和 Sam Altman。
随着被称为「OpenAI 最强竞争对手之一」的 Anthropic 发布新一代的人工智能模型系列 Claude 3(包括了 Opus、Sonnet、Haiku 三款产品),一时间中文互联网甚至出现了「全球 AI 大模型一夜易主」的评论。
图源:X
Claude 3 之所以引发如此多的评论,原因有两方面:一是代表模型性能的各类评测指标来看,Claude Opus 的得分全都超过 GPT-4。二是,从用户直接体验来看,缓解了过去大模型使用过程中出现的问题,比如降低拒绝率、克服大模型的幻觉等问题。
英伟达高级科学家 Jim Fan 就对 Claude 3 给出了两个客观的评价:一是在特定领網域的专家基准测试。除了相对饱和的 MMLU、HumanEval 等基准外,Claude 还选择了金融、医学和哲学等专家领網域,报告了性能表现。二就是解决了过往大模型过于「谨慎」的问题。
以 Meta 的开源大模型 Llama 2 为例,此前有人就发现,即便询问一些无害问题,比如「如何制作辣椒蛋黄酱」,但 Llama 2 会疯狂地表示它无法做到,因此用户需要互動多次,才能给出答案。Anthropic 意识到了这一问题,降低了模型在无害问题上的拒绝率。
需要指出的是,和 OpenAI 一样,由于都是闭源,Claude 3 的技术报告并不涉及具体的模型结构、训练方法等,因此对人们来说,这依旧是一条模糊的道路。
而从 Claude 炸场,对抗 OpenAI,所反映出的是 2024 年海外大模型行业所涌现出的新趋势。
Sora 拉开序幕,巨头密集上新
年初,从 OpenAI 携 Sora 开启所谓的「文生视频 GPT 时刻」开始,海外大模型企业就已进入了密集的模型上新期。
与 OpenAI 同日更新的谷歌拿出了多模态大模型 Gemini 1.5,既瞄准了 Claude 擅长的「长文本」—— Gemini 1.5 能稳定处理的信息量高达 100 万个 tokens,作为对比 GPT-4 Turbo 的上下文視窗大约为 12.8 万 tokens,刚发布的 Claude 3 大约为 20 万 tokens。在更新闭源大模型的同时,谷歌还推出了「开源」大模型 Gemma,主打一个「开源、闭源」两手抓。
而本就走「开源路线」的 Meta 也在近期被曝出推出新模型的消息。据 The Information 报道,Meta 计划在 7 月份推出新的 AI 大模型 Llama 3,参数量最高或超过 1400 亿,Meta 希望借此可以追上 OpenAI 的 GPT-4。一位知情人士表示,Meta 还在计划任命一名内部人员对 Llama 3 在安全和可控性进行培训,以让其的反应更加细致。此前,扎克伯格也向投资者提到:" 今年的重点领網域就包括推出 Llama 3"。
科技巨头们已将模型发布提上日程,追赶 GPT-4 已经成为了今年的首要 KPI,另一边的独角兽们在融资寒冬中也没闲着。
比如,法国 AI 独角兽 Mistral AI 就在上个月底推出了仅次于 GPT-4 性能的 Mistral Large 和类 ChatGPT 产品竞争对手 Le Chat。同时,还宣布和 OpenAI 的「盟友」微软达成了合作。
从目前的时间线来看,这场模型「上新战」只是开始。而这对创业者来说,似乎是一个好消息。如 Abacu.AI 的联合创始人兼 CEOBindu Reddy 所说:"OpenAI 不再是唯一的人工智能之王,这对每个人来说都是一个巨大的安慰。"
最焦虑可能不是 OpenAI,而是谷歌
而从 Claude 所引发的连锁反应来看,如今既面对强大竞争对手,又深陷与马斯克的诉讼中的 OpenAI 无疑是最焦虑的一个。
但事实上,从目前来看,OpenAI 可能并不焦虑。首先,两家公司不同的定位被人们忽视了。据福布斯对 Anthropic 联合创始人的采访,这家公司反复强调:"Anthropic 更像是一家企业公司,而不是一家消费者公司。" 尽管从产品形态和商业模式来看,chatGPT 和 Claude 并无明显差别,但显然 Anthropic 面向的是 to B 用户,而非 C 端的大众。而从 Claude 提供的客户案例中,这些 B 端客户包括了如科技公司 Gitlab、Notion、Salesforce、SAP 等。
其次,从战略层来看,尽管都是为了通往 AGI,但 OpenAI 谋求「大而全」,Anthropic 则偏向「小而美」。OpenAI 一系列的硬體公司和算力布局,都可以印证这一点。
相比之下,更焦虑的可能是谷歌。尽管身为 Anthropic 背后的金主之一,但相比亚马逊对 Anthropic 的「热情」,谷歌却无多少反应。
谷歌在近期正在陷入一系列的争议中。一方面,Gemini 陷入「种族偏见」的舆论浪潮,许多网友发现,Gemini 的文生图功能出现问题,比如似乎刻意在拒绝生成白人的形象,谷歌随后下架 Gemini 文生图功能,谷歌 CEO Sundar Pichai 回应称该问题「不可接受」,并在内部信中表示,公司在修复 Gemini 护栏方面已经取得了进展。
据 BusinessInsider 的报道,一位谷歌现任高级员工将这一事件形容为「一场公关噩梦」," 谷歌员工很生气。" 华尔街的分析师甚至认为,谷歌需要剔除那些胡作作非为的人,包括 CEO Sundar Pichai。Bernstein 分析师 Mark Shmulik 在一份研究报告中也思考了类似的问题——是否是时候对谷歌的高层进行改组。
尽管谷歌一直将自己形容为一家人工智能领先的公司,它的基础研究也深刻影响着此轮大模型浪潮。但无论在模型的推出节奏,还是商业化路线上,谷歌都明显迟滞于微软和 OpenAI。
AI 技术的迭代飞速,这意味着洗牌也在快速进行。一个有趣的观察是,如今在此轮浪潮中,被赞美的对象换成了 Meta 和微软。而此刻的 OpenAI 和谷歌,他们以技术见长,但都面临着增长所带来的代价——无论是组织内部的动荡,抑或是保守的战略。
参考资料:
1、机器之心:Llama 2 第二波划重点:过于「谨慎」、代码生成改进空间大
2、BusinessInsider:How Google lost its way