今天小编分享的互联网经验:奥特曼没有其他选择,欢迎阅读。
出品 | 虎嗅科技组
作者 | 王欣
编辑 | 苗正卿
头图 | 《教父》
果然是 o1(正式版)和 ChatGPT Pro。
12 月 5 日,OpenAI 仅花了 15 分钟就结束了圣诞季发布会的首秀。前一天他们发推表示要连续 12 天的集中新品发布,看似 " 大的来了 "。
但在 15 分钟首秀过后,有人调侃奥特曼将短剧模式玩明白了,把两小时发布会切成了 12 段。
这次发布的 o1 正式版但并没有超出行业预期——此前接近 OpenAI 人员就向 The Verge 透露,发布会新品包括文生视频期货 Sora 和新的推理模型。
然而,o1 对行业的意义也已经逐渐凸显——成为在传统 Scaling Law 遇到瓶颈后一种新的 scale 技术路径,国内玩家也在这条路径上积极投入。
而从售价翻倍、高达 200 美元一月的 ChatGPT Pro,不难看出 OpenAI 的商业化野心—— OpenAI 首席商务官 Lionetti 表示,OpenAI 今年的目标是实现近 40 亿美元的收入,其中绝大部分销售额来自为 ChatGPT 的高级功能付费的个人消费者。
或许可以说,奥特曼也没有太多其他选择。据此前未披露的内部财务数据估算和相关人士的分析,OpenAI 今年可能亏损高达 50 亿美元。
新的里程碑?
Lionetti 表示,OpenAI 将 o1 视为一个 " 里程碑 ",它已经打开了新的市场。
o1 使用强化学习技术训练模型自行解决问题,该技术通过奖励和惩罚来教导系统。然后,它使用 " 思路链 " 来处理查询,类似于人类通过逐步思考来处理问题的方式。
相较于之前的 o1-preview(预览版),新模型在速度、性能和准确性上均有显著提升。据奥特曼介绍,o1 模型在编码、数学和科学写作等方面表现更为出色,特别是在处理复杂问题时,其响应速度提高了约 50%,错误率减少了 34%。
值得一提的是,o1 模型还支持图片形式的多模态推理。除此之外,OpenAI 还计划在未来几个月内增加网页浏览和檔案上传等功能的支持,进一步拓展 ChatGPT 的应用场景。
OpenAI 推出 o1-preview 后,谷歌也加大了推理力度。谷歌已将其推理模型团队规模从 o1-preview 发布前的几十人扩大到 200 人左右。据一位知情人士透露,谷歌还为该团队提供了更多计算资源。
在国内,Kimi、昆仑万维、deepseek 也上线了 o1 路线的推理模型。
11 月 16 日,月之暗面发布了数学模型 K0-math,根据其公布的基准测试:K0-math 可对标 OpenAI o1 中可公开使用的两个模型:o1-mini 和 o1-preview。
11 月 20 日,Deepseek 的 DeepSeek-R1-Lite 正式上线。与 OpenAI 的 o1 模型相比,R1-Lite 模型将完全公开其复杂的思考路径。根据 Deepseek 官方的说法,R1-Lite 能够处理的思维链长度可达到数万字之多。
11 月 27 日,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型 4.0」 o1 版(Skywork o1)。
"o1 路线所代表的深度推理模型,其实之前国内各家 AI 公司都有尝试,但并没有做得很深," 某互联网大厂产品经理表示:" 而 OpenAI 的 o1 发布后,大家才坚信这个事情是值得做的,投入会比前期要更坚决一些。"
大家押注 o1 另一重要原因也在于,此前 Scaling Law 的路线已经走到了瓶颈,GPT5 也迟迟未发。
智谱 CEO 张鹏认为,虽然 "Scaling Law 确实不再涨了 ",但仍在 Agent、多模态、强化学习、扩散模型等不同方向上存在新场景、算法的 scale 可能。
o1 所代表的强化学习路线,就是这些可能性中的一条重要路线。
如何落地?
但 o1 落地场景仍然还需要更多探索尝试,并且局限依然存在。比如,模型也会因为过度思考,而在简单问题上花费多余的步骤。
然而,在数学、生物、物理等科研领網域,o1 的潜力正在逐步显现。相较于陪聊、普通问答等场景,让 AI 去攻克哥德巴赫猜想等人类难题,或许才是不断提升 AI 上限的正确打开方式。
据 The Information 报道,劳伦斯利弗莫尔国家实验室的研究人员,已经使用 o1 模型来解决博士级的问题。
该实验室位于加利福尼亚州利弗莫尔,其研究重点是使用高功率激光照射小型燃料胶囊,以在核聚变反应中产生能量。据参与实验的一位人士称,在一个案例中,研究人员使用 OpenAI 的 o1-preview,来计算在一定强度的激光作用下胶囊的温度和压力,并询问需要多强的激光才能达到一定的温度和压力。
OpenAI 推理模型通常需要 10 到 60 秒来回答这些问题。该人士表示,这可以为研究人员节省 30 分钟到几个小时或几天的时间。
而在这次的发布会上,Jason Wei 也演示了 o1 在生物科学领網域的应用,让 o1 找出符合标准的蛋白质。对于这个 o1-preview 无法回答的问题,o1 正式版在 53 秒后便给出了正确答案。
OpenAI 首席商务官 Lionetti 也强调了 o1 模型在法律、编程、医疗保健和制造业的应用场景。例如,在法律领網域,它有助于对条款清单、文档分析、多步骤审批流程进行法律或数学计算。他表示,该公司还向医疗保健公司出售 o1,这些公司使用它来为医疗索赔定价、分析临床指南和分析复杂数据集。它关注的另一个市场是制造业,OpenAI 表示,o1 可以分析和加速工业流程。
这些场景也让 OpenAI 看到了商业化的更多可能性。
因此,OpenAI 推出了价格更高的 ChatGPT Pro 订阅服务,这是一个每月收费 200 美元的新套餐,用户可以无限制地使用 OpenAI 的 o1、GPT-4o 以及高级语音模式。此外,Pro 订阅还特别提供了一个仅供 Pro 用户使用的 o1 版本,这个版本被称为 o1 Pro 模式,它通过增加计算资源来优化对复杂问题的处理,以提供更优质的答案。
虽然相较此前每月 20 美元的 Plus 套餐,Pro 定价更为高昂,但这对于刚刚宣布周活用户高达 3 亿的 OpenAI,仍然存在很大的付费转化空间。
更为重要的是,ChatGPT 目前付费版本的可能增长速度,不足以弥补运营该服务的高昂成本——据此前未披露的内部财务数据和参与该业务的人士的分析,OpenAI 今年可能亏损高达 50 亿美元。
这种情况下,要达到 40 亿美元年收入的小目标,OpenAI 似乎没有太多选择。
(Tips:我是虎嗅科技医疗组的王欣,关注 AI 及创投领網域,行业人士交流可加微信:13206438539,请注明身份。)