OpenAI急了？我们应该抓住哪些变量？

今天小编分享的教育经验：OpenAI急了？我们应该抓住哪些变量？，欢迎阅读。

在过去的一个月，OpenAI 连续推出 12 场重磅发布会：

Day 1：满血 o1 上线，ChatGPT Pro 会员上线，o1 pro 推出，AI 有了类人 " 思考 " 能力。

Day 2：基于 o1 的强化微调，人人都能训练专家模型，专业门槛直线下降。

Day 3：Sora 正式发布，AI 开始 " 看懂 " 现实世界。

Day 4：ChatGPT Canvas 全员开放以及小功能更新，写文章、写代码一气呵成。

Day 5：全面接入苹果生态，打造更自然的多设备跨平台操作体验。

Day 6：4o 的实时视频理解上线，多模态让 AI 看懂视频内容。

Day 7：ChatGPT 上线 "Projects 项目 " 功能。

Day 8：ChatGPT Search 全量开放，更新 AI 搜索功能，挑战传统网络搜索。

Day 9：满血 o1 API 正式开放，大幅降低 API 调用价格。

Day 10：从最新款的 iPhone 到老式的翻盖机，能直接和 ChatGPT 打电话聊天了。

Day 11：应用更新，桌面版 GPT 可以跨应用互联，告别繁琐的复制粘贴对话。

Day 12：OpenAI o3 正式发布，超级智能模型震撼登场，向 AGI 又迈进了一大步。

每一天的发布会都是振聋发聩的技术突破与产品创新，这些前所未有的技术加速度正在深刻改变全球的商业格局、产业生态以及个体的能力边界。

AI 将带来哪些行业巨变？

AI 离取代人类又近了一步？

AI 在哪些能力上已达到了人类的水平？

12 月 28 日，混沌邀请到了硅谷知名华人 AI 科学家田渊栋博士，脉脉创始人兼 CEO 林凡，云迹科技创始人、混沌学园校友支涛，云九资本合伙人、混沌创新领教任鑫，混沌合伙人、混沌创新领教张雷等 AI 行业从业者、专家们一起解读了 OpenAI 的这 12 场发布会。这不仅是一场关于 AI 技术趋势的分享，更是一场关于个人未来发展的思考。AI 带来的不仅是工具的进化，更是思维的迭代与格局的重塑。在 2025 即将到来之际，让我们站在技术与人性的交汇点，重新审视未来的可能性。

以下为部分分享内容精华笔记：

‍田渊栋博士：OpenAI o3 的表现依然惊艳

前段时间，OpenAI 连续开 12 天的产品发布会，内容大致包括增强的 ChatGPT o1 模型、Sora 视频生成模型和 o3 模型。另外，还有一些技术上的突破，包括推理模型 o1、强化微调技术、文生视频 Sora、写作和编程工具 Canvas、与 Apple 生态系统的深度整合、语音和视觉功能、ChatGPT 搜索、打电话和 WhatsApp 聊天等功能。

总体来说，前 11 天没有什么太多的惊喜，第 12 天出现的 o3 相对具有一定的创新能力。它的能力主要表现为解决了之前的一些技术难题，我认为有三个值得一提的亮点：

1. 在 ARC-AGI 测试中 o3 的成绩远超其他模型。ARC-AGI 测试就像是为人工智能准备的一个特殊 " 考试 "。它不是考 AI 背诵了多少知识，而是测试 AI 是否真的具备 " 理解力 " 和 " 思考力 "。对目前的 AI 技术而言，一般的大模型在 ARC-AGI 测试中的成绩大约都在 25%-50% 之间，而 o3 的最低成绩为 75.7%，最高成绩为 87.5%，有着巨大差距。

2. o3 在全球著名的编码竞赛平台 codeforces 中刷出 2727 分，达到此分数的程式员不到 200 人，之前 2073 分已相当于终极者，而 o1 是 1891 分。这意味着在竞争性代码方面，o3 已经达到了世界顶尖程式员水平。

3. 今年 11 月 o3 在陶哲轩等 60 余位全球数学家共同推出的号称业界最强数学基准的 EpochAI Frontier Math 中创下新纪录，准确率达到 25.2%。而今天所有其他模型的准确率都低于 2%。联手 60 多位数学家出题的陶哲轩，曾认为这项测试能够难住 AI 好多年。如今，这一说法被 OpenAI o3 推翻了。

可以看到，o3 在各方面的表现都让人惊艳，因此很多人判断它会影响未来世界的样态。

‍田渊栋博士：AI 正在掀起一阵洪流

计算机普及以后，它的普遍性就像水一样。反观大模型，随着它的不断发展，也会出现同样的情况。AI 出现之前，创业的模式是找很多人组建一个团队，团队里的每个人需要不断地试炼和培训才能成为一名有用之才，这一过程大约需要 20 年的时间。但如果 AI 变得非常便宜，创业者就可以以极低的成本获得稳定性和乐此不疲的劳动力。到那个时候，市场会是什么样子难以想象，但对于创业者来说，成本和风险会降低很多。

AI 的分析能力非常强大，因为它有一个巨大的资料库。我用过一些 AI 工具，我感觉它们很像小镇做题家，通过大量的训练不断地提升自身的能力，最终寻找到解题的方式。因此它的出现未必对所有人来说都是好事情，例如那些习惯用做题思维解决问题的人。因为 AI 的水平很大程度上可以取代一些重复性的劳动，做题思维可替代性很高。这告诉我们：不要以一种高考做题家的状态去工作和生活，要保持思维的活力和创造力。这样我们才可以尽量避免被 AI 淘汰。

AI 到来之前，我们的世界布满了山峰，每个山峰上都站着行业里最优秀的人。AI 到来之后，它掀起了一阵洪流，让一些山峰上的人被冲刷，以至掉落。留下来的人，只会是最具创造性、不可替代性的人，同时也是领網域里的专家。这大概会在十年内发生。

‍田渊栋博士：2025 的活法，是让 AI 来加速自己

我认为在 2025 年，AI 会更快速地发展。加速到一定程度之后，每个人都会开始使用 AI，以防止自己的效率远低于其他人。如果这一猜想变成现实，人的价值感会受到影响。我的价值是什么？人类独一无二的价值是什么？这是每个人都要面对的问题。

这个问题很难回答，但我们可以在行动中不断地接近问题的答案，比如我愿意通过写小说找到一些存在的价值，这是我自我定位的一个锚点。AI 的出现在提醒我们，人最终要找到自己的独一无二之处，立足世界的生态位。在寻找的过程中，我们可以利用 AI 加速自己的发展，把 AI 集合起来，让它们成为自己的将领，协助你做成想做的事。

‍脉脉林凡：OpenAI 的发展遇到了瓶颈

从这次 12 天发布会来看，OpenAI 的发展受阻了。整个模型的核心能力没有如预期一样实现 Scaling law 增长，这其中的主要问题不是算力，而是数据。总体来看，现在所有的模型训练基本上耗尽了高质量的数据，哪怕通过合成数据或其他方式来逼近都无法产生足够的效应。

这是为什么？首先，AI 的听觉能力目前无法增强；其次，视觉数据方面有太多的噪音（比如 YouTube 上的视频），海量信息的杂糅，让 AI 去理解世界、生成内容存在比较大的限制。

因此我们可以判断，OpenAI 遇到了瓶颈期。有一个很简单的道理——如果核心能力足够强，其实不用讲太多的内容。正如此前的 ChatGTP-4，只需要一场发布会就足以震惊世界。而这次为期 12 天的发布会却没有掀起之前那么大的火花。对我们创业者来说，可以根据这次 OpenAI 的情况来计划未来一两年的创业路径。一定要记住一件事：对于核心基座的能力，它的突破速度没有那么快。

‍脉脉林凡：o3 大大提高了 AI 应用爆发的可能性

打一个比方，如果用高铁来去形容 AI 的能力进展的话，GPT3.5 相当于每小时 120 公里的火车速度一下提到了每小时 200 公里，速度翻了将近一倍，对于很多人来讲，已经是一个很大的进步了。GPT4 出来的时候，相当于每小时 200 公里提高到每小时 350 公里。那么 o3 呢？相当于提升到了每小时 450 公里。对于做研究的同学来讲，已经是很大的提升了。但是，作为一个普通消费者，一列 350 公里时速的高铁和一列 450 公里时速的高铁，对生活的影响就比较小了。为什么？从 3 小时的旅程变成了 2 小时 20 分钟的旅程，时长变化的体感并不强烈。

在技术上，不管是九月份发布的 o1，还是 12 月份发布的 o3，其实都是在 Post-Train（后训练）环节做出了比较大的突破，比如思维链的训练、强化学习方面做了很多处理。很多跟我们一样做过 AI 应用，尤其是 To B 的 AI 应用的人会有一种体感，我们去做 agent，去做工作流，其实是在 OpenAI 上面去打了一堆的业务补丁，业务的状态机控制在顶层，然后通过顶层的状态机去让 AI 做 1、2、3、4、5、6 的事情。当然，这个过程很痛苦，因为有的时候它真的很不听话，你要它这么干，它却干出了另外一件事情出来。

所以，现在 OpenAI 做的 Post-Train 这件事情，相当于把你上层的逻辑内化到了模型内部，做了内置，这样就会降低后链路开发的难度和复杂度。在新的一年里，AI 应用开发的难度会降低，效率和大爆发的可能性会极大提高。这件事情我觉得是需要关注和重视的。

‍脉脉林凡：AI 的创业机会不在 To B，在 To C

对于中国创业者而言，To B 行业的 Agent 开发或 workflow 的优化都不是我们的机会。美国的 To B 生态非常发达，很多创业者做完 workflow 的优化后马上就能赚到钱，但中国只适合大厂去做这件事，并且他们自己就能做，不需要找创业者。

在这种情况下，To C 是创业者们唯一的机会。Realtime API 是一种实时语音互動 API，支持文本和音频作为输入和输出，比我们原先用的 TTS、ASR 的效果好很多。在这个方面，Realtime API 的出现会让 To C 行业的互動产生巨变。例如，面向儿童群体的实时语音互動应用肯定会很受欢迎。但当前还缺乏一种类似于 Agent 这样的框架与之协同，因为仅依靠大模型的话准确度不高，需要一个可以控制的介质。一旦控制能力与实时语音互動能力结合在一起，会为整个 To c 行业的创业者带来一次巨大的突破机会。

‍云迹科技创始人支涛：AI 已超越了工具，其能力好比拥有了大理段氏的 " 六脉神剑 "

人类为了延伸体力和腦力制造了很多工具，比如火车、电腦、电动工具。这次 OpenAI 的发布会也发布了一系列我们梦寐以求的工具。在我看来，这些工具超越了 " 工具 " 的定义，变成了六脉神剑。它有自主力，学习力、互動力、适应力、情感力和社会力。按照目前的发展来看，AI 已经是生产关系和生产力的重要组成部分。

看完发布会以后，有没有觉得 AI 像是一个正在现实世界不断学习的学生呢。在回答我们问题的时候，是语文；在帮我们进行推理的时候，是数学和经济学；在辅助我们工作的时候，是工程技术、生命科学和管理学。一旦它们试图创新，则会逐个攻读哲学、心理学，甚至是组织行为学。

AI 这种硅基生物通过不断地迭代，从开始的辅助工具，逐渐演变为人类身边的助理，如果有一天，它们变成了智能体，就会成为我们的伙伴。一旦它们开始洞察世界，找到人类还没有发现的问题时，它们则化身为一个创新者的面貌出现在我们面前。

我们人类如何实现成长？对今天的我们来说，要先学习使用它们的方式，在它们的发展过程中掌握自身的领导力，最后创建一个 " 超级智慧的超个体意识 "，与 AI 做到你中有我，我中有你。这其中要让他们跟我们一样，使命、愿景、价值观对齐；在社会里高度统一的法律、法规、道德形成一致。

‍云迹科技创始人支涛：AI 在 To B 的应用场景需要进一步打开

重塑与 AI 的对话能力十分重要，因为这样才能让 AI 更好地为我们服务。中国企业在 To C 场景的推进较好，在 To B 的应用场景需要进一步打开。To B 里，需要更多的人转换思维模式，理解并用好 AI 来做职业增强，解决实际问题，创造价值。这也提醒了我们企业，不仅要给 To C 场景提供生产力，还要在 ToB 场景里提供生产关系。未来，希望中国企业能够快速发展，加大 To B 对 AI 的使用率。

‍云九资本合伙人任鑫：OpenAI 发布会与你无关

由于大家都是从业者，因此对 AI 格外关注，还会守着这次 OpenAI 发布会的直播。在这里我想给大家提供另一个视角，仅代表我个人的观点，只是给一些业外的朋友们一点建议：建议大家不要关心这件事，它不重要。

首先，如果你不是专业人士，不要花太多精力预测 AI 的未来。我常常会跟一些 CEO 或者研究员聊到这个话题，最后的结论是，很多业内专业人士的观点并不一致。这告诉我们要充分相信一件事——没有人知道未来会怎样。既然没有人知道未来会怎样，我们只要明确一件事：你现在的状态如何以及你想不想蹭到 AI 的红利。如果你的状态足够好，你可以有选择。但如果你现在的状态欠佳，心里又跃跃欲试，这个时候其实更不需要预测，因为你没有选择，必须参与。如果想要跟上时代趋势，你只能投身其中。

其次，要具体地思考问题，不要抽象地评判。OpenAI 会不会被 Google 打败？Deepseek 与 GPT-4o 哪一个更好？如果你是应用方，最好不要这样去思考问题。你的思考落点一定要非常具体，把具体的事物放置在你的场景里，判断它会产生什么样具体的结果，这才是业务导向的思维方式。

‍云九资本合伙人任鑫：不要想太多，先要多用起来

大家有可能听过一种说法，说 AI 应用不够广泛。但是实际我们调研下来发现，现在 AI 的应用已经极其广泛，只是大家没有大声吆喝。比如前几天的 OpenAI 掉线了一会儿，然后推特上铺天盖地都是学生在哭喊：我的论文怎么办？我要交作业！小朋友们用它来写作业这件事情已经非常普遍。然后国内大模型的应用场景当中，一个非常巨大的板块叫做写公文，写报告，也是铺天盖地地在用。

还有当你在网上招聘，你给他电话面试、视频面试的时候，很多小朋友已经在他的电腦上开了一个 copilot，你问任何问题，copilot 都会结合他的简历和回答来帮他实时作弊。所以，我建议大家不要低估世界的发展，年轻人已经都用起来了，如果我们没有用起来，只是我们老了而已。

我们是一家孵化器，我们会支持一些创业者帮他们把他们的产品实现。在大半年前，我们就已经做到了后端的代码没有一行是人类写的，全部都是 AI 写的。现在我知道已经有无数的公司做到了。

再举一个例子，前几天有一个同事让我看一个美国项目的招聘计划。但是实际上我是外行，我招他是因为他比我内行，如果按照以前的做法，我会跟他说，这个点你再想一想，我觉得可以怎么样，要不要再修改一下，外行指导内行。但是，前几天我给他的反馈已经变成了：" 这件事情你分三个维度，去跟 o1 聊半个小时，看看它能不能给你更好的建议。如果有的话，你回来告诉我这件事情还有可能往哪些方向优化。" 我也没有 AI 懂，你不如直接去问 AI。所以，大家会发现在工作当中，我们相当于引入了一个更好的第三方。

最后，在决策上也是这样，我们现在已经不是拍腦袋想了，而是每一次都跟 AI 聊聊。我的很多想法都是跟 AI 聊出来的。

所以，我强烈建议大家在关注新闻的同时，自己更多地用起来。所有事情都是可以用上 AI 的，就看你想不想得到。真正稀缺的不是知识，而是实践的机会。大家一定不要挖空心思去搞懂 OpenAI 在干嘛，业外人也搞不懂，赶紧把这些东西全部用一遍，然后在生活当中创造 100 个实践的机会。这些机会会逼着你去更好地学习，然后这些更好的学习可以帮助我们创造更多的可能性。

////// END //////