今天小编分享的教育经验:OpenAI急了?我们应该抓住哪些变量?,欢迎阅读。
在过去的一个月,OpenAI 连续推出 12 场重磅发布会:
Day 1:满血 o1 上线,ChatGPT Pro 会员上线,o1 pro 推出,AI 有了类人 " 思考 " 能力。
Day 2:基于 o1 的强化微调,人人都能训练专家模型,专业门槛直线下降。
Day 3:Sora 正式发布,AI 开始 " 看懂 " 现实世界。
Day 4:ChatGPT Canvas 全员开放以及小功能更新,写文章、写代码一气呵成。
Day 5:全面接入苹果生态,打造更自然的多设备跨平台操作体验。
Day 6:4o 的实时视频理解上线,多模态让 AI 看懂视频内容。
Day 7:ChatGPT 上线 "Projects 项目 " 功能。
Day 8:ChatGPT Search 全量开放,更新 AI 搜索功能,挑战传统网络搜索。
Day 9:满血 o1 API 正式开放,大幅降低 API 调用价格。
Day 10:从最新款的 iPhone 到老式的翻盖机,能直接和 ChatGPT 打电话聊天了。
Day 11:应用更新,桌面版 GPT 可以跨应用互联,告别繁琐的复制粘贴对话。
Day 12:OpenAI o3 正式发布,超级智能模型震撼登场,向 AGI 又迈进了一大步。
每一天的发布会都是振聋发聩的技术突破与产品创新,这些前所未有的技术加速度正在深刻改变全球的商业格局、产业生态以及个体的能力边界。
AI 将带来哪些行业巨变?
AI 离取代人类又近了一步?
AI 在哪些能力上已达到了人类的水平?
12 月 28 日,混沌邀请到了硅谷知名华人 AI 科学家田渊栋博士,脉脉创始人兼 CEO 林凡,云迹科技创始人、混沌学园校友支涛,云九资本合伙人、混沌创新领教任鑫,混沌合伙人、混沌创新领教张雷等 AI 行业从业者、专家们一起解读了 OpenAI 的这 12 场发布会。这不仅是一场关于 AI 技术趋势的分享,更是一场关于个人未来发展的思考。AI 带来的不仅是工具的进化,更是思维的迭代与格局的重塑。在 2025 即将到来之际,让我们站在技术与人性的交汇点,重新审视未来的可能性。
以下为部分分享内容精华笔记:
田渊栋博士:OpenAI o3 的表现依然惊艳
前段时间,OpenAI 连续开 12 天的产品发布会,内容大致包括增强的 ChatGPT o1 模型、Sora 视频生成模型和 o3 模型。另外,还有一些技术上的突破,包括推理模型 o1、强化微调技术、文生视频 Sora、写作和编程工具 Canvas、与 Apple 生态系统的深度整合、语音和视觉功能、ChatGPT 搜索、打电话和 WhatsApp 聊天等功能。
总体来说,前 11 天没有什么太多的惊喜,第 12 天出现的 o3 相对具有一定的创新能力。它的能力主要表现为解决了之前的一些技术难题,我认为有三个值得一提的亮点:
1. 在 ARC-AGI 测试中 o3 的成绩远超其他模型。ARC-AGI 测试就像是为人工智能准备的一个特殊 " 考试 "。它不是考 AI 背诵了多少知识,而是测试 AI 是否真的具备 " 理解力 " 和 " 思考力 "。对目前的 AI 技术而言,一般的大模型在 ARC-AGI 测试中的成绩大约都在 25%-50% 之间,而 o3 的最低成绩为 75.7%,最高成绩为 87.5%,有着巨大差距。
2. o3 在全球著名的编码竞赛平台 codeforces 中刷出 2727 分,达到此分数的程式员不到 200 人,之前 2073 分已相当于终极者,而 o1 是 1891 分。这意味着在竞争性代码方面,o3 已经达到了世界顶尖程式员水平。
3. 今年 11 月 o3 在陶哲轩等 60 余位全球数学家共同推出的号称业界最强数学基准的 EpochAI Frontier Math 中创下新纪录,准确率达到 25.2%。而今天所有其他模型的准确率都低于 2%。联手 60 多位数学家出题的陶哲轩,曾认为这项测试能够难住 AI 好多年。如今,这一说法被 OpenAI o3 推翻了。
可以看到,o3 在各方面的表现都让人惊艳,因此很多人判断它会影响未来世界的样态。
田渊栋博士:AI 正在掀起一阵洪流
计算机普及以后,它的普遍性就像水一样。反观大模型,随着它的不断发展,也会出现同样的情况。AI 出现之前,创业的模式是找很多人组建一个团队,团队里的每个人需要不断地试炼和培训才能成为一名有用之才,这一过程大约需要 20 年的时间。但如果 AI 变得非常便宜,创业者就可以以极低的成本获得稳定性和乐此不疲的劳动力。到那个时候,市场会是什么样子难以想象,但对于创业者来说,成本和风险会降低很多。
AI 的分析能力非常强大,因为它有一个巨大的资料库。我用过一些 AI 工具,我感觉它们很像小镇做题家,通过大量的训练不断地提升自身的能力,最终寻找到解题的方式。因此它的出现未必对所有人来说都是好事情,例如那些习惯用做题思维解决问题的人。因为 AI 的水平很大程度上可以取代一些重复性的劳动,做题思维可替代性很高。这告诉我们:不要以一种高考做题家的状态去工作和生活,要保持思维的活力和创造力。这样我们才可以尽量避免被 AI 淘汰。
AI 到来之前,我们的世界布满了山峰,每个山峰上都站着行业里最优秀的人。AI 到来之后,它掀起了一阵洪流,让一些山峰上的人被冲刷,以至掉落。留下来的人,只会是最具创造性、不可替代性的人,同时也是领網域里的专家。这大概会在十年内发生。
田渊栋博士:2025 的活法,是让 AI 来加速自己
我认为在 2025 年,AI 会更快速地发展。加速到一定程度之后,每个人都会开始使用 AI,以防止自己的效率远低于其他人。如果这一猜想变成现实,人的价值感会受到影响。我的价值是什么?人类独一无二的价值是什么?这是每个人都要面对的问题。
这个问题很难回答,但我们可以在行动中不断地接近问题的答案,比如我愿意通过写小说找到一些存在的价值,这是我自我定位的一个锚点。AI 的出现在提醒我们,人最终要找到自己的独一无二之处,立足世界的生态位。在寻找的过程中,我们可以利用 AI 加速自己的发展,把 AI 集合起来,让它们成为自己的将领,协助你做成想做的事。
脉脉林凡:OpenAI 的发展遇到了瓶颈
从这次 12 天发布会来看,OpenAI 的发展受阻了。整个模型的核心能力没有如预期一样实现 Scaling law 增长,这其中的主要问题不是算力,而是数据。总体来看,现在所有的模型训练基本上耗尽了高质量的数据,哪怕通过合成数据或其他方式来逼近都无法产生足够的效应。
这是为什么?首先,AI 的听觉能力目前无法增强;其次,视觉数据方面有太多的噪音(比如 YouTube 上的视频),海量信息的杂糅,让 AI 去理解世界、生成内容存在比较大的限制。
因此我们可以判断,OpenAI 遇到了瓶颈期。有一个很简单的道理——如果核心能力足够强,其实不用讲太多的内容。正如此前的 ChatGTP-4,只需要一场发布会就足以震惊世界。而这次为期 12 天的发布会却没有掀起之前那么大的火花。对我们创业者来说,可以根据这次 OpenAI 的情况来计划未来一两年的创业路径。一定要记住一件事:对于核心基座的能力,它的突破速度没有那么快。
脉脉林凡:o3 大大提高了 AI 应用爆发的可能性
打一个比方,如果用高铁来去形容 AI 的能力进展的话,GPT3.5 相当于每小时 120 公里的火车速度一下提到了每小时 200 公里,速度翻了将近一倍,对于很多人来讲,已经是一个很大的进步了。GPT4 出来的时候,相当于每小时 200 公里提高到每小时 350 公里。那么 o3 呢?相当于提升到了每小时 450 公里。对于做研究的同学来讲,已经是很大的提升了。但是,作为一个普通消费者,一列 350 公里时速的高铁和一列 450 公里时速的高铁,对生活的影响就比较小了。为什么?从 3 小时的旅程变成了 2 小时 20 分钟的旅程,时长变化的体感并不强烈。
在技术上,不管是九月份发布的 o1,还是 12 月份发布的 o3,其实都是在 Post-Train(后训练)环节做出了比较大的突破,比如思维链的训练、强化学习方面做了很多处理。很多跟我们一样做过 AI 应用,尤其是 To B 的 AI 应用的人会有一种体感,我们去做 agent,去做工作流,其实是在 OpenAI 上面去打了一堆的业务补丁,业务的状态机控制在顶层,然后通过顶层的状态机去让 AI 做 1、2、3、4、5、6 的事情。当然,这个过程很痛苦,因为有的时候它真的很不听话,你要它这么干,它却干出了另外一件事情出来。
所以,现在 OpenAI 做的 Post-Train 这件事情,相当于把你上层的逻辑内化到了模型内部,做了内置,这样就会降低后链路开发的难度和复杂度。在新的一年里,AI 应用开发的难度会降低,效率和大爆发的可能性会极大提高。这件事情我觉得是需要关注和重视的。
脉脉林凡:AI 的创业机会不在 To B,在 To C
对于中国创业者而言,To B 行业的 Agent 开发或 workflow 的优化都不是我们的机会。美国的 To B 生态非常发达,很多创业者做完 workflow 的优化后马上就能赚到钱,但中国只适合大厂去做这件事,并且他们自己就能做,不需要找创业者。
在这种情况下,To C 是创业者们唯一的机会。Realtime API 是一种实时语音互動 API,支持文本和音频作为输入和输出,比我们原先用的 TTS、ASR 的效果好很多。在这个方面,Realtime API 的出现会让 To C 行业的互動产生巨变。例如,面向儿童群体的实时语音互動应用肯定会很受欢迎。但当前还缺乏一种类似于 Agent 这样的框架与之协同,因为仅依靠大模型的话准确度不高,需要一个可以控制的介质。一旦控制能力与实时语音互動能力结合在一起,会为整个 To c 行业的创业者带来一次巨大的突破机会。
云迹科技创始人支涛:AI 已超越了工具,其能力好比拥有了大理段氏的 " 六脉神剑 "
人类为了延伸体力和腦力制造了很多工具,比如火车、电腦、电动工具。这次 OpenAI 的发布会也发布了一系列我们梦寐以求的工具。在我看来,这些工具超越了 " 工具 " 的定义,变成了六脉神剑。它有自主力,学习力、互動力、适应力、情感力和社会力。按照目前的发展来看,AI 已经是生产关系和生产力的重要组成部分。
看完发布会以后,有没有觉得 AI 像是一个正在现实世界不断学习的学生呢。在回答我们问题的时候,是语文;在帮我们进行推理的时候,是数学和经济学;在辅助我们工作的时候,是工程技术、生命科学和管理学。一旦它们试图创新,则会逐个攻读哲学、心理学,甚至是组织行为学。
AI 这种硅基生物通过不断地迭代,从开始的辅助工具,逐渐演变为人类身边的助理,如果有一天,它们变成了智能体,就会成为我们的伙伴。一旦它们开始洞察世界,找到人类还没有发现的问题时,它们则化身为一个创新者的面貌出现在我们面前。
我们人类如何实现成长?对今天的我们来说,要先学习使用它们的方式,在它们的发展过程中掌握自身的领导力,最后创建一个 " 超级智慧的超个体意识 ",与 AI 做到你中有我,我中有你。这其中要让他们跟我们一样,使命、愿景、价值观对齐;在社会里高度统一的法律、法规、道德形成一致。
云迹科技创始人支涛:AI 在 To B 的应用场景需要进一步打开
重塑与 AI 的对话能力十分重要,因为这样才能让 AI 更好地为我们服务。中国企业在 To C 场景的推进较好,在 To B 的应用场景需要进一步打开。To B 里,需要更多的人转换思维模式,理解并用好 AI 来做职业增强,解决实际问题,创造价值。这也提醒了我们企业,不仅要给 To C 场景提供生产力,还要在 ToB 场景里提供生产关系。未来,希望中国企业能够快速发展,加大 To B 对 AI 的使用率。
云九资本合伙人任鑫:OpenAI 发布会与你无关
由于大家都是从业者,因此对 AI 格外关注,还会守着这次 OpenAI 发布会的直播。在这里我想给大家提供另一个视角,仅代表我个人的观点,只是给一些业外的朋友们一点建议:建议大家不要关心这件事,它不重要。
首先,如果你不是专业人士,不要花太多精力预测 AI 的未来。我常常会跟一些 CEO 或者研究员聊到这个话题,最后的结论是,很多业内专业人士的观点并不一致。这告诉我们要充分相信一件事——没有人知道未来会怎样。既然没有人知道未来会怎样,我们只要明确一件事:你现在的状态如何以及你想不想蹭到 AI 的红利。如果你的状态足够好,你可以有选择。但如果你现在的状态欠佳,心里又跃跃欲试,这个时候其实更不需要预测,因为你没有选择,必须参与。如果想要跟上时代趋势,你只能投身其中。
其次,要具体地思考问题,不要抽象地评判。OpenAI 会不会被 Google 打败?Deepseek 与 GPT-4o 哪一个更好?如果你是应用方,最好不要这样去思考问题。你的思考落点一定要非常具体,把具体的事物放置在你的场景里,判断它会产生什么样具体的结果,这才是业务导向的思维方式。
云九资本合伙人任鑫:不要想太多,先要多用起来
大家有可能听过一种说法,说 AI 应用不够广泛。但是实际我们调研下来发现,现在 AI 的应用已经极其广泛,只是大家没有大声吆喝。比如前几天的 OpenAI 掉线了一会儿,然后推特上铺天盖地都是学生在哭喊:我的论文怎么办?我要交作业!小朋友们用它来写作业这件事情已经非常普遍。然后国内大模型的应用场景当中,一个非常巨大的板块叫做写公文,写报告,也是铺天盖地地在用。
还有当你在网上招聘,你给他电话面试、视频面试的时候,很多小朋友已经在他的电腦上开了一个 copilot,你问任何问题,copilot 都会结合他的简历和回答来帮他实时作弊。所以,我建议大家不要低估世界的发展,年轻人已经都用起来了,如果我们没有用起来,只是我们老了而已。
我们是一家孵化器,我们会支持一些创业者帮他们把他们的产品实现。在大半年前,我们就已经做到了后端的代码没有一行是人类写的,全部都是 AI 写的。现在我知道已经有无数的公司做到了。
再举一个例子,前几天有一个同事让我看一个美国项目的招聘计划。但是实际上我是外行,我招他是因为他比我内行,如果按照以前的做法,我会跟他说,这个点你再想一想,我觉得可以怎么样,要不要再修改一下,外行指导内行。但是,前几天我给他的反馈已经变成了:" 这件事情你分三个维度,去跟 o1 聊半个小时,看看它能不能给你更好的建议。如果有的话,你回来告诉我这件事情还有可能往哪些方向优化。" 我也没有 AI 懂,你不如直接去问 AI。所以,大家会发现在工作当中,我们相当于引入了一个更好的第三方。
最后,在决策上也是这样,我们现在已经不是拍腦袋想了,而是每一次都跟 AI 聊聊。我的很多想法都是跟 AI 聊出来的。
所以,我强烈建议大家在关注新闻的同时,自己更多地用起来。所有事情都是可以用上 AI 的,就看你想不想得到。真正稀缺的不是知识,而是实践的机会。大家一定不要挖空心思去搞懂 OpenAI 在干嘛,业外人也搞不懂,赶紧把这些东西全部用一遍,然后在生活当中创造 100 个实践的机会。这些机会会逼着你去更好地学习,然后这些更好的学习可以帮助我们创造更多的可能性。
////// END //////