大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 教育

OpenAI急了?我们应该抓住哪些变量?

2025-01-01 简体 HK SG TW

今天小编分享的教育经验:OpenAI急了?我们应该抓住哪些变量?,欢迎阅读。

在过去的一个月,OpenAI 连续推出 12 场重磅发布会:

Day 1:满血 o1 上线,ChatGPT Pro 会员上线,o1 pro 推出,AI 有了类人 " 思考 " 能力。

Day 2:基于 o1 的强化微调,人人都能训练专家模型,专业门槛直线下降。

Day 3:Sora 正式发布,AI 开始 " 看懂 " 现实世界。

Day 4:ChatGPT Canvas 全员开放以及小功能更新,写文章、写代码一气呵成。

Day 5:全面接入苹果生态,打造更自然的多设备跨平台操作体验。

Day 6:4o 的实时视频理解上线,多模态让 AI 看懂视频内容。

Day 7:ChatGPT 上线   "Projects 项目 " 功能。

Day 8:ChatGPT Search 全量开放,更新 AI 搜索功能,挑战传统网络搜索。

Day 9:满血 o1 API 正式开放,大幅降低 API 调用价格。

Day 10:从最新款的 iPhone 到老式的翻盖机,能直接和 ChatGPT 打电话聊天了。

Day 11:应用更新,桌面版 GPT 可以跨应用互联,告别繁琐的复制粘贴对话。

Day 12:OpenAI o3 正式发布,超级智能模型震撼登场,向 AGI 又迈进了一大步。

每一天的发布会都是振聋发聩的技术突破与产品创新,这些前所未有的技术加速度正在深刻改变全球的商业格局、产业生态以及个体的能力边界。

AI 将带来哪些行业巨变?

AI 离取代人类又近了一步?

AI 在哪些能力上已达到了人类的水平?

12 月 28 日,混沌邀请到了硅谷知名华人 AI 科学家田渊栋博士,脉脉创始人兼 CEO 林凡,云迹科技创始人、混沌学园校友支涛,云九资本合伙人、混沌创新领教任鑫,混沌合伙人、混沌创新领教张雷等 AI 行业从业者、专家们一起解读了 OpenAI 的这 12 场发布会。这不仅是一场关于 AI 技术趋势的分享,更是一场关于个人未来发展的思考。AI 带来的不仅是工具的进化,更是思维的迭代与格局的重塑。在 2025 即将到来之际,让我们站在技术与人性的交汇点,重新审视未来的可能性。

以下为部分分享内容精华笔记:

‍田渊栋博士:OpenAI o3 的表现依然惊艳

前段时间,OpenAI 连续开 12 天的产品发布会,内容大致包括增强的 ChatGPT o1 模型、Sora 视频生成模型和 o3 模型。另外,还有一些技术上的突破,包括推理模型 o1、强化微调技术、文生视频 Sora、写作和编程工具 Canvas、与 Apple 生态系统的深度整合、语音和视觉功能、ChatGPT 搜索、打电话和 WhatsApp 聊天等功能。

总体来说,前 11 天没有什么太多的惊喜,第 12 天出现的 o3 相对具有一定的创新能力。它的能力主要表现为解决了之前的一些技术难题,我认为有三个值得一提的亮点:

1. 在 ARC-AGI 测试中 o3 的成绩远超其他模型。ARC-AGI 测试就像是为人工智能准备的一个特殊 " 考试 "。它不是考 AI 背诵了多少知识,而是测试 AI 是否真的具备 " 理解力 " 和 " 思考力 "。对目前的 AI 技术而言,一般的大模型在 ARC-AGI 测试中的成绩大约都在 25%-50% 之间,而 o3 的最低成绩为 75.7%,最高成绩为 87.5%,有着巨大差距。

2. o3 在全球著名的编码竞赛平台 codeforces 中刷出 2727 分,达到此分数的程式员不到 200 人,之前 2073 分已相当于终极者,而 o1 是 1891 分。这意味着在竞争性代码方面,o3 已经达到了世界顶尖程式员水平。

3. 今年 11 月 o3 在陶哲轩等 60 余位全球数学家共同推出的号称业界最强数学基准的 EpochAI Frontier Math 中创下新纪录,准确率达到 25.2%。而今天所有其他模型的准确率都低于 2%。联手 60 多位数学家出题的陶哲轩,曾认为这项测试能够难住 AI 好多年。如今,这一说法被 OpenAI o3 推翻了。

可以看到,o3 在各方面的表现都让人惊艳,因此很多人判断它会影响未来世界的样态。

‍田渊栋博士:AI 正在掀起一阵洪流

计算机普及以后,它的普遍性就像水一样。反观大模型,随着它的不断发展,也会出现同样的情况。AI 出现之前,创业的模式是找很多人组建一个团队,团队里的每个人需要不断地试炼和培训才能成为一名有用之才,这一过程大约需要 20 年的时间。但如果 AI 变得非常便宜,创业者就可以以极低的成本获得稳定性和乐此不疲的劳动力。到那个时候,市场会是什么样子难以想象,但对于创业者来说,成本和风险会降低很多。

AI 的分析能力非常强大,因为它有一个巨大的资料库。我用过一些 AI 工具,我感觉它们很像小镇做题家,通过大量的训练不断地提升自身的能力,最终寻找到解题的方式。因此它的出现未必对所有人来说都是好事情,例如那些习惯用做题思维解决问题的人。因为 AI 的水平很大程度上可以取代一些重复性的劳动,做题思维可替代性很高。这告诉我们:不要以一种高考做题家的状态去工作和生活,要保持思维的活力和创造力。这样我们才可以尽量避免被 AI 淘汰。

AI 到来之前,我们的世界布满了山峰,每个山峰上都站着行业里最优秀的人。AI 到来之后,它掀起了一阵洪流,让一些山峰上的人被冲刷,以至掉落。留下来的人,只会是最具创造性、不可替代性的人,同时也是领網域里的专家。这大概会在十年内发生。

‍田渊栋博士:2025 的活法,是让 AI 来加速自己

我认为在 2025 年,AI 会更快速地发展。加速到一定程度之后,每个人都会开始使用 AI,以防止自己的效率远低于其他人。如果这一猜想变成现实,人的价值感会受到影响。我的价值是什么?人类独一无二的价值是什么?这是每个人都要面对的问题。

这个问题很难回答,但我们可以在行动中不断地接近问题的答案,比如我愿意通过写小说找到一些存在的价值,这是我自我定位的一个锚点。AI 的出现在提醒我们,人最终要找到自己的独一无二之处,立足世界的生态位。在寻找的过程中,我们可以利用 AI 加速自己的发展,把 AI 集合起来,让它们成为自己的将领,协助你做成想做的事。

‍脉脉林凡:OpenAI 的发展遇到了瓶颈

从这次 12 天发布会来看,OpenAI 的发展受阻了。整个模型的核心能力没有如预期一样实现 Scaling law 增长,这其中的主要问题不是算力,而是数据。总体来看,现在所有的模型训练基本上耗尽了高质量的数据,哪怕通过合成数据或其他方式来逼近都无法产生足够的效应。

这是为什么?首先,AI 的听觉能力目前无法增强;其次,视觉数据方面有太多的噪音(比如 YouTube 上的视频),海量信息的杂糅,让 AI 去理解世界、生成内容存在比较大的限制。

因此我们可以判断,OpenAI 遇到了瓶颈期。有一个很简单的道理——如果核心能力足够强,其实不用讲太多的内容。正如此前的 ChatGTP-4,只需要一场发布会就足以震惊世界。而这次为期 12 天的发布会却没有掀起之前那么大的火花。对我们创业者来说,可以根据这次 OpenAI 的情况来计划未来一两年的创业路径。一定要记住一件事:对于核心基座的能力,它的突破速度没有那么快。

‍脉脉林凡:o3 大大提高了 AI 应用爆发的可能性

打一个比方,如果用高铁来去形容 AI 的能力进展的话,GPT3.5 相当于每小时 120 公里的火车速度一下提到了每小时 200 公里,速度翻了将近一倍,对于很多人来讲,已经是一个很大的进步了。GPT4 出来的时候,相当于每小时 200 公里提高到每小时 350 公里。那么 o3 呢?相当于提升到了每小时 450 公里。对于做研究的同学来讲,已经是很大的提升了。但是,作为一个普通消费者,一列 350 公里时速的高铁和一列 450 公里时速的高铁,对生活的影响就比较小了。为什么?从 3 小时的旅程变成了 2 小时 20 分钟的旅程,时长变化的体感并不强烈。

在技术上,不管是九月份发布的 o1,还是 12 月份发布的 o3,其实都是在 Post-Train(后训练)环节做出了比较大的突破,比如思维链的训练、强化学习方面做了很多处理。很多跟我们一样做过 AI 应用,尤其是 To B 的 AI 应用的人会有一种体感,我们去做 agent,去做工作流,其实是在 OpenAI 上面去打了一堆的业务补丁,业务的状态机控制在顶层,然后通过顶层的状态机去让 AI 做 1、2、3、4、5、6 的事情。当然,这个过程很痛苦,因为有的时候它真的很不听话,你要它这么干,它却干出了另外一件事情出来。

所以,现在 OpenAI 做的 Post-Train 这件事情,相当于把你上层的逻辑内化到了模型内部,做了内置,这样就会降低后链路开发的难度和复杂度。在新的一年里,AI 应用开发的难度会降低,效率和大爆发的可能性会极大提高。这件事情我觉得是需要关注和重视的。

‍脉脉林凡:AI 的创业机会不在 To B,在 To C

对于中国创业者而言,To B 行业的 Agent 开发或 workflow 的优化都不是我们的机会。美国的 To B 生态非常发达,很多创业者做完 workflow 的优化后马上就能赚到钱,但中国只适合大厂去做这件事,并且他们自己就能做,不需要找创业者。

在这种情况下,To C 是创业者们唯一的机会。Realtime API 是一种实时语音互動 API,支持文本和音频作为输入和输出,比我们原先用的 TTS、ASR 的效果好很多。在这个方面,Realtime API 的出现会让 To C 行业的互動产生巨变。例如,面向儿童群体的实时语音互動应用肯定会很受欢迎。但当前还缺乏一种类似于 Agent 这样的框架与之协同,因为仅依靠大模型的话准确度不高,需要一个可以控制的介质。一旦控制能力与实时语音互動能力结合在一起,会为整个 To c 行业的创业者带来一次巨大的突破机会。

‍云迹科技创始人支涛:AI 已超越了工具,其能力好比拥有了大理段氏的 " 六脉神剑 "

人类为了延伸体力和腦力制造了很多工具,比如火车、电腦、电动工具。这次 OpenAI 的发布会也发布了一系列我们梦寐以求的工具。在我看来,这些工具超越了 " 工具 " 的定义,变成了六脉神剑。它有自主力,学习力、互動力、适应力、情感力和社会力。按照目前的发展来看,AI 已经是生产关系和生产力的重要组成部分。

看完发布会以后,有没有觉得 AI 像是一个正在现实世界不断学习的学生呢。在回答我们问题的时候,是语文;在帮我们进行推理的时候,是数学和经济学;在辅助我们工作的时候,是工程技术、生命科学和管理学。一旦它们试图创新,则会逐个攻读哲学、心理学,甚至是组织行为学。

AI 这种硅基生物通过不断地迭代,从开始的辅助工具,逐渐演变为人类身边的助理,如果有一天,它们变成了智能体,就会成为我们的伙伴。一旦它们开始洞察世界,找到人类还没有发现的问题时,它们则化身为一个创新者的面貌出现在我们面前。

我们人类如何实现成长?对今天的我们来说,要先学习使用它们的方式,在它们的发展过程中掌握自身的领导力,最后创建一个 " 超级智慧的超个体意识 ",与 AI 做到你中有我,我中有你。这其中要让他们跟我们一样,使命、愿景、价值观对齐;在社会里高度统一的法律、法规、道德形成一致。

‍云迹科技创始人支涛:AI 在 To B 的应用场景需要进一步打开

重塑与 AI 的对话能力十分重要,因为这样才能让 AI 更好地为我们服务。中国企业在 To C 场景的推进较好,在 To B 的应用场景需要进一步打开。To B 里,需要更多的人转换思维模式,理解并用好 AI 来做职业增强,解决实际问题,创造价值。这也提醒了我们企业,不仅要给 To C 场景提供生产力,还要在 ToB 场景里提供生产关系。未来,希望中国企业能够快速发展,加大 To B 对 AI 的使用率。

‍云九资本合伙人任鑫:OpenAI 发布会与你无关

由于大家都是从业者,因此对 AI 格外关注,还会守着这次 OpenAI 发布会的直播。在这里我想给大家提供另一个视角,仅代表我个人的观点,只是给一些业外的朋友们一点建议:建议大家不要关心这件事,它不重要。

首先,如果你不是专业人士,不要花太多精力预测 AI 的未来。我常常会跟一些 CEO 或者研究员聊到这个话题,最后的结论是,很多业内专业人士的观点并不一致。这告诉我们要充分相信一件事——没有人知道未来会怎样。既然没有人知道未来会怎样,我们只要明确一件事:你现在的状态如何以及你想不想蹭到 AI 的红利。如果你的状态足够好,你可以有选择。但如果你现在的状态欠佳,心里又跃跃欲试,这个时候其实更不需要预测,因为你没有选择,必须参与。如果想要跟上时代趋势,你只能投身其中。

其次,要具体地思考问题,不要抽象地评判。OpenAI 会不会被 Google 打败?Deepseek 与 GPT-4o 哪一个更好?如果你是应用方,最好不要这样去思考问题。你的思考落点一定要非常具体,把具体的事物放置在你的场景里,判断它会产生什么样具体的结果,这才是业务导向的思维方式。

‍云九资本合伙人任鑫:不要想太多,先要多用起来

大家有可能听过一种说法,说 AI 应用不够广泛。但是实际我们调研下来发现,现在 AI 的应用已经极其广泛,只是大家没有大声吆喝。比如前几天的 OpenAI 掉线了一会儿,然后推特上铺天盖地都是学生在哭喊:我的论文怎么办?我要交作业!小朋友们用它来写作业这件事情已经非常普遍。然后国内大模型的应用场景当中,一个非常巨大的板块叫做写公文,写报告,也是铺天盖地地在用。

还有当你在网上招聘,你给他电话面试、视频面试的时候,很多小朋友已经在他的电腦上开了一个 copilot,你问任何问题,copilot 都会结合他的简历和回答来帮他实时作弊。所以,我建议大家不要低估世界的发展,年轻人已经都用起来了,如果我们没有用起来,只是我们老了而已。

我们是一家孵化器,我们会支持一些创业者帮他们把他们的产品实现。在大半年前,我们就已经做到了后端的代码没有一行是人类写的,全部都是 AI 写的。现在我知道已经有无数的公司做到了。

再举一个例子,前几天有一个同事让我看一个美国项目的招聘计划。但是实际上我是外行,我招他是因为他比我内行,如果按照以前的做法,我会跟他说,这个点你再想一想,我觉得可以怎么样,要不要再修改一下,外行指导内行。但是,前几天我给他的反馈已经变成了:" 这件事情你分三个维度,去跟 o1 聊半个小时,看看它能不能给你更好的建议。如果有的话,你回来告诉我这件事情还有可能往哪些方向优化。" 我也没有 AI 懂,你不如直接去问 AI。所以,大家会发现在工作当中,我们相当于引入了一个更好的第三方。

最后,在决策上也是这样,我们现在已经不是拍腦袋想了,而是每一次都跟 AI 聊聊。我的很多想法都是跟 AI 聊出来的。

所以,我强烈建议大家在关注新闻的同时,自己更多地用起来。所有事情都是可以用上 AI 的,就看你想不想得到。真正稀缺的不是知识,而是实践的机会。大家一定不要挖空心思去搞懂 OpenAI 在干嘛,业外人也搞不懂,赶紧把这些东西全部用一遍,然后在生活当中创造 100 个实践的机会。这些机会会逼着你去更好地学习,然后这些更好的学习可以帮助我们创造更多的可能性。

//////  END  //////

熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們