大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

见证历史!AI想的科研idea,真被人类写成论文发表了

2024-12-18 简体 HK SG TW

今天小编分享的科学经验:见证历史!AI想的科研idea,真被人类写成论文发表了,欢迎阅读。

天啦撸!!AI 想出来的 idea,还真有人写成论文了。

甚至预印本 arXiv、博客、代码全都有了。

今年 8 月,Sakana AI(由 Transformer 论文 8 位作者的最后一位 Llion Jones 创业成立)这家公司推出了。

而现在,受其中一篇论文想法的启发,人类研究员真的写出相关论文并在 arXiv 上公开了。

OpenAI 前研究团队负责人 Jeff Clune 激动直言:

简直不敢相信!这是它产生的我最喜欢的想法之一。看到与人类达成一致真是太酷了,人类确实执行得更好。

话不多说,让我们来康康论文具体内容。

翻开 "AI 科学家 " 之前撰写的论文,我们找到了 Jeff Clune 提到的这一篇。

《Grokking Through Compression: Unveiling Sudden Generalization via Minimal Description Length》

通过压缩实现 Grokking:借助最小描述长度(MDL)揭示突然泛化现象

根据描述,这篇论文的想法由 Claude 3.5 Sonnet 在第 22 次迭代时提出。

它主要探讨了神经网络中最小描述长度(MDL)与 "grokking" 现象(模型经长时间训练后突然泛化)的关系,从信息论视角研究突然泛化的机制。

其中,MDL 可以被看成一种衡量模型复杂度和可压缩性的方法,即模型既要能够很好地拟合数据,又不能过于复杂(避免过拟合)。

具体而言,研究引入了一种基于权重剪枝的新型 MDL 估计技术,并将其应用于多种数据集,包括模块化算术和排列任务。相关实验揭示了 MDL 减少与泛化能力提高之间存在强烈的相关性(下图),MDL 的转变点通常在 "grokking" 事件发生之前或与之同时出现。

此外,研究观察到在 "grokking" 与非 "grokking" 情境下 MDL 演变模式的差异,前者以快速的 MDL 减少后持续泛化为特征。这些发现为理解 "grokking" 的信息论基础提供了见解,并表明在训练期间监控 MDL 可以预测即将发生的泛化。

Okk,了解了原论文,我们再来看人类选手最新发表的内容。

概括而言,他们研究了神经网络在 "grokking" 现象中的复杂性动态,即网络从记忆训练数据到实现完美泛化的过渡过程,并提出了一种基于失真压缩理论的新方法来衡量神经网络的复杂性。

首先,作者之一 Branton DeMoss 自述,他们受到了 Sean Carroll 和 Scott Aaronson 之前研究的启发。

通过观察咖啡与奶油混合的现象,Scott 等人发现复杂性随着时间的推移首先上升,然后下降,这一过程与熵单调增加的趋势相似。

而 DeMoss 团队形式化了这一直觉,并将其应用于神经网络,以跟踪这些网络学习的抽象复杂度。

展开来说,作者们同样先介绍了grokking 现象,即神经网络在长时间过度拟合训练数据后突然能够泛化的能力。

其中 x 轴表示优化步数,y 轴表示准确率;红线代表训练集的准确率,绿线代表验证集的准确率。

可以看到,如果训练一个小型 Transformer 来进行模拟,在几百个训练步骤之后,模型已经完美地拟合了训练数据;然而,它直到大约 10^5 个训练步骤才能实现泛化。

为了解释这一现象,团队引入了一种基于失真压缩和 Kolmogorov 复杂性的新方法来衡量神经网络的复杂性,并通过这一框架追踪了 grokking 过程中网络复杂性的动态变化。

按照作者的比喻,这就像 " 神经网络的 JPEG"。

研究结果表明,网络在从记忆到泛化的过渡中,其复杂性首先上升,随后在泛化发生时下降。

进一步地,研究发现如果神经网络没有任何形式的正则化(一种防止过拟合的技术),它将无法从记忆阶段过渡到泛化阶段,而是会无限期地保持记忆模式。

没有正则化的反应:

有正则化的反应:

此外,作者指出传统的复杂性评判标准(如参数数量和权重范数)并不能准确描述模型的复杂性,因为它们忽略了训练过程中的变化。

对此,他们采用了最小描述长度(MDL)原则和 Kolmogorov 复杂度来定义和近似复杂性,并通过实验验证了这种方法,并强调了简单模型在数据压缩中的优势。

最终,研究表明理解复杂性对预测模型泛化能力至关重要。

更多细节感兴趣可以查阅原论文(地址文末)。

可以看出,一个由 AI 最初提出的想法,最终由人类来完成了更细致的论证。

有网友就分析指出 AI 写的那篇实验结果不及人类研究员:

而之前撰写过 "AI 科学家 " 总论文的共同一作 Cong Lu 也表示:

谁知道未来 AI 还会激发出哪些其他想法……

BTW,就在 Sakana AI 公布"AI 科学家独立生成 10 篇学术论文 "的消息后,公司在 9 月份还拿到了一笔2 亿美元的 A 轮融资,里面还有英伟达的参与。

总之,AI 以后不仅能自己写论文,还能和人类搭配干活了。

论文:

https://arxiv.org/abs/2412.09810

GitHub:

https://github.com/brantondemoss/GrokkingComplexity

博客:

https://brantondemoss.com/research/grokking/

参考链接:

[ 1 ] https://x.com/cong_ml/status/1869135740275450197

[ 2 ] https://x.com/BrantonDeMoss/status/1868666711890706675

—  完  —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們