大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

三位数学家改写经典牛顿法!300年前算法一夜更新,收敛速度更快函数范围更广

2025-03-27 简体 HK SG TW

今天小编分享的科学经验:三位数学家改写经典牛顿法!300年前算法一夜更新,收敛速度更快函数范围更广,欢迎阅读。

300 年经典牛顿法,迎来重磅更新!

三位普林斯顿数学家找到更快更强的解法,其中还有一位是华人。

牛顿法是啥?学过高数的同学想必并不陌生,它通过不断求导来寻找复杂函数 f(x)接近零点的最优解。

就是这么一个非常简单的「近似求解」算法,因为收敛速度非常快,时至今日它仍被广泛应用在计算机视觉、物流、金融甚至纯数学问题等各个领網域,比如开发能够区分交通信号灯和停车标志的自动驾驶汽车。

但即便这么强大,牛顿法也存在一个缺点,那就是不适用于所有函数。

于是乎,过去几个世纪诸多数学家前赴后继企图在此基础之上进行优化。现在这三位数学家成功将可适用的函数范围一扩再扩。

比如像这个复杂的二元函数。

与传统牛顿法相比,新方法展现出来的更连贯,覆盖也很大。

一合著者表示,牛顿法在优化中有 1000 种不同的应用,而他们的算法有可能取代它。

来看看究竟是咋回事儿。

三位数学家改写经典牛顿法

牛顿法(Newton ’ s Method)诞生于 17 世纪,由大名鼎鼎的英国数学家牛顿首次提出。

其核心思想是,通过不断逼近函数的根或极小值点,以寻找函数的最优解。

通俗来说,这有点像在陌生环境里蒙眼寻找最低点。在行走过程中,我们唯一需要的信息在于两点:1)自己是否在上坡或者下坡,即斜率(函数的一阶导数);2)以及坡度是增加还是减少,即斜率本身的变化率(函数的二阶导数)。

利用上述信息,我们可以相对快速地得到一个近似值。

若将这一过程用数学方法来表示,则具体如下:

Make a guess(做一个猜测):选择一个接近你认为可能是最小值的起始点,作为寻找函数最小值的起点;

Model the curve(模拟曲线):在该点附近构造一个抛物线,以近似原函数的形状;

Find the next point(找到下一个点):计算抛物线的最低点,以此作为新的迭代点;

Repeat(重复):使用新的迭代点重复上述步骤,逐步逼近函数的最小值;

Keep going(继续进行):持续迭代,直至找到函数的最小值。

牛顿证明了,只要不断重复上述过程,最终就会逼近原始复杂函数的最小值。

而且和类似迭代方法(如梯度下降)相比,牛顿法虽然每次迭代的计算成本高于梯度下降,但在效率方面优势明显。

简单来说,牛顿法收敛速度相比梯度下降法更快,即在更少的迭代次数内找到最小值,因此也适用于多种情况。

不过牛顿当时也提醒:

虽然这一方法在大多数情况下有效,但如果一开始从一个距离真实最小值太远的点开始,则可能越跑越偏。

而且更麻烦的是,牛顿法还存在一个显著缺点——不适用于所有函数。

其核心策略是将一个复杂函数转化为一个更简单的函数,而一旦函数过于复杂,它也同样没辙了。

因此后来数学家们努力的方向在于,在不牺牲效率的前提下扩大算法使用范围。

直到去年夏天,三位研究人员发表了对牛顿法的最新改进。

将牛顿法扩展到迄今为止最广泛的函数类别

具体而言,他们发现牛顿法在处理某些复杂函数(如高次幂函数)时效果不好,这是因为它依赖于函数的泰勒展开(一种使用求导和多项式逼近原函数的手段),而这个展开并不总是能很好地描述原函数,特别是当函数有很多 " 山谷 "(局部最小值)时。

于是他们提出,如果一个函数满足两个条件,那么它就更容易找到最小值:

凸形(Convex):函数的形状像一个碗,只有一个 " 山谷 "

平方和(Sum of Squares):函数可以表示为一些平方项的和

前者意味着如果从任何位置开始寻找,都不会陷入局部最小值的问题,因为只有一个最小值,而且无论从哪个方向开始,都会滑向这个唯一的最低点。

后者意味着可以很容易地识别和计算函数的最小值,因为平方和形式的函数特别容易处理,其平方数总是非负的,而且它们的最小值是 0。

接下来,为了满足上述条件,他们使用了一种叫做半定规划(Semidefinite Programming)的技术来调整泰勒展开,具体步骤如下:

1、微调泰勒展开。不直接使用函数的泰勒展开,而是对其进行微调,使其既凸形又可以表示为平方和。

2、增加调整因子。在泰勒展开中加入一个调整因子,这个因子可以帮助他们控制展开的形状,使其更接近原函数,同时满足凸形和平方和的条件。

3、多导数收敛。他们的方法可以使用任意多个导数来进行泰勒展开,这意味着他们可以更快地找到函数的最小值。使用更多的导数可以让算法以更高的速度(比如立方速度)收敛到最小值。

最终他们创造了这种更强版本的牛顿法,能够以更少的迭代次数找到最小值。

他们的算法如下:

在下面这个函数中,与传统牛顿法相比,其改进版本(第三阶牛顿法)在理论上提供了更快的收敛速度,并且在实践中可能比经典牛顿法更有效,尤其是在初始点离最小值点较远的情况下。

一位华人参与

这项工作是三位数学家在普林斯顿大学期间合作完成的。

其中华人Jeffrey Zhang,目前是耶鲁大学生物医学信息学与数据科学博士后研究员,研究方向包括大型语言模型、数据科学和统计学、计算复杂性、多项式优化、博弈论和机制设计。

此前在普林斯顿大学获得运筹学和金融工程博士学位,导师正是同为该论文作者的Amir Ali Ahmadi教授。

更早之前,他在 2014 年获得耶鲁大学计算机科学和经济学与数学学士学位。

另一位作者Abraar Chaudhry也是 Amir Ali Ahmadi 教授的学生,现乔治亚理工学院博士后研究员。在普林斯顿攻读博士之前,他在布朗大学读本科。

事实上,在这三位数学家出现之前,有很多数学家都进行了尝试。

最早 19 世纪,被称为「俄罗斯数学之父」的 Pafnuty Chebyshev 提出了一种牛顿法,用三次方程(指数为 3)近似函数。

不过当原始函数涉及多个变量时,他的算法就会不起作用。

更近的一次,2021 年俄罗斯数学家 Yurii Nesterov 展示了如何使用三次方程有效地逼近任何数量的变量的函数。

但他的方法无法扩展到使用四次方程、五次方程等近似函数,否则会降低其效率。

现在,3 位数学家将内斯特罗夫的结果又推进了一步。

与牛顿法的原始版本一样,这种新算法的每次迭代在计算上仍然比梯度下降等方法成本更高。

因此,目前这项新工作不会改变自动驾驶汽车、机器学习算法或空中交通管制系统的运作方式。在这些情况下,最好的选择仍然是梯度下降。

宾夕法尼亚大学 Jason Altschuler 表示:许多优化理念需要花费数年时间才能完全付诸实践。不过这似乎是个全新的视角。

如果随着时间的推移,运行牛顿法所需的底层计算技术变得更加高效,使得每次迭代的计算成本更低,那么 Ahmadi、Chaudhry 和 Zhang 开发的算法最终可以在包括机器学习在内的各种应用中超越梯度下降。

合著者表示,从理论上讲,他们目前的算法确实更快。

论文:

https://arxiv.org/pdf/2311.06374

参考链接:

https://www.quantamagazine.org/three-hundred-years-later-a-tool-from-isaac-newton-gets-an-update-20250324/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  完  —

最后一周!2025 年值得关注的 AIGC 企业产品 报名即将截止

下一个 AI" 国产之光 " 将会是谁?欢迎申报奖项!

本次评选结果将于 4 月 16 日中国 AIGC 产业峰会上公布。

一键星标

科技前沿进展每日见

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們