只要你用ReLU，就是“浅度学习”：任意ReLU神经网络都有等效3层网络 - 大酷樂

今天小编分享的科学经验：只要你用ReLU，就是“浅度学习”：任意ReLU神经网络都有等效3层网络，欢迎阅读。

只要你用了 ReLU，我们就是好朋就是 " 浅度学习 "。

最近有研究证明，所有基于 ReLU 的深度神经网络都可以重写为功能相同的 3 层神经网络。

基于这个证明，伦敦国王学院的研究团队还提出一种为任意 ReLU 网络找到相应浅层网络的算法。

由此产生的浅层网络是透明的，可用于解释网络的行为。

只要通过算法，就能找到任意深度 ReLU 网络的对应浅层网络。

对此网友惊呼：我要读这篇论文，立刻马上！

任何深度 ReLU 网络都是浅层的

ReLU 是深度学习领網域最常用的一种激活函数，由 Nair & Hintonw 在 2010 为限制玻尔兹曼机 ( restricted Boltzmann machines ) 提出的。

由于常常在实践中有着比其他常用激励函数（例如逻辑函数）更好的效果，而被深度神经网络广泛用于影像识别等计算机视觉人工智能领網域。

论文指出，每个深度 ReLU 网络都可以转换为一个功能相同且具有 " 三个隐藏层 " 的浅层网络。并提供了一个找到对应浅层网络权重的算法，提高神经网络的全局可解释性。

简单来说就是，通过划分输入空间，使用线性函数对每个分区进行建模，来实现深层网络浅化。

具体分为这三步。

首先，需要构建一个将线性模型和半空间编码的第一层，通过使用一个矩阵来表示半空间条件，其中每个行向量表示一个半空间的线性方程。

然后，构建第二层，该层根据输入的所属区網域决定哪些边界是活跃的。

最后，构建第三层，通过将输入与每个线性模型相乘并使用指示函数来选择正确的模型。

基于此，每一个深度 ReLU 网络都可以被转换为一个功能上相同的三层网络，其权重值在扩展实数中。

当然要完成浅化，还需要一些咒（suan）语（fa）。

根据论文，使用算法时只需找到 H、c、α、β 这些参数，并知道每个区網域所需的半空间就可以，主要分三步。

首先，识别可行的模式集，对于每个可行模式，计算全局线性规划的参数 A ( l ) 和 d ( l ) 。

然后，确定半空间条件，将这些矩阵堆叠起来，确定每个激活模式的半空间条件。最终得到矩阵 H 和向量 c。

最后，计算局部线性模型，根据模型的权重和激活模式，使用显式公式，计算局部线性模型 α 和 β。

简单理解，就是根据已训练好的网络，通过启发式搜索在可能的神经元激活空间中找到合适的权重值。

通过构建浅层白盒网络，能够快速计算出每个数据点的 SHAP 值，大大提高数据的可解释性。

实验表明，通过上面算法就可以找到给定深度 ReLU 网络对应的浅层网络的显式权重。

网友：实验很酷，但也有些问题

论文很新颖的提出一个算法，可以实现 " 深转浅 "，不过该方法仍有一些缺点。

比如构建浅层网络使用了无限权重，尽管这些权重可以在 Python 中实现，但不能使用梯度下降进行微调。

当然，" 找茬儿 " 这块，怎能少得了热心肠的网友。

根据论文可以发现，如果使用团队提供的算法，实验过程中计算时间其实是会随着神经元数量增加呈指数增长。

所以就有网友提出疑惑：算法运行时间与神经元数量成指数关系，12 个神经元需要近 10 分钟，那计算一个普通大小的 DNN 所需时间岂不是长了去了……

网友指出：假设单层神经网络可以计算任何函数，那么对于任何神经网络来说，这不是都成立吗？

对于这个研究，也有网友犀利表示：这就是个「普遍逼近定理」，没什么大惊小怪的。

不过无论网友怎么说，这篇论文仍然有一些出彩点。

比如，通过这个方式得到的浅层网络是透明的，可以用来生成模型行为的解释。

此外还提供了用于复现实验的代码，供其他研究人员使用来探索和实验。

论文地址已经贴在下面，感兴趣可以去看看～

论文传送门：

https://arxiv.org/abs/2306.11827

参考链接：

[ 1 ] https://twitter.com/mathemagic1an/status/1672430954152083456?s=46&t=iTysI4vQLQqCNJjSmBODPW

熱門排行

比亚迪海洋网全新中型SUV“海狮06 繁綺文 | 2025-04-15
一代歌后：承诺终身不改嫁，丈夫去世4 郟君昊 | 2025-04-15
16日附加赛前瞻：勇士魔术被看好晋级郜萌運 | 2025-04-15
奥地利陆军装备首批“夜战士”突击嬴覓晴 | 2025-04-15
“年轻人首台阅读本”掌阅 iReader 嬴覓晴 | 2025-04-15
胡塞武装麻烦大了？沙特出动7万大军，嬴覓晴 | 2025-04-15
形势逆转，欧盟不许中国电动汽车卖太郜萌運 | 2025-04-15
「豁免」无效，关税「横跳」，苹果和英郟君昊 | 2025-04-15
特斯拉车辆保险费用猛涨，涨幅超美国郜萌運 | 2025-04-15
雷军时隔9天再发微博：感谢大家支持佼昌翰 | 2025-04-15
高露现身上海虹桥机场黑色外套点缀亮色爱心装饰俏皮亮眼惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最强芯袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表情庆祝賁芳蕤 | 2023-05-02
曹操墓，里面都有啥？衛青柏 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露面賁芳蕤 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花板”？謝飛揚 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖尿病人集玲琳 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望袁曼雁 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游戏+AI”能否逆风翻盘？衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15日寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修正案集玲琳 | 2023-05-02
解除资格！停止一切合作佼昌翰 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
3699起联想小新mini主机上架 13代酷睿标压处理器習又夏 | 2023-05-05
前董事长被免，天山生物全面进入“中植系”时代？股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线涨幅汇总袁曼雁 | 2023-05-07
事关农村土地承包和农民权益，《农村土地承包合同管理办法》5月1日起施行郟君昊 | 2023-05-02
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
200户连夜疏散，原因让人愤怒！“损失超一亿”，官方通报袁曼雁 | 2023-05-03
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的生活》证实将停办佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《与凤行》…在路上了惠惠君 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊带裙大秀好身材嬴覓晴 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，不容小觑幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02