大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出

2025-03-31 简体 HK SG TW

今天小编分享的科学经验:推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出,欢迎阅读。

当 Scaling Law 应用于推荐场景,模型又将如何表现?

中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出推荐模型性能定律,首次对模型的性能与模型、数据的规模和质量进行了定量分析。

针对现有工作只能对推荐大模型 Scaling Law(扩展定律)做定性分析的局限性,论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。

具体地,相较于传统大模型扩展定律里的数据量指标,考虑推荐领網域的数据特性提出了序列数据的质量衡量指标,并从模型性能预测角度出发避免传统扩展定律带来参数增大导致的模型过拟合问题。

最终基于论文发现的推荐大模型性能预测定律,能够在给定的数据集和模型配置下,有效预测模型的扩展潜力,同时实现模型参数的最优性能配置。

下面具体来看。

提出推荐大模型性能预测定律

序列推荐系统旨在根据用户过去的互動记录预测下一个推荐给用户的物品,以此来捕捉用户的动态偏好。

近年来,随着商业和互联网场景中用户数据量的急剧增长,推荐系统受到了越来越多的关注。然而,为了处理这些庞大的数据集,商用与学术领網域均开始采用更为复杂和庞大的推荐模型。

这些模型的高计算要求不仅带来了巨大的开发成本,而且还使得开发过程中的资源分配和 GPU 使用变得充满挑战。

如上图所示,为了更好地预测推荐模型在不同情况下的性能,研究者们开发了一系列的扩展定律,用于在无需进行大规模实验的情况下评估和预测模型效果。

扩展定律最初在大型语言模型中进行探索。例如 Chinchilla 扩展定律的通过模型参数数量和训练样本的数量来预测预训练损失。

然而,将扩展定律应用于推荐系统分析面临两大主要挑战:

( 1 ) 与扩展定律中通常考察的模型损失指标相比,推荐模型中性能指标(如命中率)更为重要,由扩展定律导向的增大模型规模虽然能使模型损失降低,却会由于模型过拟合问题导致性能出现衰减。

( 2 ) 除了数据的规模之外,推荐系统的数据集通常具有结构和协作特性,同时重复序列片段和冗余度较高,这使得数据质量成为影响结果的核心因素,但在现有的推荐模型扩展定律中尚未被充分讨论。

这些挑战使得现有的推荐系统扩展定律工作仅仅给出了一些定性的分析,并不能对模型的精度进行定量预测。

为应对这些挑战,研究人员提出了推荐大模型性能预测定律,首次对模型的性能与模型、数据的规模和质量进行了定量分析。

通过拟合推荐模型的关键性能指标,包括命中率(HR)和归一化折扣累积增益(NDCG),可以定量预测模型的层数和物品嵌入维度对其性能的影响。

此外,为了应对数据质量研究因素匮乏的挑战,引入了近似熵(ApEn)作为评价数据质量的创新性指标,将原有扩展定律中的数据规模替换为数据规模与近似熵之比,并通过理论和实验验证了这一替代的合理性。

研究人员也对提出的大模型性能预测定律进行了应用实验,有效地预测了模型的最优性能参数配置和扩展潜力。

引入近似熵因子

如前所述,研究人员引入了近似熵因子,以进一步增强序列推荐系统中的扩展定律。

具体来说,近似熵是一种用于量化时间序列数据的规律性和不可预测性的统计测度,其计算方法如下:

首先,对于一个长度为 N 的时间序列 {   } 以及参数 m(嵌入维度)和 r(容差),构造 m 维向量 = [ ,+1,…,+m-1   ] ,其中 =1,…,N-m+1 。然后,定义两个向量和之间的距离为:

接着,对于给定的容差 r ,计算相似性度量:

平均相似性的计算公式为:

最终,近似熵定义为:

在后续对近似熵的计算中,研究人员将容差设定为 r = 0 。这一决定是基于推荐物品的独特特性,其中具有相似 ID 的产品可能传达完全不同的意义。

总的来说,近似熵值越高,数据的重复率越高。

然而,传统熵通常与数据复制率呈现负相关性。因此,尽管 ApEn 被冠以 " 熵 " 的称谓,但其变化趋势与传统熵指标具有相反特性。

为避免概念混淆,本研究采用ApEn ′ =1/ApEn 作为近似熵的最终测度。研究人员进一步引入数据平均最小编码长度作为最终的数据质量衡量指标。

由于重复的序列模式均可用相似的编码表征,从而降低平均最小编码长度,该指标将保障数据的最小可学知识量、有效防止重复与无效数据导致的数据量虚高问题。

研究证明了最小编码长度有如下的下界保障引理。

假设用户序列可以被建模为一阶非周期性平稳马尔可夫链。如果用户序列为 S={S,∈ U } ,那么所有序列的最小编码长度之和 |U|L ( C ) 由以下公式给出:

这个下界表达了在给定的用户序列情况下,最小编码长度应该至少等于序列元素长度总和除以序列的近似熵。这个不等式利用了近似熵的概念来提供编码效率的下界。

于是研究人员将 D ′ = ∑∈ U|S| · ApEn ′ ( S ) 代入了原有的扩展定律公式 D。

研究人员进一步证明能将每一项参数用 1/x+log ( x)的形式以加入衰减项,从而优化性能拟合。他们拟合模型的最终形式为:

其中 N 为模型层数,demb 为嵌入维度,D ′ = ∑∈ U|S| · ApEn ′ ( S ) 为数据质量衡量指标,其余均为拟合参数。

实验环节验证实验

研究人员的验证实验目标是验证理论的准确性,主要从两个方面进行:一是其模型是否符合扩展法则,二是使用近似熵(ApEn)和标记数量来评估数据规模的方式是否合适。

他们首先检查模型损失曲线与扩展法则的一致性,从影像上可看出实际模型性能非常贴合其表现定律。

然后,数据参数 D ’加入参数进行一并拟合,以研究其影响因素。在下图中他们拟合的数据参数与 ApEn 的组合呈现出明确的线性关系,这证明了理论的有效性。

应用实验

由于性能法则中包含衰减项,使得实现全局最优解成为可能。

在前述拟合分析的基础上,研究人员在下表从全局和给定参数规模篇两个方面利用 Performance Law 给出了两个参数最优拟合,均获得了较好的结果。

同时研究人员也可以在小规模实验上分析拟合参数对模型增大时的提升潜力与全局最优性能进行预测。

他们在下表验证了这个应用,在更小的衰减项参数上模型的扩展潜力更大,最优结果更强。

更多细节欢迎查阅原论文。

论文链接 :   https://arxiv.org/abs/2412.00430

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  完  —

学术投稿请于工作日发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容‍

附上论文 / 项目主页链接,以及联系方式哦

我们会(尽量)及时回复你

点亮星标

科技前沿进展每日见

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們