大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

从零复现,全面开源:360 Light-R1-14B/7B带来端侧AI平权时刻

2025-03-15 简体 HK SG TW

今天小编分享的科学经验:从零复现,全面开源:360 Light-R1-14B/7B带来端侧AI平权时刻,欢迎阅读。

性能领先、开源普惠、国产易获取的三重势能,造就了年初 DeepSeek 的技术平权狂热,掀起 AI 普惠浪潮。

然而,当很多人想在端侧部署 DeepSeek 模型时,却遭遇了挑战:部署满血版大模型需数万元硬體投入,退而求其次选择蒸馏版 14B 版本,又会出现性能断崖式下跌与响应延迟。

就在 AI 用户陷入 " 高成本部署 " 与 " 低质量妥协 " 的两难困境时,端侧 AI 的破局时刻,悄悄被 360 打开了。

近期,360 智腦团队发布了最强 14B 推理模型:Light-R1-14B-DS,是业界首次在 14B 模型上复现强化学习效果。数学能力上,表现超过 DeepSeek-R1-Distill-Llama-70B 和 DeepSeek-R1-Distill-Qwen-32B。

尽管只训练了 MATH 数据,但在 GPQA 科学常识评测中,7B/14B 双版本均超越对标产品,展现出 " 小参数大智慧 " 的泛化能力。

此外,配合 360 的全面开源策略(模型 / 数据 / 代码 / 技术报告全开放),这场端侧 AI 平权运动,意味着 14B 模型能在手机端流畅运行,意味着企业无需天价算力即可部署专业级 AI。

AI 端侧民主化的风暴眼,正在酝酿之中。

我们第一时间研读了 360 放出的技术报告,发现端侧 AI 的技术拐点已经出现。360 开源的 Light-R1-14B-DS 创造了三项行业纪录:

一是能力复现。Light-R1-14B-DS 首次在数学能力上,用 14B 模型复现了强化学习效果,通过多阶段课程学习 SFT和强化学习,Light-R1-14B-DS 的表现超过 DeepSeek-R1-Distill-Llama-70B 和 DeepSeek-R1-Distill-Qwen-32B,是目前最优的 14B 模型,这验证了 RL 强化学习策略的有效性,RL 对端侧模型训练的收益很大,仍有进一步挖掘潜力。

(Light-R1 训练流程)

二是效率革命。Light-R1-14B-DS 经过长思维链强化学习后训练,在 AIME 24 和 25 上分别取得了74.0 和 60.2的成绩,数学部分表现超越 DeepSeek 的 70B(72.6 分)和 32B(54.9 分)蒸馏模型,取得了非常显著的提升,这标志着推理能耗进一步降低。另一版本的 Light-R1-7B-DS,无需量化即可端侧部署。此次探索,在低成本复现 DeepSeek-R1 方面迈出了重要一步。

三是泛化能力增强。Light-R1-14B-DS 在科学常识评测 GPQA 上涨,打破了模型 " 灾难性遗忘 " 的魔咒,具有较好的泛化性,开辟模型优化新路径。

最强 14B 端侧推理模型,撕开了 DeepSeek 70B 的性能封锁线,端侧 AI 迎来了规模化普及的拐点。不过,在 AI 与大众之间,还差一个开源。

如果仅有技术突破,但没有开源机制,那么端侧推理模型再好,也无法被大众轻松获得、低成本用起来。

此次,360 采取了全栈式的开源策略——模型权重、22 万条数学数据集、RL 训练代码、技术报告等,都悉数公开。这种开源深度,远远超过了常规模型权重开放。

也就是说,中小团队仅需极少算力,就能从数据清洗到强化学习全链路复现,完成端侧 AI 的后训练与部署。

端侧 AI 的民主化,高度依赖于科技企业的开源策略,为什么说 360 此次开放端侧推理模型很重要?

对企业来说,传统端侧 AI 部署,会面临闭源模型高昂的授权费用(如 OpenAI API 调用成本)与硬體适配的边际成本(需定制化芯片或伺服器),成本难以承受。此前 openai 也发布过蒸馏版 o1-mini,但高昂的订阅费依然让大量开发者望而却步。此外,闭源模型存在不可解释性风险,医疗、法律等行业因合规要求无法接受 " 输入-输出 " 不透明的 AI 决策。因此,Light-R1-14B-DS 这样低成本、全开源的国产端侧推理模型,有望打消企业对 AI 的顾虑,轻松迈入智能化。

对个人来讲,云端模型需要上传数据,这会引发隐私泄露的顾虑。而在端侧离线运行大模型,又对算力 / 内存有更高的要求,传统端侧 AI 需要旗舰级设备,买不起旗舰机,就用不到好 AI,这形成了一种 AI 时代的 " 设备歧视 "。

360 开源最强 14B 端侧模型,让端侧 AI 能力不再是少数机型的特权,也可以下沉到普惠机型上,为大众所用。而用户规模的扩大,也会推动 AI 应用及大模型产品的增长。

由此看到,360 开源策略所带来的技术民主化,可以激活 AI 的长尾需求,加速 AI 普惠的到来。

终端设备,是用好 AI 的载体。推理模型下沉到端侧,应用空间也十分广阔,打开了端侧 AI 的无限想象空间。

预测一下,目前这两个最强端侧 14B/7B 推理模型,可能会首先落地在商业价值高的场景,然后一步步渗透进各行业。

首当其冲的,就是消费电子领網域。智能手机、手表、平板、PC、眼镜等终端设备,近两年都在加速 AI 化。

但此前 AI 化有两种方案:一是纯端侧,保证本地隐私安全,但内存要求高,功耗大;另一种是端云结合,部分任务上云处理。Light-R1-7B-DS 无需量化即可部署于终端设备(如手机、IoT 设备),标志着消费级硬體也能运行复杂 AI 任务。对比传统需要 32B 以上参数的端侧模型,其 7B 规模大幅降低内存占用和能耗。为 AI 终端带来了更大的创新空间,比如在手机本地运行复杂数学辅导、法律文书解析等任务,解决隐私和延迟痛点。

360 的技术突破与全栈开源,可以为消费电子领網域的 AI 探索带来非常有益的借鉴。

下一个就是重点行业、垂直领網域。金融、政务、医疗、法律等数字化基础较好的行业,积极拥抱 AI,又希望在本地化运行专业级 AI,避免敏感数据上传云端,这就需要专有模型 + 后训练,最强端侧 14B/7B 推理模型可以大幅降低端侧专有模型的训练、推理等硬體门槛,加速行业智能化探索。

更进一步,传统行业壁垒也将被端侧普惠 AI 撕开。比如智慧城市治理,通过部署端侧 AI 的边缘智能计算,可以极大减少智能化的建设和更新运维成本;农业智能化,搭载 14B 模型的农业无人机,路线自动避障、精准识别地面等能力,都会随着推理能力的增强而大幅提升。

通过端侧 AI 的普惠路线图,来进行推演,不难看到,360 的技术突破与开源策略,一定会吸引大量行业开发者或个人开发者前来试用,与丰富的场景相结合,催生大量智能化的长尾应用。

也就是说,通过开源轻量级推理模型,360 有望规避 AI 六小强在千亿参数级的竞争。基于开源开放的技术公信力,构建开发者生态护城河。从这个角度看,360 掀起的端侧 AI 飓风,也将卷出一个大模型竞争的新格局。

端侧推理模型的平权时刻已到,万亿级边缘智能市场正蓄势待发、乘风远航。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們