大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

從零復現,全面開源:360 Light-R1-14B/7B帶來端側AI平權時刻

2025-03-15 简体 HK SG TW

今天小編分享的科學經驗:從零復現,全面開源:360 Light-R1-14B/7B帶來端側AI平權時刻,歡迎閱讀。

性能領先、開源普惠、國產易獲取的三重勢能,造就了年初 DeepSeek 的技術平權狂熱,掀起 AI 普惠浪潮。

然而,當很多人想在端側部署 DeepSeek 模型時,卻遭遇了挑戰:部署滿血版大模型需數萬元硬體投入,退而求其次選擇蒸餾版 14B 版本,又會出現性能斷崖式下跌與響應延遲。

就在 AI 用戶陷入 " 高成本部署 " 與 " 低質量妥協 " 的兩難困境時,端側 AI 的破局時刻,悄悄被 360 打開了。

近期,360 智腦團隊發布了最強 14B 推理模型:Light-R1-14B-DS,是業界首次在 14B 模型上復現強化學習效果。數學能力上,表現超過 DeepSeek-R1-Distill-Llama-70B 和 DeepSeek-R1-Distill-Qwen-32B。

盡管只訓練了 MATH 數據,但在 GPQA 科學常識評測中,7B/14B 雙版本均超越對标產品,展現出 " 小參數大智慧 " 的泛化能力。

此外,配合 360 的全面開源策略(模型 / 數據 / 代碼 / 技術報告全開放),這場端側 AI 平權運動,意味着 14B 模型能在手機端流暢運行,意味着企業無需天價算力即可部署專業級 AI。

AI 端側民主化的風暴眼,正在醞釀之中。

我們第一時間研讀了 360 放出的技術報告,發現端側 AI 的技術拐點已經出現。360 開源的 Light-R1-14B-DS 創造了三項行業紀錄:

一是能力復現。Light-R1-14B-DS 首次在數學能力上,用 14B 模型復現了強化學習效果,通過多階段課程學習 SFT和強化學習,Light-R1-14B-DS 的表現超過 DeepSeek-R1-Distill-Llama-70B 和 DeepSeek-R1-Distill-Qwen-32B,是目前最優的 14B 模型,這驗證了 RL 強化學習策略的有效性,RL 對端側模型訓練的收益很大,仍有進一步挖掘潛力。

(Light-R1 訓練流程)

二是效率革命。Light-R1-14B-DS 經過長思維鏈強化學習後訓練,在 AIME 24 和 25 上分别取得了74.0 和 60.2的成績,數學部分表現超越 DeepSeek 的 70B(72.6 分)和 32B(54.9 分)蒸餾模型,取得了非常顯著的提升,這标志着推理能耗進一步降低。另一版本的 Light-R1-7B-DS,無需量化即可端側部署。此次探索,在低成本復現 DeepSeek-R1 方面邁出了重要一步。

三是泛化能力增強。Light-R1-14B-DS 在科學常識評測 GPQA 上漲,打破了模型 " 災難性遺忘 " 的魔咒,具有較好的泛化性,開辟模型優化新路徑。

最強 14B 端側推理模型,撕開了 DeepSeek 70B 的性能封鎖線,端側 AI 迎來了規模化普及的拐點。不過,在 AI 與大眾之間,還差一個開源。

如果僅有技術突破,但沒有開源機制,那麼端側推理模型再好,也無法被大眾輕松獲得、低成本用起來。

此次,360 采取了全棧式的開源策略——模型權重、22 萬條數學數據集、RL 訓練代碼、技術報告等,都悉數公開。這種開源深度,遠遠超過了常規模型權重開放。

也就是說,中小團隊僅需極少算力,就能從數據清洗到強化學習全鏈路復現,完成端側 AI 的後訓練與部署。

端側 AI 的民主化,高度依賴于科技企業的開源策略,為什麼說 360 此次開放端側推理模型很重要?

對企業來說,傳統端側 AI 部署,會面臨閉源模型高昂的授權費用(如 OpenAI API 調用成本)與硬體适配的邊際成本(需定制化芯片或伺服器),成本難以承受。此前 openai 也發布過蒸餾版 o1-mini,但高昂的訂閱費依然讓大量開發者望而卻步。此外,閉源模型存在不可解釋性風險,醫療、法律等行業因合規要求無法接受 " 輸入-輸出 " 不透明的 AI 決策。因此,Light-R1-14B-DS 這樣低成本、全開源的國產端側推理模型,有望打消企業對 AI 的顧慮,輕松邁入智能化。

對個人來講,雲端模型需要上傳數據,這會引發隐私洩露的顧慮。而在端側離線運行大模型,又對算力 / 内存有更高的要求,傳統端側 AI 需要旗艦級設備,買不起旗艦機,就用不到好 AI,這形成了一種 AI 時代的 " 設備歧視 "。

360 開源最強 14B 端側模型,讓端側 AI 能力不再是少數機型的特權,也可以下沉到普惠機型上,為大眾所用。而用戶規模的擴大,也會推動 AI 應用及大模型產品的增長。

由此看到,360 開源策略所帶來的技術民主化,可以激活 AI 的長尾需求,加速 AI 普惠的到來。

終端設備,是用好 AI 的載體。推理模型下沉到端側,應用空間也十分廣闊,打開了端側 AI 的無限想象空間。

預測一下,目前這兩個最強端側 14B/7B 推理模型,可能會首先落地在商業價值高的場景,然後一步步滲透進各行業。

首當其衝的,就是消費電子領網域。智能手機、手表、平板、PC、眼鏡等終端設備,近兩年都在加速 AI 化。

但此前 AI 化有兩種方案:一是純端側,保證本地隐私安全,但内存要求高,功耗大;另一種是端雲結合,部分任務上雲處理。Light-R1-7B-DS 無需量化即可部署于終端設備(如手機、IoT 設備),标志着消費級硬體也能運行復雜 AI 任務。對比傳統需要 32B 以上參數的端側模型,其 7B 規模大幅降低内存占用和能耗。為 AI 終端帶來了更大的創新空間,比如在手機本地運行復雜數學輔導、法律文書解析等任務,解決隐私和延遲痛點。

360 的技術突破與全棧開源,可以為消費電子領網域的 AI 探索帶來非常有益的借鑑。

下一個就是重點行業、垂直領網域。金融、政務、醫療、法律等數字化基礎較好的行業,積極擁抱 AI,又希望在本地化運行專業級 AI,避免敏感數據上傳雲端,這就需要專有模型 + 後訓練,最強端側 14B/7B 推理模型可以大幅降低端側專有模型的訓練、推理等硬體門檻,加速行業智能化探索。

更進一步,傳統行業壁壘也将被端側普惠 AI 撕開。比如智慧城市治理,通過部署端側 AI 的邊緣智能計算,可以極大減少智能化的建設和更新運維成本;農業智能化,搭載 14B 模型的農業無人機,路線自動避障、精準識别地面等能力,都會随着推理能力的增強而大幅提升。

通過端側 AI 的普惠路線圖,來進行推演,不難看到,360 的技術突破與開源策略,一定會吸引大量行業開發者或個人開發者前來試用,與豐富的場景相結合,催生大量智能化的長尾應用。

也就是說,通過開源輕量級推理模型,360 有望規避 AI 六小強在千億參數級的競争。基于開源開放的技術公信力,構建開發者生态護城河。從這個角度看,360 掀起的端側 AI 飓風,也将卷出一個大模型競争的新格局。

端側推理模型的平權時刻已到,萬億級邊緣智能市場正蓄勢待發、乘風遠航。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們