大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

Scaling Law不是唯一視角!清華劉知遠團隊提出大模型“密度定律”:模型能力密度100天翻番

2024-12-11 简体 HK SG TW

今天小編分享的科學經驗:Scaling Law不是唯一視角!清華劉知遠團隊提出大模型“密度定律”:模型能力密度100天翻番,歡迎閲讀。

Scaling Law 并非描述大模型能力的唯一視角!

清華 NLP 實驗室劉知遠教授團隊,最新提出大模型的密度定律(densing law),表達形式讓人想到芯片領網域的摩爾定律:

模型能力密度随時間呈指數級增長,2023 年以來能力密度約每 3.3 個月(約 100 天)翻一倍。

根據密度定律,研究團隊還得出以下重要推論—— AI 時代的三大核心引擎——電力、算力與智力,都同樣遵循密度快速增長趨勢。

為了發現這一結論,研究團隊引入了一項衡量大模型性價比的新指标——能力密度(capability density)。

團隊通過設定參考模型的方式,将 " 能力密度 " 定義為了" 有效參數量 " 與實際參數量的比值。

給定目标模型後,其 " 有效參數量 " 被定義為實現與目标模型一樣的效果,參考模型需要的最少參數量。

論文第一作者肖朝軍表示,根據拟合曲線,到了明年年底,只要 8B 參數就能實現和 GPT-4 一樣的效果。

論文地址:https://arxiv.org/abs/2412.04315

大模型 " 能力密度 " 三個月翻一番

大模型尺度定律(Scaling Law)和密度定律(Densing Law),都是大模型指導性的規律發現。

它們分别在不同的維度,對大模型進行科學化的推演。

大模型尺度定律是一種描述大模型随着規模的變化而發生的規律性變化的數學表達,表現為大模型的 Loss 與模型參數規模、訓練數據規模之間的幂律關系。

尺度定律之外,清華研究團隊發現,大模型還有另一種度量與優化的空間,能力密度(Capability Density),它為評估不同規模 LLM 的訓練質量提供了新的統一度量框架。

清華研究團隊提出的 " 能力密度 "(Capability Density),定義為給定 LLM 的有效參數大小與實際參數大小的比率。

有效參數大小指的是達到與目标模型同等性能所需的參考模型的參數數量。

清華研究團隊特别引入了參考模型(Reference Model)的概念,通過拟合參考模型在不同參數規模下的性能表現,建立起參數量與性能之間的映射關系。

具體來説,若一個目标模型 M 的參數量為 NM ,其在下遊任務上的性能分數為 SM,研究人員會計算出參考模型要達到相同性能所需的參數量 N ( SM ) ,即 " 有效參數量 "。

目标模型 M 的密度就定義為這個 " 有效參數量 " 與其實際參數量的比值:

ρ ( M ) = N ( SM ) /NM。

比如一個 3B 的模型能達到 6B 參考模型的性能,那麼這個 3B 模型的能力密度就是 2(6B/3B)。

為了準确估計模型性能,研究團隊采用了兩步估計法。

第一步是損失(Loss)估計,通過一系列不同規模的參考模型來拟合參數量與語言模型 Loss 之間的關系;

第二步是性能估計,考慮到湧現能力的存在,研究人員結合開源模型來計算它們的損失和性能,最終建立起完整的映射關系。

通過研究分析近年來 29 個被廣泛使用的開源大模型,清華研究團隊發現,LLMs 的最大能力密度随時間呈指數增長趨勢,可以用公式ln ( ρ max ) = At + B來描述 .

其中 ρ max 是時間 t 時 LLMs 的最大能力密度。

密度定律表明,大約每過 3.3 個月(100 天),就能用參數量減半的模型達到當前最先進模型的性能水平。

ChatGPT 發布後,能力密度增長更快了

基于密度法則,清華研究團隊提出了多個重要推論。

首先,模型推理開銷随時間指數級下降。

2022 年 12 月的 GPT-3.5 模型每百萬 Token 的推理成本為 20 美元,而 2024 年 8 月的 Gemini-1.5-Flash 模型僅為 0.075 美元,成本降低了 266 倍,約 2.5 個月下降一倍。

與此同時,大模型推理算法不斷取得新的技術突破——模型量化、投機采樣、顯存優化。

其次,研究還發現,自 ChatGPT 發布以來,大模型能力密度正在加速增強。

以 MMLU 為評測基準測量的能力密度變化情況,ChatGPT 發布前按照每 4.8 倍增,發布後按照每 3.2 月倍增,密度增強速度增加 50%。

這一現象背後,更高效模型引起了學術界和產業的廣泛關注,誕生了更多高質量開源模型。

再次,芯片電路密度(摩爾定律)和模型能力密度(密度定律)持續增強,兩條曲線交匯揭示端側智能巨大潛力。

研究顯示,在摩爾定律的作用下,相同價格芯片的計算能力每 2.1 年翻倍,而密度法則表明模型的有效參數規模每 3.3 個月翻倍。

兩條曲線的交匯,意味着主流終端如 PC、手機将能運行更高能力密度的模型,推動端側智能在消費市場普及。

此外,團隊指出,無法僅依靠模型壓縮算法增強模型能力密度。

也就是説,現有的模型壓縮技術(如剪枝和蒸餾)未必能提高模型密度。

實驗表明,大多數壓縮模型的密度低于原始模型,模型壓縮算法雖可以節省小參數模型構建開銷。

但是如果後訓練不充分,小參數模型能力密度非但不會增長,反而會有顯著下降。

最後,研究團隊指出,模型高性價比有效期不斷縮短。

根據尺度定律,更多數據 + 更多參數實現能力增強,訓練成本會急劇上升;

而能力密度定律,随着能力密度加速增強,每隔數月會出現更加高效的模型。

這意味着模型高性價比的有效使用期縮短,盈利視窗短暫。

例如,2024 年 6 月發布的 Google Gemma-2-9B 模型,其訓練成本約 185 萬人民币;

但僅兩個月後,它的性能就被參數量減半的 MiniCPM-3-4B 超越。

以 API 盈利方式估算,2 個月内需要 17 億次用户訪問,才能夠收回訓練成本!

尺度定律下,LLM 規模至上。而在密度定律下,LLM 正進入一個全新的發展階段。

在清華劉知遠老師最新報告中,AI 時代的三大核心引擎——電力、算力與智力,密度都在快速增長:

電池能量密度在過去 20 年中增長了 4 倍,其倍增周期約為 10 年;

摩爾定律則揭示,芯片的晶體管密度每 18 個月翻倍;

而 AI 模型能力密度每 100 天翻倍的速度更是驚人。

尤其是模型能力密度的提升也意味着用更少的資源實現更強的能力,這不僅降低了 AI 發展對能源和算力的需求,也為 AI 技術的可持續發展提供了無限可能。同時也揭示了端側智能的巨大潛力。

在這一趨勢下,AI 計算從中心端到邊緣端的分布式特性協同高效發展,将實現 "AI 無處不在 " 的願景。

作者預計,随着全球 AI 計算雲端數據中心、邊緣計算節點的擴張,加上模型能力密度增長帶來的效率提升,我們将看到更多本地化的 AI 模型湧現,雲端和邊緣端各司其職,可運行 LLM 的終端數量和種類大幅增長,"AI 無處不在 " 的未來正在到來。

論文地址:

https://arxiv.org/abs/2412.04315

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們