大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

谷歌發現大模型「領悟」現象!訓練久了突然不再死記硬背,多麼痛的領悟

2023-08-13 简体 HK SG TW

今天小編分享的科學經驗:谷歌發現大模型「領悟」現象!訓練久了突然不再死記硬背,多麼痛的領悟,歡迎閲讀。

哪怕只有幾十個神經元,AI 也能出現泛化能力!

這是幾個谷歌科學家在搞正經研究時," 不經意間 " 發現的新成果。

他們給一些很簡單的 AI 模型 " 照了個 X 光 " ——将它們的訓練過程可視化後,發現了有意思的現象:

随着訓練時間增加,一些 AI 會從 " 死記硬背 " 的狀态中脱離出來,進化出 " 領悟力 "(grokking),對沒見過的數據表現出概括能力。

這正是 AI 掌握泛化能力的關鍵。

基于此,幾位科學家專門寫了個博客,探讨了其中的原理,并表示他們會繼續研究,試圖弄清楚大模型突然出現強理解力的真正原因。

一起來看看。

并非所有 AI 都能學會 " 領悟 "

科學家們先探讨了 AI 出現 " 領悟力 "(grokking)的過程和契機,發現了兩個現象:

一、雖然訓練時 loss 會突然下降,但 " 領悟 " 并不是突然發生的,它是一個平滑的變化過程。

二、并非所有 AI 都能學會 " 領悟 "。

先來看第一個結論。他們設計了一個單層 MLP,訓練它完成" 數奇數 "任務。

" 數奇數 " 任務,指識别一串長達 30 位 "0""1" 序列中的前 3 位是否有奇數個 "1"。例如,在 000110010110001010111001001011 中,前 3 位沒有奇數個 1;010110010110001010111001001011 中,前 3 位有奇數個 1。

在訓練前期階段,模型中各神經元的權重(下圖中的熱圖)是雜亂無章的,因為 AI 不知道完成這一任務只需要看前 3 個數字。

但經過一段時間的訓練後,AI 突然 " 領悟了 ",學會了只看序列中的前 3 個數字。具體到模型中,表現為只剩下幾個權重會随着輸入發生變化:

這個訓練過程的目标被稱之為最小化損失(提升模型輸出準确率),采用的技術則被稱之為權重衰減(防止模型過拟合)。

訓練過程中,有一些權重與任務的 " 幹擾數字 "(30 位序列的後 27 位)相關,下圖可視化為灰色;有一些則與完成任務的 " 前 3 位數字 " 有關,下圖可視化為綠色。

當最後一個灰色權重降到接近 0,模型就會出現 " 領悟力 ",顯然這個過程不是突然發生的。

再來看第二個結論。不是所有 AI 模型都能學會 " 領悟 "。

科學家們訓練了1125 個模型,其中模型之間的超參數不同,每組超參數訓練 9 個模型。

最後歸納出 4 類模型,只有 2 類模型會出現 " 領悟力 "。

如下圖," 白色 " 和 " 灰色 " 代表學不會 " 領悟 " 的 AI 模型," 黃色 " 和 " 藍色 " 代表能 " 領悟 " 的 AI 模型。

總結概括規律就是,一旦權重衰減、模型大小、數據量和超參數的設定不合适,AI 的 " 領悟力 " 就有可能消失——

以權重衰減為例。如果權重衰減太小,會導致模型過拟合;權重衰減太大,又會導致模型學不到任何東西。

嗯,調參是門技術活……

了解現象之後,還需要探明背後的原因。

接下來,科學家們又設計了兩個小 AI 模型,用它來探索模型出現 " 領悟力 "、最終掌握泛化能力出現的機制。

更大的模型學會泛化的機制

科學家們分别設計了一個24 個神經元的單層 MLP和一個5 個神經元的單層 MLP,訓練它們學會做模加法(modular addition)任務。

模加法,指 ( a + b ) mod n。輸入整數 a 和 b,用它們的和減去模數 n,直到獲得一個比 n 小的整數,确保輸出位于 0~ ( n-1 ) 之間。

顯然,這個任務的輸出是周期性的,答案一定位于 0~66 之間。

首先,給只有 5 個神經元的單層 MLP 一點 " 提示 ",設定權重時就加入周期性(sin、cos 函數)。

在人為幫助下,模型在訓練時拟合得很好,很快學會了模加法。

然後,試着 " 從頭訓練 " 具有 24 個神經元的單層 MLP,不特别設定任何權重。

可以看到,訓練前期,這只 MLP 模型的權重(下面的熱圖)變化還是雜亂無章的:

然而到達某個訓練階段後,模型權重變化會變得非常規律,甚至随着輸入改變,呈現出某種周期性變化:

如果将單個神經元的權重拎出來看,随着訓練步數的增加,這種變化更加明顯:

這也是 AI 從死記硬背轉變為具有泛化能力的關鍵現象:神經元權重随着輸入出現周期性變化,意味着模型自己找到并學會了某種數學結構(sin、cos 函數)。

這裏面的頻率(freq)不是固定的一個值,而是有好幾個。

之所以會用到多個頻率(freq),是因為 24 個神經元的單層 MLP 還自己學會了使用相長幹涉(constructive interference),避免出現過拟合的情況。

不同的頻率組合,都能達到讓 AI" 領悟 " 的效果:

用離散傅裏葉變換(DFT)對頻率進行隔離,可以發現和 " 數奇數 " 類似的現象,核心只有幾個權重起作用:

總結來看,就像前面提到的 " 數奇數 " 任務一樣," 模加法 " 實驗表明,參數量更大的 AI 也能在這個任務中學會 " 領悟 ",而這個過程同樣用到了權重衰減。

從 5 個神經元到 24 個神經元,科學家們成功探索了更大的 AI 能學習 " 領悟 " 的機制。

接下來,他們還計劃将這種思路套用到更大的模型中,以至于最後能歸納出大模型具備強理解力的原因。

不僅如此,這一成果還有助于自動發現神經網絡學習算法,最終讓 AI 自己設計 AI。

團隊介紹

撰寫博客的作者來自谷歌的 People + AI Research(PAIR)團隊。

這是谷歌的一個多學科團隊,致力于通過基礎研究、構建工具、創建框架等方法,來研究 AI 的公平性、可靠性等。

一句話總結就是,讓 "AI 更好地造福于人 "。

博客地址:

https://pair.withgoogle.com/explorables/grokking/

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們