大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

Scaling Law遞減,堆砌數據、算力拼AI模型已行不通?大廠正在找出路

2024-11-22 简体 HK SG TW

今天小編分享的互聯網經驗:Scaling Law遞減,堆砌數據、算力拼AI模型已行不通?大廠正在找出路,歡迎閲讀。

作者:趙雨荷

來源:硬 AI

邁向超級智能系統的 AI 實驗室正意識到,可能需要改換道路。分析指出,相比傳統的堆砌計算能力和數據的訓練方法,被稱為 " 測試時計算 "(Test-time Compute)的新方法更有助于提高 AI 模型的預測能力。

據 TechCrunch 報道,多位 AI 投資者、創始人和 CEO 透露,近年來 AI 實驗室用于提升模型能力的 "AI 擴展定律 "(AI scaling laws)正顯示出邊際收益遞減的迹象。他們的觀點與近期的報告一致,這些報告表明頂尖 AI 實驗室中的模型提升速度已不如以往。

現在,幾乎所有人都開始承認,僅通過增加計算能力和數據量來預訓練大型語言模型,并指望其變成某種全知全能模型的道路,是行不通的。這也許聽起來顯而易見,但擴展定律曾是開發 ChatGPT、提升其性能的關鍵因素,也可能影響了許多 CEO 大膽預測通用人工智能(AGI)将在幾年内到來的信心。

OpenAI 和 Safe Super Intelligence 的聯合創始人 Ilya Sutskever 上周對媒體表示," 所有人都在尋找擴展 AI 模型的新方式 "。本月早些時候,Andreessen Horowitz 聯合創始人 Marc Andreessen 在一檔播客中提到,當前 AI 模型似乎都趨向于能力的上限。

不過,有 AI 領網域的 CEO、研究人員和投資者已經開始宣稱,行業正進入擴展定律的新紀元:" 測試時計算 "(Test-time Compute)被認為是一項特别有前景的新方法,能夠讓 AI 模型在回答問題前,有更多時間和計算資源進行 " 思考 "。

" 我們正看到一種新擴展定律的出現," 微軟 CEO 納德拉(Satya Nadella)周二在微軟 Ignite 大會上説,他指的是支持 OpenAI o1 模型的測試時計算研究。

此外,Andreessen Horowitz 合夥人、Mistral 的董事會成員、曾是 Anthropic 天使投資人的 Anjney Midha 在接受媒體采訪時表示," 我們現在正處于擴展定律的第二紀元,也就是測試時擴展。"

AI 擴展定律失效?

自 2020 年以來,OpenAI、谷歌、Meta 和 Anthropic 等公司取得的 AI 模型快速進步,主要歸功于一個關鍵判斷:在 AI 模型的預訓練階段使用更多的計算資源和數據。

在這一階段,AI 通過分析大量數據集中的模式來識别和存儲信息。當研究人員為機器學習系統提供充足的資源時,模型通常在預測下一個詞或短語方面表現更好。

第一代 AI 擴展定律讓工程師通過增加 GPU 的數量和數據量來提升模型性能。盡管這種方法可能已經達到瓶頸,但它已經改變了整個行業的版圖。幾乎每家大型科技公司都押注 AI,而為這些公司提供 GPU 的英偉達如今已成為全球市值最高的上市公司。

然而,這些投資是基于擴展能夠持續發展的預期而做出的。畢竟,擴展定律并不是自然、物理、數學或政府制定的法律,它并未被任何人或事物保證會以相同的速度繼續下去。即便是著名的摩爾定律,也在運行了較長時間後逐漸失效。

Anyscale 聯合創始人、前 CEO Robert Nishihara 在對媒體表示,

" 如果你只投入更多的計算資源和數據,模型越做越大,回報會逐漸遞減,要維持擴展定律的運行并保持進步的速度,我們需要新思路。"

" 當你已經閲讀了 100 萬條 Yelp 評論,再讀更多評論可能不會帶來太大增益,但那是預訓練。關于後訓練的方法還相對不成熟,還有很大的改進空間。"

盡管如此,AI 模型開發者可能仍會繼續追求更大的計算集群和更大的數據集進行預訓練,而這些方法可能仍有一定的提升空間。例如,馬斯克最近完成了一台擁有 10 萬 GPU 的超級計算機 Colossus,用于訓練 xAI 的下一代模型。

但趨勢表明,僅通過現有策略使用更多 GPU 無法實現指數級增長,因此新的方法開始獲得更多關注。

測試時計算:AI 行業的下一大賭注

當 OpenAI 發布其 o1 模型的預覽版時,就宣布這屬于獨立于 GPT 的新系列模型。

OpenAI 主要通過傳統的擴展定律(即在預訓練階段使用更多數據和更多計算能力)改進了其 GPT 模型。但據稱,這種方法現在的增益已不再顯著。o1 模型框架依賴于一個新概念——測試時計算(test-time compute),之所以這樣命名,是因為計算資源是在接收到提示後(而不是之前)才使用的。分析認為,這種技術在神經網絡背景下的探索還不多,但已經表現出潛力。

一些人已經将測試時計算視為擴展 AI 系統的下一種方法。

Andreessen Horowitz 的 Midha 表示,

許多實驗表明,即使 " 預訓練 " 的擴展定律可能正在放緩," 測試時 " 擴展定律——即在推理過程中為模型提供更多計算資源——仍然可以顯著提升性能。

著名 AI 研究員 Yoshua Bengio 則表示,

"OpenAI 的新‘ o 系列’進一步推動了 [ 連貫思維 ] ,需要更多計算資源,也因此需要更多能源,我們因此看到了一種新的計算擴展形式:不僅僅是更多的訓練數據和更大的模型,還包括花費更多時間‘思考’答案。"

例如,在 10 到 30 秒的時間裏,OpenAI 的 o1 模型會多次重新提示自己,将一個復雜的問題分解為一系列更小的問題。現負責 OpenAI o1 工作的 Noam Brown 嘗試開發可以擊敗人類的撲克 AI 系統,在最近的一次演講中,Brown 表示,他注意到人類撲克玩家在出牌前會花時間考慮不同的情景。2017 年,他引入了一種方法,讓模型在出牌前 " 思考 "30 秒。在此期間,AI 會模拟不同的子遊戲,推演不同場景可能的結果以确定最佳行動。最終,這種 AI 的預測表現比他以前的方法提升了 7 倍。

需要注意的是,Brown 在 2017 年的研究并未使用神經網絡,因為當時它們尚未普及。然而,上周麻省理工學院的研究人員發表了一篇論文,表明測試時計算顯著提高了 AI 模型在推理任務上的表現。

目前尚不清楚測試時計算如何大規模推廣。這可能意味着 AI 系統在解決難題時需要非常長的 " 思考 " 時間,可能是數小時甚至數天。另一種方法可能是讓 AI 模型同時在許多芯片上 " 思考 " 問題。

Midha 表示,如果測試時計算成為擴展 AI 系統的下一步,對專注于高速推理的 AI 芯片的需求可能會大幅增加,這對 Groq 或 Cerebras 等專注于快速 AI 推理芯片的初創公司來説是好消息。如果找到答案與訓練模型同樣需要大量計算資源,那麼 AI 領網域的 " 挖掘工具 " 提供商将再次受益。

無論 AI 研究的前沿情況如何,用户可能在一段時間内感受不到這些變化的影響。不過,AI 開放商将不遺餘力地繼續快速推出更大、更智能、更快的模型,這意味着多家領先的科技公司可能會調整其推動 AI 邊界的方法。

本文來自微信公眾号 " 硬 AI",關注更多 AI 前沿資訊請移步這裏

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們