今天小編分享的科技經驗:當“算力魔法”不再性感,AI五大新趨勢浮出水面,歡迎閱讀。
文 | 極智 GeeTech
短短一年時間,兩場 GTC 大會,台上的黃仁勳依舊穿着熟悉的皮衣,卻多了些磕絆,少了些從容。
上一次 GTC 大會,正值英偉達如日中天高歌猛進。全球科技公司對生成式 AI 進行不計回報的瘋狂投入,将英偉達一步步推上神壇,一度成為全世界市值最大的公司。
而當 DeepSeek 橫空出世,人們突然意識到,單純依賴算力的 " 暴力美學 " 已觸及邊際效益的臨界點。與此同時,AI 技術的應用瓶頸、成本壓力以及社會需求的變化,正将行業推向一個更復雜、更務實的階段。
如今的算力就像當年的雲計算,正慢慢變成 AI 時代的公共基礎設施,不可或缺但已給不出更多興奮點,其叙事邏輯也由 " 算力囤積 " 向 " 需求牽引 " 演變。
一邊是依然信奉 " 大力出奇迹 " 塑造出的模型能力,在大規模數據和算力支撐下不斷衝擊新的性能高度;另一邊是利用工程創新和算法優化精雕出各類 AI 應用,試圖在算力紅海中開辟一條降本增效的新通路,這種分野在產業實踐中愈發明顯。而這些正浮現的關鍵趨勢将錨定 AI 未來的價值坐标。
趨勢一:大模型将從 " 訓練 " 卷向 " 推理 "
2024 年,OpenAI 的一系列動作對大語言模型領網域產生了深刻影響。9 月,OpenAI 發布了首款推理模型 o1。
類似于 GPT-4 等傳統大語言模型,在回答問題時往往依賴于預設的知識庫和訓練模式,直接提供最先浮現的答案。盡管反應迅速,但答案的準确性和合理性常常難以确保,有時甚至會產生錯誤或不合理的回答。
o1 在回答問題前,會逐步分析用戶的提示詞(Prompt),通過比對不同的結果來呈現一個最佳回答,從而大幅減少錯誤。這種逐步推理的能力,讓 AI 能夠應對更復雜的任務,解決許多普通聊天機器人無法勝任的問題。
在深度學習中," 訓練 " 和 " 推理 " 是兩個緊密相關但又有所不同的階段。訓練過程通過調整模型參數來優化模型性能,需要大量的标注數據和計算資源;而推理過程則注重模型的預測能力,需要快速且準确地生成預測結果。
值得注意的是,當一種方法無效時,推理模型甚至會自動嘗試其他方法,這種處理邏輯與人類思考和解決問題的方式頗為相似,極大地提升了模型在處理數學、物理和邏輯等復雜問題時的準确性和可靠性。
比如 2024 年 12 月 DeepMind 推出的實驗性新型網絡浏覽智能體 Mariner,當被要求尋找聖誕餅幹配方并将原料添加到在線購物車時,Mariner 遇到了選擇面粉種類的難題。此時,Mariner 在聊天視窗中清晰地闡述了其解決策略,利用浏覽器的後退功能返回食譜頁面以确認所需的面粉種類。
這一行為展示了智能體能夠将復雜任務拆解為具體的操作步驟,并通過合理的推理選擇解決問題的行動,對智能體在現實場景中廣泛應用具有重要意義。
在 AI 推理方面,一個重要趨勢正在浮現——慢速深度推理。與強調實時響應的快速推理不同,慢速深度推理聚焦于更為復雜、需要多步邏輯鏈條的任務,力求在知識復雜度和推理深度上實現突破。
這一趨勢的核心在于,大模型通過 " 分解 - 推理 - 重構 " 的方式,實現對復雜問題的多層次理解與求解。同時,結合外部知識庫和大模型内部的記憶系統,AI 可以通過知識調用與整合,實現更具深度的邏輯推理。
慢速推理雖然響應時間略長,但能夠保證更高的輸出質量,特别适用于對精度要求極高的任務場景。例如,在醫療診斷、金融分析、法律咨詢等行業中,慢速深度推理能夠通過多輪分析和邏輯校驗,為用戶提供精準的解決方案,真正實現 AI 的 " 類人思考 "。
從技術視角來看,當前 AI 推理還存在三方面挑戰。
首先,面對海量的輸入與復雜的計算任務,如何在資源有限的情況下實現快速響應和高質量輸出,成為 AI 推理的核心難題。
其次,不同用戶和企業場景對 AI 輸出的需求不同,需要模型具備更強的場景适配能力和定制化能力。
第三,相比預訓練階段的高耗能,推理階段更強調輕量化與可部署性,如何降低推理成本、提升資源利用率至關重要。
由于 " 推理 " 更強調自主性以及解決復雜問題的能力,因此,從今年乃至未來很長一段時間内," 推理 " 将成為大語言模型領網域的核心議題,AI 的競争規則由此被重寫——從 " 誰擁有更強的算力 " 轉向 " 誰能更聰明地使用算力 ",相關研究和應用将持續深化。
趨勢二:後訓練推動 AI 邁入 " 精耕時代 "
随着預訓練階段的算力擴張遭遇邊際效益遞減,行業焦點正轉向後訓練優化與實時推理架構創新。以 DeepSeek 為代表的 AI 應用的崛起并非算力的終結,而是推動 AI 進入了 " 精耕時代 "。
大模型訓練通常需要經歷三個階段:預訓練、後訓練、持續訓練。
預訓練就像是一個擁有大量語言知識的 " 毛坯房 ",通過使用海量數據訓練模型,使其掌握通用特征和知識。後訓練則基于預訓練模型,針對特定任務或數據集進行額外訓練和精細調整,通常涉及微調、人類反饋強化學習(RLHF)、直接偏好優化(DPO)等技術,使其能夠更好地适應諸如回答問題、生成文本、遵循指令等任務。
例如,一個預訓練模型可能在一般的語言理解上表現不錯,但對于專業領網域的問題回答可能不夠準确,通過後訓練,它可以在該領網域的知識和推理能力上得到顯著提升。
在模型完成預訓練和後訓練後,需要繼續在新數據上進行訓練,以不斷更新和提升模型性能。這一階段可能在模型部署後的任何時間進行,從而适應新數據并保持模型性能的穩定提升。
數據是後訓練的核心要素之一。數據合成技術可以生成新的訓練數據,增加數據的多樣性和數量。例如,通過一些規則和模板,可以生成大量的對話示例、問題與回答對。同時,數據處理也非常關鍵,需要對數據進行清洗,去除噪聲、重復和錯誤的數據,還會進行質量評估和分類,确保用于訓練的數據是高質量且符合任務需求的。
以 Llama 3.1 為例,首先,它使用了大量的合成數據和人類偏好數據進行訓練,以提高模型的泛化能力和準确性。其次,它采用了迭代訓練的方法,通過多輪訓練和生成來逐步優化模型性能。最後,它還采用了數據清洗、質量控制和語義去重等手段來确保訓練數據的質量和多樣性。
在具體實踐中,Llama 3.1 的後訓練過程包括多個階段。在每個階段中,都需要仔細調整數據比例、優化模型參數,并在多個基準測試上評估模型性能。通過多輪迭代和不斷優化,Llama 3.1 最終取得了顯著的性能提升。
在提高模型性能方面,後訓練技術體現在增強模型的适應性、任務專注性、魯棒性以及降低數據依賴等多個方面。這使得後訓練不再是一個可有可無的步驟,而是現代 AI 系統首要的組成部分,尤其是在追求高效和精準的任務完成能力時。随着研究的深入,預計後訓練技術将繼續演進,進一步增強模型性能,推動 AI 應用的廣泛落地。
同時,後訓練對于人類數據的依賴性降低,促使研究者和開發者需要在技術、流程和策略上進行調整,以适應新的挑戰和機遇,未來,随着自監督學習、數據增強和領網域适應等技術的持續進步,我們會看到在更少的人類數據和資源投入下,仍能實現高性能模型的成功案例。
在發展高級推理模型方面,後訓練能力至關重要,這不僅體現在模型性能的提升上,還涉及到模型在復雜理解、動态知識更新和跨網域适應等多方面的能力。随着後訓練技術的不斷完善和應用,預計将為高級推理模型的發展提供更為堅實的基礎,特别是在問題解決和決策支持方面的應用。
趨勢三:多智能體協同将激發 AI" 群體智能 "
随着大模型的深入研究,多智能體協同已經成為 AI 研究最熱門的方向之一。
盡管基于大語言模型的 ChatGPT、DeepSeek 等具有強大的文本理解和生成能力,但它們本質上仍是作為孤立實體運行的,缺乏與其他智能體協作和從社互動動中獲取知識的能力,這種固有限制阻礙了它們從他人的多輪反饋中學習并提高其性能的潛力。
亞當 · 斯密在《國富論》的開篇提到," 勞動生產力上最大的增進,以及運用勞動時所表現的更大的熟練、技巧和判斷力,都是分工的結果。"
根據分工原則,擁有專業技能和領網域知識的單個智能體可以從事特定的任務。一方面,通過分工,智能體處理特定任務的技能不斷精煉;另一方面,将復雜任務分解為多個子任務可以減少在不同流程之間切換的時間。最終,多個智能體之間的有效分工可以完成比沒有特定分工時多得多的工作量,從而大幅提高整個系統的效率和輸出質量。
2025 年,AI 推理成本的大幅下降為多智能體系統協同提供了經濟基礎。多智能體系統(Multi-Agent System)是由大型語言模型驅動,并以特定方式連接的多個獨立智能體組成的復雜系統。其中的每個智能體都配置有獨立的提示詞、大語言模型以及相應的工具。
該系統的設計旨在促使不同智能體之間實現高效的協同合作,通過這種協同作業模式,為解決復雜問題提供了更為靈活和強大的解決方案。多智能體有不同的互動協作模式,最典型的包括層級結構、集中結構、分散結構、混合結構等。
以 Manus 為例,其技術架構以多智能體協同為核心,采用分層結構與動态任務調度機制,通過規劃智能體、執行智能體、驗證智能體的協同,實現了從任務理解到成果交付的全流程自動化,大幅提升對復雜任務的處理效率。
規劃智能體負責解析用戶指令并拆解成可執行的子任務,并動态分配至執行智能體進行任務執行,同時監控執行路徑并實時修正;執行智能體負責各個子任務的具體執行,包括代碼生成、數據抓取、分析建模等各類智能體,可以調用各種工具的 API 接口;驗證智能體通過交叉校驗機制确保結果準确性。三類智能體共同協作完成復雜任務。
系統中的每個智能體都具備一定的自主性,能夠在沒有外界直接幹預的情況下,根據自身的目标和所感知到的信息做出決策。它們并非孤立存在,而是通過相互之間的信息共享、任務協作和資源分配等互動方式,共同完成復雜的任務。同時,智能體能夠适應環境的變化,實時調整自己的策略和行為。
以城市交通管理為例,每一輛自動駕駛汽車都可以看作是一個智能體。它們各自感知周圍的路況信息,如車輛密度、道路狀況、信号燈狀态等,然後自主決策行駛速度、路線等。同時,這些車輛之間還會進行信息互動,比如分享前方的路況擁堵信息,從而實現協同駕駛,提高整個城市交通系統的運行效率,減少擁堵。
業内普遍認為 2025 年是 AI 智能體爆發元年。Gartner 預測,2028 年至少 15% 的日常工作決策将由智能體完成。當前,比較主流的多智能體技術框架包括微軟的 AutoGen、MetaGPT、清華的 AgentVerse、XAgent、AutoAgent、CrewAI 等,這些項目從不同角度提出智能體系統規劃模塊的改進建議,其中包括長短期規劃、規劃輸出格式、用戶提示拓展解釋、反饋迭代機制等,為多智能體高效協作奠定技術基礎。
趨勢四:強化學習不斷衝破推理 " 天花板 "
1947 年,艾倫 · 圖靈在一次演講中提到 " 我們想要的是一台能夠從經驗中學習的機器 "。
2025 年,圖靈獎頒給了兩位畢生致力于解決圖靈這一問題的科學家——安德魯 · 巴托(Andrew Barto)與理查德 · 薩頓(Richard Sutton)。他們不僅是 AlphaGo 和 ChatGPT 技術上的奠基人,亦是機器學習領網域的技術先驅。
如果說機器學習是 " 填鴨式 " 學習,那強化學習就是 " 放養式 " 學習。
傳統的機器學習,就是給模型被喂大量标注好的數據,建立輸入和輸出之間固定的映射關系。而強化學習,是在沒有明确指導的情況下,智能體通過不斷試錯和獎懲機制給出的反饋信号,逐漸調整下一步行動策略,并且循環往復,不斷接近最優策略。
就像一個機器人學走路,不需要人類一直告訴它 " 這步對,那步錯 ",它只要嘗試、摔倒、調整,最終自己就會走路了,甚至走出自己獨特的步态。
顯而易見,強化學習的原理更接近人類的智能,就像每個幼童在跌倒裡學會走路,在摸索中學會抓取,在咿呀裡捕捉音節,學會語言。
強化學習的高光時刻是 2016 年 AlphaGo 的 " 神之一手 "。當時 AlphaGo 在與李世石的比賽中,第 37 手落下了一步令所有人類驚訝的白棋,一步棋逆轉敗勢,一舉赢下李世石。
AlphaGo 不是靠背棋譜背出來的 " 神之一手 ",而是在無數次自我對弈中,試錯、長遠規劃、優化策略後自主探索出來,這就是強化學習的本質。
而最近爆火的宇樹科技回旋踢機器人背後也是強化學習的訓練。
強化學習特别擅長處理規則復雜、狀态多變的環境,并在其中找到最優解,比如自動駕駛、機器人控制等。這些正是當下最前沿的 AI 應用領網域,尤其是在大語言模型上,幾乎所有領先的大語言模型都使用了 RLHF(基于人類反饋的強化學習)的訓練方法,即讓人類對模型的回答進行評分,模型根據反饋改進。
作為後訓練、推理階段的關鍵技術,強化學習将會得到更多的創新應用。比如機器人領網域,通過強化學習,機器人可以自主地适應不同的環境和任務,提高工作效率和安全性。例如,在輔助康復訓練中,機器人可以根據患者的力量和姿勢調整其輔助力度,以幫助患者恢復功能。
自動駕駛領網域,強化學習可以幫助自動駕駛汽車學習如何在復雜路況下安全行駛。通過與交通環境的互動,自動駕駛車輛可以不斷優化其駕駛策略,提高駕駛的安全性、舒适性和效率。然而,将強化學習應用于自動駕駛也面臨着一些挑戰,包括如何處理傳感器數據的不确定性、如何解決算法收斂性和穩定性等問題。
盡管強化學習還面臨着一些挑戰,例如學習效率、獎勵函數設計、安全性等問題,但随着研究的深入,強化學習的應用領網域将持續拓展,深度強化學習算法将不斷改進,多智能體強化學習和可解釋性強化學習也将成為重要的研究方向。
趨勢五:物理 AI 加速消融虛拟與現實邊界
早前,黃仁勳不止一次強調過,"AI 的新一波浪潮是物理 AI"。
在十年的時間裡,AI 從感知和計算機視覺,發展到了生成式 AI,現在又到了代理 AI 階段,即具有推理能力的 AI,未來将是物理 AI 時代。
如今大多數 AI 并不理解物理定律,不以物質世界為基礎,而產生影像、視訊、3D 圖形和許多物理現象,需要基于物理并理解物理定律的 AI。
物理 AI 是一種使自主機器(如機器人、自動駕駛汽車等)能夠在真實物理世界中感知、理解和執行復雜操作的技術。
物理 AI 的提出有其必然性。一方面,基于互聯網上大量文本和影像數據訓練的生成式 AI 模型(GPT、Llama 等)在生成人類語言和抽象概念方面已經基本滿足需求,但是受其生成規則的限制,對于物理世界的理解有限,因此會出現不符合現實世界規律的 " 幻覺 "。
另一方面,機器無法感知和察覺它們周圍的世界,但借助物理 AI,就可以構建和訓練自動駕駛、機器人等各類智能體,并與真實世界進行無縫互動并适應各種環境,有利于提高現實世界應用的可訪問性和功能性。
物理 AI 能夠理解三維世界的空間關系和物理行為,因此進一步擴展了生成式 AI,其通過在 AI 訓練過程中加入更多真實場景數據,從而實現對物理世界的洞察和理解。通俗地理解,就是 AI 反饋的内容要符合物理規律。
作為物理 AI 在交通領網域的重要應用之一,依托大模型構建的 AI 網絡将交通流量、氣象條件、道路狀況、城市環境等物理世界實時數據納入模型訓練,通過整合車輛、道路、雲端等多方數據,可以進行實時分析并為精準決策提供支持,幫助駕駛員和自動駕駛車輛即時優化決策。
同時,通過大模型對攝像頭視頻流進行實時處理,可以為交通管理部門提供精準的交通流量分析預測與動态優化、事故預警、交通信号優化等服務。
在機器人應用領網域,物理 AI 賦予機器人更強的環境感知、理解和互動能力。傳統的機器人只能按照預設程式執行任務,而搭載物理 AI 的機器人則能夠更好地理解周圍環境,并根據物理規律做出相應的反應。它們可以更好地識别物體、預測運動軌迹、并在復雜環境中進行導航和操作。
IDC 數據顯示,随着 AI 應用持續走深向實,大模型在金融、醫療、教育、零售、能源等多個行業領網域實現初步應用。到 2025 年,全球 AI 支出将達 2270 億美元。預計到 2030 年,AI 将為全球經濟貢獻 19.9 萬億美元,推動全球 GDP 增長 3.5%。而目前,幾乎 98% 的企業領導者将 AI 視為其組織的優先事項。
2025 年,AI 将朝着輕量化設計、強推理能力提升、移動端應用普及的方向快速發展。當行業不再為算力神話狂歡,AI 終将回歸本質——成為解決問題的基礎設施。五大趨勢的背後,是一條清晰的進化路徑:從追求規模到注重效率、從單一能力到系統協作、從數字孿生到虛實共生。
未來的 AI 競争,将是效率、生态與場景落地的多維博弈。對于市場,這或許是跳出 " 七巨頭 " 引力場,重估技術價值的時刻;對于行業,則是一場從 " 造神 " 到 " 務實 " 的集體覺醒。
" 魔法 " 終會退潮,而真正的工程革命,此刻才剛剛開始。