今天小編分享的科技經驗:AI探索宇宙結構新突破,超精準場級模拟,半秒完成冷暗物質仿真,歡迎閲讀。
AI 模拟宇宙結構,準确高效預測宇宙演化。
【導讀】AI 開啓模拟宇宙!近日,來自馬克斯 · 普朗克研究所等機構,利用宇宙學和紅移依賴性對宇宙結構形成進行了場級仿真,LeCun 也在第一時間轉發和推薦。
下面的兩組動圖展示了計算機對于宇宙形成的模拟:
其中一行是根據物理定律計算的,而另一行是由人工智能學習後生成的。
你能看出來哪一個結果出自 AI 之手嗎?
這就是來自馬克斯 · 普朗克研究所等機構發表的工作:利用宇宙學和紅移依賴性對宇宙結構形成進行場級仿真。
AI 終于開始模拟宇宙了!LeCun 也在第一時間轉發和推薦:
作者表示:我們現在可以使用人工智能在多個時間步上對大多數宇宙學特性生成宇宙的冷暗物質模拟。
并且,物理學是這個神經網絡設計的核心,它可以看成是 PINN(内嵌物理知識神經網絡)的一種實現,其損失函數建模了時間相關的粒子坐标和速度之間的特定關系。
在這項工作中,研究人員提出了一個用于大規模結構的場級模拟器,捕獲宇宙學依賴性和宇宙結構形成的時間演化。
模拟器将線性位移場映射到特定紅移處對應的非線性位移。
模拟器是一個神經網絡,包含對 Ω 和紅移 z 處的線性增長因子 D ( z ) 的依賴性進行編碼的樣式參數。
研究人員在六維 N-body 相空間上訓練模型,将粒子速度預測為模型位移輸出的時間導數,顯著提高了訓練效率和模型準确性。
最終,模拟器在測試數據(訓練期間未見過的各種宇宙學和紅移)上實現了良好的精度和性能,在 z = 0,k ∼ 1 Mpc/h 的尺度上達到了百分比級精度,并在較高紅移下提高了性能。
通過合并樹将預測的結構形成歷史與 N 體模拟進行比較,可以找到一致的合并事件序列和統計特性。
并且,該模拟器速度極快,在單個 GPU 上半秒内就能夠預測 128 的立方個粒子的非線性位移和速度場。
同時又可以通過多 GPU 并行處理進行良好的擴展,支持任意大尺寸的實現。
模拟宇宙的 AI
随着宇宙學數據分析推向更小的尺度,利用高階統計數據,并實現場級分析和基于模拟的推理方案,為預測非線性宇宙結構形成提供了更準确的方法。——當然也對算力提出了超高要求。
比如利用 N 點統計的傳統分析方法,需要大量模拟數據集來進行準确的協方差估計。
而基于模拟的推理方法和場級分析,則需要生成許多後期密度場的準确實現,以約束模型參數和初始條件重建。
DESI、Euclid、Vera C. Rubin 天文台、SPHEREx 和 Subaru Prime Focus Spectrograph 可以為研究者提供大量最新的星系巡天數據。
為了探明宇宙學參數和初始條件的最佳約束,需要對巡天觀測值進行快速、高度準确的預測。
在這項工作中,作者通過添加紅移依賴性和對多個紅移模拟快照的訓練來擴展場級 N 體模拟器。
由于本模型的時間依賴性和自可微性,研究者可以有效地獲得 N 體粒子速度作為輸出粒子位移的時間導數。
可以在訓練期間動态評估這些速度,由此定義一個取決于粒子位置和速度的損失函數,在六維 N 體相空間上進行訓練。
強制執行「速度必須等于位移時間導數」的物理約束,可以提高訓練效率并提高模型的準确性,特别是對于速度場。
模型結構
作者通過周期模拟框中的坐标 x 來描述 N 體粒子。每個粒子都與規則立方晶格上的一個位點 q 相關聯,因此它在紅移 z 處的位置定義為:
這裏 Ψ 是位移場,q 是粒子的拉格朗日坐标。在線性 Zeldovich 近似 ( ZA ) 中,位移場演變為:
其中 D ( z ) 是線性增長因子,zi 是早期選擇的紅移,以便線性理論可以很好地描述位移場。
随着引力簇的非線性在後期變得重要,這種線性近似變得不準确,而模拟宇宙結構形成的非微擾方法(如 N 體模拟)變得必要:
這裏 f ( z ) 為線性增長率,H ( z ) 是哈勃率(Hubble rate),使用粒子速度來模拟星系探測中的紅移空間扭曲。
研究人員設計了場級模拟器,根據目标紅移處的 ZA 位移場來預測 z = 3-0 範圍内任何紅移處的非線性粒子位移和速度。
場級模拟器采用 U-Net/V-Net 設計,使用 PyTorch 的 map2map 庫實現和訓練模型。
如上圖所示,模型的輸入具有三個通道,對應于所需紅移處 ZA 位移的笛卡爾分量,排列在 3D 網格中。
輸入經過四個 ResNet 3×3×3 卷積,第一個卷積運算将 3 個輸入通道轉換為 64 個内部通道。
在四次卷積操作之後,結果的副本被存儲以供網絡的上采樣端使用,然後使用 2×2×2 卷積核對結果進行下采樣。
該架構的感受野對應于給定焦點單元兩側的 48 個網格點。預測單個粒子的位移時,以焦點粒子為中心的大小為 97 的區網域需要通過網絡,對應于拉格朗日體積 189.45 Mpc/h。
不過,由于網絡缺少填充區網域中所有單元的信息,因此這些區網域的粒子位移并不準确,需要從輸出中移除。
網絡有限的感受野也有一個優點:它在線性理論準确的大尺度上保留了 ZA 場。
以上的操作可以針對固定宇宙學的單個紅移來訓練來自模拟快照的數據。
為了擴展網絡功能,允許網絡學習 N 體映射作為 Ω 和紅移的函數,作者對其進行了增強以包含樣式參數 。
在執行任何卷積(包括下采樣 / 上采樣操作)之前,快照的 Ω 和 D ( z ) 值将傳遞并映射到與卷積核尺寸匹配的内部數組,然後使用這些參數調節網絡權重。
模型訓練
訓練數據
研究人員從一組具有不同宇宙學參數和一組固定快照紅移的模拟中随機采樣快照,同時訓練樣式參數和網絡參數,使用 Quijote Latin 超立方體模拟,在邊長 1 Gpc/h 的空間中使用 512 個粒子運行。
所有這些模拟的拉格朗日空間分辨率均為 1.95 Mpc/h,整個數據集包含 2000 個模拟,每個模拟都有一組獨特的五個 ΛCDM 宇宙學參數 Ω。
研究人員将 2000 個模拟分為三組:1874 個用于訓練,122 個用于驗證,4 個用于測試。為了鼓勵各向同性,這裏使用數據增強,通過立方體的對稱性随機變換輸入和目标數據。
損失函數
模型訓練使用的損失函數包含四個項。第一個是粒子位移的平均平方誤差(MSE),比較粒子的模拟器位移預測和真實的 N 體位移:
第二項是歐拉密度的 MSE:
第三項是采用粒子速度的 MSE:
最後一項對應于歐拉動量場的 MSE 損失。這裏将粒子速度分布到與初始拉格朗日網格具有相同分辨率的歐拉矢量場網格并計算,p 是網格單元中每粒子質量的歐拉動量。
于是,紅移 z 處快照的最終損失函數為:
實驗結果
研究人員通過構建模拟器輸出和 N 體模拟真值的歐拉密度、和動量自功率譜和互功率譜來評估模拟器的準确性。
對于密度場,使用 CIC 插值方案将粒子分布到 512 網格并估計功率譜,下表列出了用于測試本文模拟器的五個模拟宇宙學參數:
模拟器在訓練過程中從未遇到過以上 5 種測試模拟中的任何一種。
下面測試在訓練數據中的五個固定紅移之間進行插值時的模型性能:
上圖顯示了 SNN 模拟器的功率譜誤差(比例函數),每條曲線的顏色表示紅移。
歐拉密度誤差僅源于粒子位移的誤差,當紅移 z = 0 時,新的瞬态模型的随機性與原始模型的随機性相當,并且傳遞函數誤差通常比原始模型有所改善。
在上圖的最右列中,可以看到由于模拟器無法完美預測 BAO 幅度而導致的振蕩誤差。不過模拟器的這些錯誤特征低于 1%,并且可能會随着更多的訓練數據而得到改善。
紅移相關模型的性能與 z = 0 時的真實空間密度統計數據相當,并且在較高紅移時對于紅移空間和真實空間統計數據的性能明顯更好。
随着紅移的減小,誤差平滑且單調地增加。這表明模拟器可以在其訓練數據中的少量固定紅移快照之間有效地進行插值,而不會過度拟合,否則我們會在中間看到錯誤的振蕩特征。
參考資料:
https://x.com/cosmo_shirley/status/1825749316134158627
本文來自微信公眾号 " 新智元 ",編輯:alan。