今天小编分享的科技经验:AI探索宇宙结构新突破,超精准场级模拟,半秒完成冷暗物质仿真,欢迎阅读。
AI 模拟宇宙结构,准确高效预测宇宙演化。
【导读】AI 开启模拟宇宙!近日,来自马克斯 · 普朗克研究所等机构,利用宇宙学和红移依赖性对宇宙结构形成进行了场级仿真,LeCun 也在第一时间转发和推荐。
下面的两组动图展示了计算机对于宇宙形成的模拟:
其中一行是根据物理定律计算的,而另一行是由人工智能学习后生成的。
你能看出来哪一个结果出自 AI 之手吗?
这就是来自马克斯 · 普朗克研究所等机构发表的工作:利用宇宙学和红移依赖性对宇宙结构形成进行场级仿真。
AI 终于开始模拟宇宙了!LeCun 也在第一时间转发和推荐:
作者表示:我们现在可以使用人工智能在多个时间步上对大多数宇宙学特性生成宇宙的冷暗物质模拟。
并且,物理学是这个神经网络设计的核心,它可以看成是 PINN(内嵌物理知识神经网络)的一种实现,其损失函数建模了时间相关的粒子坐标和速度之间的特定关系。
在这项工作中,研究人员提出了一个用于大规模结构的场级模拟器,捕获宇宙学依赖性和宇宙结构形成的时间演化。
模拟器将线性位移场映射到特定红移处对应的非线性位移。
模拟器是一个神经网络,包含对 Ω 和红移 z 处的线性增长因子 D ( z ) 的依赖性进行编码的样式参数。
研究人员在六维 N-body 相空间上训练模型,将粒子速度预测为模型位移输出的时间导数,显著提高了训练效率和模型准确性。
最终,模拟器在测试数据(训练期间未见过的各种宇宙学和红移)上实现了良好的精度和性能,在 z = 0,k ∼ 1 Mpc/h 的尺度上达到了百分比级精度,并在较高红移下提高了性能。
通过合并树将预测的结构形成历史与 N 体模拟进行比较,可以找到一致的合并事件序列和统计特性。
并且,该模拟器速度极快,在单个 GPU 上半秒内就能够预测 128 的立方个粒子的非线性位移和速度场。
同时又可以通过多 GPU 并行处理进行良好的扩展,支持任意大尺寸的实现。
模拟宇宙的 AI
随着宇宙学数据分析推向更小的尺度,利用高阶统计数据,并实现场级分析和基于模拟的推理方案,为预测非线性宇宙结构形成提供了更准确的方法。——当然也对算力提出了超高要求。
比如利用 N 点统计的传统分析方法,需要大量模拟数据集来进行准确的协方差估计。
而基于模拟的推理方法和场级分析,则需要生成许多后期密度场的准确实现,以约束模型参数和初始条件重建。
DESI、Euclid、Vera C. Rubin 天文台、SPHEREx 和 Subaru Prime Focus Spectrograph 可以为研究者提供大量最新的星系巡天数据。
为了探明宇宙学参数和初始条件的最佳约束,需要对巡天观测值进行快速、高度准确的预测。
在这项工作中,作者通过添加红移依赖性和对多个红移模拟快照的训练来扩展场级 N 体模拟器。
由于本模型的时间依赖性和自可微性,研究者可以有效地获得 N 体粒子速度作为输出粒子位移的时间导数。
可以在训练期间动态评估这些速度,由此定义一个取决于粒子位置和速度的损失函数,在六维 N 体相空间上进行训练。
强制执行「速度必须等于位移时间导数」的物理约束,可以提高训练效率并提高模型的准确性,特别是对于速度场。
模型结构
作者通过周期模拟框中的坐标 x 来描述 N 体粒子。每个粒子都与规则立方晶格上的一个位点 q 相关联,因此它在红移 z 处的位置定义为:
这里 Ψ 是位移场,q 是粒子的拉格朗日坐标。在线性 Zeldovich 近似 ( ZA ) 中,位移场演变为:
其中 D ( z ) 是线性增长因子,zi 是早期选择的红移,以便线性理论可以很好地描述位移场。
随着引力簇的非线性在后期变得重要,这种线性近似变得不准确,而模拟宇宙结构形成的非微扰方法(如 N 体模拟)变得必要:
这里 f ( z ) 为线性增长率,H ( z ) 是哈勃率(Hubble rate),使用粒子速度来模拟星系探测中的红移空间扭曲。
研究人员设计了场级模拟器,根据目标红移处的 ZA 位移场来预测 z = 3-0 范围内任何红移处的非线性粒子位移和速度。
场级模拟器采用 U-Net/V-Net 设计,使用 PyTorch 的 map2map 库实现和训练模型。
如上图所示,模型的输入具有三个通道,对应于所需红移处 ZA 位移的笛卡尔分量,排列在 3D 网格中。
输入经过四个 ResNet 3×3×3 卷积,第一个卷积运算将 3 个输入通道转换为 64 个内部通道。
在四次卷积操作之后,结果的副本被存储以供网络的上采样端使用,然后使用 2×2×2 卷积核对结果进行下采样。
该架构的感受野对应于给定焦点单元两侧的 48 个网格点。预测单个粒子的位移时,以焦点粒子为中心的大小为 97 的区網域需要通过网络,对应于拉格朗日体积 189.45 Mpc/h。
不过,由于网络缺少填充区網域中所有单元的信息,因此这些区網域的粒子位移并不准确,需要从输出中移除。
网络有限的感受野也有一个优点:它在线性理论准确的大尺度上保留了 ZA 场。
以上的操作可以针对固定宇宙学的单个红移来训练来自模拟快照的数据。
为了扩展网络功能,允许网络学习 N 体映射作为 Ω 和红移的函数,作者对其进行了增强以包含样式参数 。
在执行任何卷积(包括下采样 / 上采样操作)之前,快照的 Ω 和 D ( z ) 值将传递并映射到与卷积核尺寸匹配的内部数组,然后使用这些参数调节网络权重。
模型训练
训练数据
研究人员从一组具有不同宇宙学参数和一组固定快照红移的模拟中随机采样快照,同时训练样式参数和网络参数,使用 Quijote Latin 超立方体模拟,在边长 1 Gpc/h 的空间中使用 512 个粒子运行。
所有这些模拟的拉格朗日空间分辨率均为 1.95 Mpc/h,整个数据集包含 2000 个模拟,每个模拟都有一组独特的五个 ΛCDM 宇宙学参数 Ω。
研究人员将 2000 个模拟分为三组:1874 个用于训练,122 个用于验证,4 个用于测试。为了鼓励各向同性,这里使用数据增强,通过立方体的对称性随机变换输入和目标数据。
损失函数
模型训练使用的损失函数包含四个项。第一个是粒子位移的平均平方误差(MSE),比较粒子的模拟器位移预测和真实的 N 体位移:
第二项是欧拉密度的 MSE:
第三项是采用粒子速度的 MSE:
最后一项对应于欧拉动量场的 MSE 损失。这里将粒子速度分布到与初始拉格朗日网格具有相同分辨率的欧拉矢量场网格并计算,p 是网格单元中每粒子质量的欧拉动量。
于是,红移 z 处快照的最终损失函数为:
实验结果
研究人员通过构建模拟器输出和 N 体模拟真值的欧拉密度、和动量自功率谱和互功率谱来评估模拟器的准确性。
对于密度场,使用 CIC 插值方案将粒子分布到 512 网格并估计功率谱,下表列出了用于测试本文模拟器的五个模拟宇宙学参数:
模拟器在训练过程中从未遇到过以上 5 种测试模拟中的任何一种。
下面测试在训练数据中的五个固定红移之间进行插值时的模型性能:
上图显示了 SNN 模拟器的功率谱误差(比例函数),每条曲线的颜色表示红移。
欧拉密度误差仅源于粒子位移的误差,当红移 z = 0 时,新的瞬态模型的随机性与原始模型的随机性相当,并且传递函数误差通常比原始模型有所改善。
在上图的最右列中,可以看到由于模拟器无法完美预测 BAO 幅度而导致的振荡误差。不过模拟器的这些错误特征低于 1%,并且可能会随着更多的训练数据而得到改善。
红移相关模型的性能与 z = 0 时的真实空间密度统计数据相当,并且在较高红移时对于红移空间和真实空间统计数据的性能明显更好。
随着红移的减小,误差平滑且单调地增加。这表明模拟器可以在其训练数据中的少量固定红移快照之间有效地进行插值,而不会过度拟合,否则我们会在中间看到错误的振荡特征。
参考资料:
https://x.com/cosmo_shirley/status/1825749316134158627
本文来自微信公众号 " 新智元 ",编辑:alan。