大模型到底能不能預測惡劣天氣

今天小編分享的科技經驗：大模型到底能不能預測惡劣天氣，歡迎閱讀。

春節臨近，想必不少人已經踏上回家的旅程了吧，但由于這兩天突然出現的降溫，讓不少朋友都遇到了極端天氣，甚至出現了飛機、火車延誤或取消的情況。這種突然出現的極端天氣，讓天氣預報變成了玩具一樣的東西。

但現在，這種情況或許馬上就要改變了。當前有不少的大語言模型已經擁有了高準确度的天氣預測能力。相比傳統的天氣預測技術，這些被稱為大型 AI 氣象預測模型（Large AI Weather forecast Model，LWMs）在極端天氣預測方面有着更好的效果。

盤

古氣象（Pangu-Weather）

盤古氣象（Pangu-Weather），是一款由華為推出的天氣預測系統，它利用深度學習技術來提高天氣預報的準确性。

盤古氣象提高預測準确性有兩個關鍵策略，包括一個定制的 3D 地球特定變換器（3DEST）架構，它可以将高度信息格式化為立方體數據；此外研究團隊還設計了一個應用分層時間聚合算法來減輕累積預報誤差。研究顯示，盤古氣象在短到中等範圍的預報（即從一小時到一周的預報時間範圍）顯示出巨大優勢。而且該系統還支持極端天氣預報和多種集合預報。

在極端天氣事件預報方面，盤古氣象展現出顯著的優勢。在測試 2018 的 88 個命名熱帶氣旋的跟蹤上，其 3 天和 5 天的平均直接位置誤差均低于 ECMWF-HRES，分别為 120.29 公裡和 195.65 公裡，優于後者的 162.28 公裡和 272.10 公裡。

不過盤古氣象仍存在一些局限性和改進空間。由于其訓練數據基于 ERA5 再分析數據，會存在較大偏差，尤其是在強度預測方面。其次，盤古氣象訓練過程中需要大量計算資源，訓練以及定期維護的成本極高。而且盤古氣象在未見過的數據或不同氣候條件下的泛化能力尚需驗證。

GraphCast

GraphCast 是由 Google DeepMind 開發得一個基于圖神經網絡的天氣預測模型，它能夠處理復雜的空間依賴關系，并在全球範圍内提供準确的天氣預報。

GraphCast 利用 GNNs 在處理復雜空間依賴關系方面的優勢，以提升天氣預報的準确性。在預測過程中，GraphCast 會西安進行數據預處理，将氣象數據轉換為圖篇結構，每個節點代表地理位置，并用邊來表示空間關系；之後，GraphCast 将為圖中的每個節點提取特征，如溫度、溼度、風速等；然後利用圖神經網絡建模，通過聚合鄰居節點的信息來更新每個節點的内容，學習復雜的空間依賴關系；接着進行時間序列預測，預測未來一段時間内各個節點的氣象數據變量；最後，對預測結果進行處理和評估，提高預報的可讀性和準确性。

GraphCast 同樣存在問題。GraphCast 的性能很大程度上依賴于高質量和全面的氣象數據，數據的缺失或不準确性可能會影響模型的預測結果。此外，盡管 GraphCast 能夠處理復雜的空間依賴關系，但在實時更新和快速響應天氣變化方面可能仍然存在挑戰。

風烏（Fengwu）

風烏是一款面向全球的中程天氣預報系統，由上海人工智能實驗室聯合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象台發布。它采用了多模态和多任務學習的深度學習架構，包括模型特定的編碼器 - 解碼器和跨模态融合 Transformer。這些組件在不确定性損失的監督下學習，以地區自适應的方式平衡不同預測器的優化。風烏還引入了重放緩衝區機制，通過存儲先前優化迭代的預測結果并用作當前模型的輸入，提高了長時預測性能。

風烏最大的特點，就是利用多模态和多任務學習能力來預測天氣，可以将全球氣象有效預報提高到 10.75 天。它在 ERA5 再分析數據上進行了等同 39 年時間的訓練，能夠準确模拟大氣動力學，并預測 37 個垂直層次的未來陸地和大氣狀态。

性能評估顯示，風烏在大多數預測目标上的表現優于 GraphCast，例如将 10 天領先全球 z500 預測的均方根誤差（RMSE）從 733 降低到 651 m²/s²。它在 NVIDIA Tesla A100 硬體上的推理成本僅為 600 毫秒，與 GraphCast 相比，在訓練和推理方面的計算成本更低。

和其他同類模型一樣，風烏也面臨着數據和成本的挑戰，而且随着氣候模式的變化，風烏需要定期更新以保持準确性，這需要持續的資源投入和專業知識。

ClimateNet

ClimateNet 是一個利用卷積神經網絡從衛星影像中識别氣候特征的模型，旨在解決天氣和氣候科學領網域中識别、檢測和定位極端天氣事件的挑戰。ClimateNet 通過 ClimateContours 工具進行數據集創建，允許專家标注氣候事件，并基于 LabelMe 進行了優化。其研究團隊進行了多次标注活動，產生了數百個專家标注的氣候數據快照，形成了 ClimateNet 數據集，并進行了嚴格的質量控制。

ClimateNet 使用 DeepLabv3+ 架構訓練深度學習模型，實現了對氣候數據的像素級分割。模型在兩個不同的氣候模型場景下進行了訓練和測試，并展示出了優于基于啟發式算法的模型的性能。此外，ClimateNet 的應用案例顯示了如何利用其分割結果進行條件降水分析，有助于理解氣候變化對極端天氣事件的影響。

盡管 ClimateNet 取得了顯著進展，但因為訓練數據有限，且需要持續的更新和維護，ClimateNet 目前還處于研究階段，并沒有被正式投入使用。

伏羲（FuXi）

伏羲是一款基于機器學習的天氣預報系統，能夠提供 15 天的全球天氣預報，具有 6 小時的時間分辨率和 0.25° 的空間分辨率。該系統基于歐洲中期天氣預報中心（ECMWF）的 ERA5 再分析數據集開發，并通過等同 39 年時間的數據訓練而成。

伏羲采用了一種新穎的級聯機器學習模型架構，由三個預訓練的伏羲模型組成，分别針對 0-5 天、5-10 天和 10-15 天的預報時間視窗進行優化。這些模型通過級聯方式生成完整的 15 天預報。伏羲在 15 天預報中的表現與 ECMWF 集合平均相當，顯著減少了累積誤差，提高了長期預報的準确性。為了處理天氣預報的不确定性，伏羲還提供了一個有 50 成員的集合預報。

伏羲目前最大的問題是其預報時間在 9 天後便會出現性能下降的情況，而且伏羲的預測玩去哪依賴于 ECMWF 的 ERA5 再分析數據集，法完全獨立于傳統的數值天氣預報模型，這讓它當前還難以投入到實際應用之中。

除了這些較為成熟的大型 AI 氣象預測模型之外，還有不少模型正在訓練之中，以減少極端天氣可能帶來的影響。當然，由于成本、維護、精确度等問題，現在的天氣預測模型還難以做到全面準确，但相信随着技術的發展，将來會有越來越多的 AI 模型被投入使用，讓過年回家的道路 " 暢通無阻 "。