今天小編分享的科學經驗:華為大模型登Nature正刊!審稿人:讓人們重新審視預報模型的未來,歡迎閱讀。
比傳統方法快 1 萬倍、只需要 1.4 秒就能完成 24 小時全球氣象預報——
它就是來自華為雲的盤古氣象大模型。
今天,它登上了 Nature,據稱還是近年來首篇以中國科技公司作為唯一署名部門發表的 Nature 正刊論文(也就是華為雲獨作)。
審稿人給予它高度評價,這一模型使人類得以重新審視氣象預報模型的未來。
言外之意,就是有了它,原來的傳統方法都不香了。
那麼,它究竟是如何被開發出來的?解決了哪些關鍵難題?又有何具體成效和應用?
順着這篇論文帶你一文看盡。
破解現有 AI 氣象預報模型精度不足問題
上世紀 20 年代以來,特别是近三十年随着算力的迅速發展,傳統的數值天氣預報在每日天氣預報、極端災害預警、氣候變化預測等領網域取得了巨大的成功。
但是随着算力增長的趨緩和物理模型的逐漸復雜化,這一方式的瓶頸日益突出。
于是研究者們開始挖掘新的氣象預報範式如使用深度學習方法預測未來天氣。
華為雲研發團隊于 2 年前開始這方面的研究。
他們發現,在數值方法應用最廣泛的領網域如中長期預報中,現有的 AI 預報方法精度仍然顯著低于數值預報方法,并受到可解釋性欠缺,極端天氣預測不準等問題的制約。
而造成 AI 氣象預報模型的精度不足主要有兩個原因:
第一,現有的 AI 氣象預報模型都是基于 2D 神經網絡,無法很好地處理不均勻的 3D 氣象數據;
第二,AI 方法缺少數學物理機理約束,因此在迭代的過程中會不斷積累迭代誤差。
在此,華為雲的研究人員提出了3D Earth-Specific Transformer(3DEST)來處理復雜的不均勻 3D 氣象數據,從而打造了盤古氣象大模型。
其主要思想是使用一個視覺 transformer 的 3D 變種來處理復雜的不均勻的氣象要素,并且使用層次化時網域聚合策略,訓練了 4 個不同預報間隔的模型(分别為 1 小時間隔、3 小時間隔、6 小時間隔、24 小時間隔),使得預測特定時間氣象狀況的迭代次數最小,從而減少迭代誤差,也避免了由遞歸訓練帶來的訓練資源消耗。
為了訓練每個模型,研究人員使用 1979-2021 年的氣象數據,以小時為部門采樣,訓練了 100 個 epoch。
每個模型需要在 192 塊 V100 顯卡上訓練 16 天。事實上,即使經歷 100 個 epoch,這些模型依舊沒有完全收斂。
也就是說,在計算資源更加充足的情況下,AI 預報的精度還能夠進一步提升。
最終推理時,盤古氣象大模型僅需在一張 V100 顯卡上運行 1.4 秒,即可完成 24 小時全球氣象預報,包括位勢、溼度、風速、溫度、海平面氣壓等,其中水平空間分辨率達到 0.25 ∘ × 0.25 ∘ ,時間分辨率為 1 小時,覆蓋 13 層垂直高度,可以精準地預測細粒度氣象特征。
而作為首個精度超過傳統數值預報方法的 AI 方法,它的計算速度相比傳統數值預報提升超過 10000 倍。
可直接應用于多個下遊場景
今年 5 月,台風 " 瑪娃 " 走向受到廣泛關注。
中央氣象局表示,華為雲盤古大模型在 " 瑪娃 " 的路徑預報中表現優異,提前五天預報出其将在台灣島東部海網域轉向路徑。
在第 19 屆世界氣象大會上,歐洲氣象局也指出,華為雲盤古氣象大模型在精度上有不可否認的能力,純數據驅動的 AI 天氣預報模型,展現出了可與歐洲中期天氣預報中心業務數值模式媲美的預報實力。
歐洲中期天氣預報中心主任弗洛倫斯 · 哈比耶詳細地展示了華為雲盤古氣象大模型與歐洲中期天氣預報中心的實時運行檢驗對比情況:
為了探索 AI 捕獲極端天氣的能力,我們研究了今年 2 月芬蘭的一個案例,當時觀測到了 -29 ℃的寒潮,我們發現盤古較早認識到了這一事件的嚴重性。
弗洛倫斯 · 哈比耶還強調,AI 預測方法資源消耗少,為發展中國家提供了重要機遇,因為它不再需要大規模的超算資源,還為提升全球預報能力提供了難得的機遇。
至于華為雲選擇 AI 氣象預報領網域作為一個 " 突破口 ",一方面,氣象預報尤其是對極端天氣如暴雨、台風、幹旱、寒潮的精準預測關乎國際民生,另一方面,氣象預測問題非常復雜,AI 可以從海量數據中挖掘出新的大氣演變規律,在精度和速度上具有巨大的提升潛力。
據了解,世界氣象組織(WMO)即将發布的 WMO2024 — 2027 年戰略計劃吸收了人工智能元素,使其成為推動氣象科技發展的重要力量。
WMO 還将積極推動 AI 在臨近預報及數值天氣預報等領網域的示範應用,創建人工智能產品應用國際比對平台,制定 AI 氣象應用标準和指南,推動人工智能數據集共享等相關工作,探索并發揮 AI 在氣象領網域的應用潛力,有效支撐全民早期預警倡議。
未來三大關鍵
最後,華為雲盤古氣象大模型團隊如何看待 AI 氣象預報的未來?
答案是三大關鍵:
首先,大數據。龐大的氣象數據是 AI 模型的基石,當前盤古氣象大模型僅使用部分 ERA5 再分析數據,未來的 AI 模型将基于海量的、更精細的全球觀測數據。
其次,大算力。氣象數據超高的分辨率對 AI 模型的訓練造成了巨大的挑戰,盤古氣象大模型現在的輸入分辨率為 1440 × 720 × 14 × 5,相比計算視覺任務常用的分辨率 224 × 224 × 3 大約 500 倍,随着分辨率的進一步增加和模型的增大,需要的算力資源也會迅速增加。
最後,大模型。復雜的氣象規律,超高的分辨率與龐大的數據量都決定了 AI 氣象預報需要使用計算量極高的 AI 模型。
同時,想要不斷迭代領先的 AI 氣象預報模型,穩定的雲上環境、工作套件和對應的運維也是必不可少的。
論文地址:
https://www.nature.com/articles/s41586-023-06185-3