今天小編分享的科技經驗:NASA 超級計算機已落後:拖累任務進度,亟需更新換代,歡迎閱讀。
IT 之家 3 月 17 日消息,盡管美國宇航局 ( NASA ) 一直使用着世界上最前沿的技術,并取得了人類歷史上許多重大發現,但一份其内部總監察長辦公室 ( NASA Office of Inspector General ) 的特别報告卻揭露,由于 NASA 的超級計算機能力不足以滿足任務需求,導致一些項目進度延誤。
圖源 Pixabay
報告指出,NASA 的超級計算機仍然主要依賴于 CPU 中央處理器,例如其旗艦超級計算機之一,竟擁有 18000 個 CPU,但僅有 48 個 GPU 圖形處理器。要知道,GPU 在并行處理任務(科學模拟和建模中非常常見)方面能提供遠超 CPU 的計算能力。
目前,NASA 在加州埃姆斯研究中心 ( Ames ) 的 NASA 先進超級計算中心 ( NAS ) 和馬裡蘭州戈達德太空中心 ( Goddard ) 的 NASA 氣候模拟中心 ( NCCS ) 共擁有五台高端計算 ( HEC ) 設備。這些設備包括支持重返月球并建立長期駐留基地 " 阿爾忒彌斯計劃 " 的艾特肯 ( Aitken ) 、性能強大的伊萊克特拉 ( Electra ) 、用于氣候和天氣模拟的發現号 ( Discover ) 、應用于氣候模拟、天體物理研究和航空航天建模的畢宿五 ( Pleiades ) 以及奮進号 ( Endeavour ) 。
IT 之家注意到,這些機器幾乎完全依賴舊款的 CPU 核心,例如,所有 NAS 超級計算機都使用超過 18000 個 CPU,而 GPU 僅有 48 個,NCCS 的 GPU 數量甚至更少。
報告援引美國宇航局高端計算官員的話說,造成系統無法現代化的原因是多方面的,包括供應鏈問題、現代編程語言需求以及實施新技術所需的技術人員短缺等。報告指出,無法更新現有高端計算基礎設施将直接影響美國宇航局實現其探索、科學和研究目标的能力。
審計還發現,美國宇航局的高端計算運營并未進行集中管理,導致效率低下,并且缺乏内部資源與雲計算資源之間使用策略的統一性。由于未知的調度方式或假定的更高成本,這種不确定性導致了對使用雲計算資源的猶豫。一些任務被迫自行獲取基礎設施,以避免等待使用主要超級計算資源,因為這些資源在很大程度上由于沒有采用最新的高性能計算技術而導致過載。
此外,審計發現,高端計算基礎設施的安全控制措施經常被繞過或未被實施,從而增加了網絡攻擊的風險。
報告最後建議,轉向使用 GPU 和進行代碼現代化改造是滿足 NASA 當前和未來需求的關鍵。這将大大提升其在科學模拟和建模等領網域的計算能力,并助力其順利完成各項太空探索和科研任務。