今天小編分享的科技經驗:聊10句天,ChatGPT要費半斤水?,歡迎閱讀。
和 ChatGPT 或其他生成式 AI 聊天,居然會引發對水資源的耗費?
兩個看似八竿子打不着的事件,近期卻因為一份科技巨頭的報告而被聯系在了一起。谷歌近期發布的 2023 年環境報告顯示,其去年的用水量同比顯著增加了 20%,達到 56 億加侖,而其中絕大部分都被用于為該公司的數據中心散熱。
圖片來源:視覺中國 -VCG41N1344498717
這并不是個例。2023 年初,由 OpenAI 打造的 ChatGPT 火遍全球,一躍成為人工智能領網域的現象級應用,也引發了全球互聯網公司的 AIGC 軍備競賽。
要對 AI 進行大量訓練,也就意味着需要更強的算力中心和與之匹配的散熱能力。在 AI 快速進步的道路上,對水資源的消耗也不斷加碼更新。
對此,有專家告訴《每日經濟新聞》記者,整體來看,當前數據中心耗水已經成為制約數據中心快速發展的因素之一,并呼籲盡快為數據中心用水建立一套規範、統一的标準與利用效率評價方法," 這将成為數據中心實現綠色低碳發展的又一關鍵标準工具 "。
AI 很 " 口渴 ":聊 10 句天,ChatGPT 可能要費半斤水
近日,科技巨頭谷歌發布了 2023 年的環境報告,其中一項數據引發了行業和市場的廣泛關注。
該報告顯示,在 " 用水量 " 這一項,谷歌在 2022 年消耗了 56 億加侖的水。
如果這樣說大家沒什麼概念,我們可以做一個更直觀的對比:有第三方統計顯示,56 億加侖,約等于國内某一線城市全年的用水量,或者是全球每天飲用水的 1/4。也有人稱,這水量相當于 37 個高爾夫球場的用水量,大概能裝滿一個半西湖。
更令人擔心的是,這一數字比谷歌去年的報告增加了 20%。雖然谷歌表示,其目标是在 2030 年補充其辦公室和數據中心消耗的 120% 的淡水,不過根據這份報告,目前的補充率只有 6%,與目标相去甚遠。
如此大的用水量,不禁令人好奇:作為一家科技公司,谷歌什麼業務如此耗水?答案是:為數據中心散熱。
報告顯示,在 56 億加侖耗水中,有 52 億都被用于該公司的數據中心,清晰地顯示了運行大型數據中心要付出的環境成本。
有專業人士指出,用水量增長 20% 與谷歌計算能力的增長大致一致,而谷歌計算能力的增長主要是由人工智能推動的。換句話來說,自去年 ChatGPT 和生成式人工智能技術火爆全球以來,谷歌的用水量也開始顯著上升,而對 AI 的大量訓練成了數據中心耗水的核心原因。
卡羅拉多大學與德克薩斯大學的研究人員在一篇《讓 AI 更節水》的預印論文中也發布了訓練 AI 的用水估算結果,顯示訓練 GPT-3 所需的清水量相當于填滿一個核反應堆的冷卻塔所需的水量。ChatGPT(在 GPT-3 推出之後)每與用戶交流 25~50 個問題,就得 " 喝下 " 一瓶 500 毫升的水來降溫。
除了谷歌,另一個巨頭 Meta 在美國亞利桑那州建設了數據中心,僅 2022 年用水量超過 260 萬立方米(約 6.97 億加侖)。随着全球人工智能軍備競賽的持續更新和大量科技公司競相建設新數據中心,其消耗的水量很可能會繼續上升。
海水、湖水、北極圈,數據中心為節水拼了
大洋彼岸的科技巨頭如此 " 吃電喝水 ",國内人工智能公司用水量情況如何呢?記者查閱了幾家人工智能公司、數據中心的公開信息,發現關于它們用水情況信息很少。
" 此前我們對數據中心綠色節能的關注點主要在能源消耗方面,比如,耗電量以及電能利用效率指标是數據中心最受關注的标籤,水作為自然資源,關注的不多,并且用水量指标受氣候條件、溫溼度、水質等各方面因素影響大,統計比較少。" 呂天文告訴記者。
近年來,随着數據中心的規模越來越大,以冷水系統作為冷源的大型數據中心的耗水量、水源問題開始引發關注,如何減少數據的耗水量,降低 WUE(水資源使用效率)值在業界被廣泛讨論起來。" 整體來看,當前數據中心耗水已經成為制約數據中心快速發展的因素之一,國内很多地方已經将耗水作為了數據中心的重要考核指标。" 中國通信工業協會數據中心委員會常務副理事長、中國 IDC 圈創始人 CEO 黃超表示。
記者注意到,近日,北京市發展改革委修訂印發了《關于進一步加強數據中心項目節能審查的若幹規定》,其中就新增了關于引導數據中心充分利用再生水的内容:再生水輸配管網覆蓋範圍内的數據中心,設備冷卻水、機房加溼等非生活用水應采用再生水。
呂天文向記者介紹稱,為了節約寶貴的自來水資源,很多企業嘗試用各種方法為數據中心散熱,例如,微軟曾嘗試部署海下數據中心,Facebook 數據中心選址北極圈附近,阿裡雲千島湖數據中心使用深層湖水制冷," 但上述方法總是會帶來新的問題,目前國内數據中心的用水主要使用的還是自來水,近幾年政府層面更鼓勵數據中心企業利用中水。"
AI競賽更新,專家呼籲建立數據中心用水國标
今年以來,AIGC 的爆火使得科技公司競賽正不斷加碼,國内大模型創業也進入狂飙,來自 AI 公司、大廠的創業派,以及來自高校、研究機構的學院派加速湧入 " 百模大戰 ",科技部新一代人工智能發展研究中心發布的《中國人工智能大模型地圖研究報告》顯示,截至今年 5 月末,全國參數在 10 億規模以上的大模型已發布 79 個。
數據中心作為傳輸、儲存、處理數據資源的新型基礎設施,其用水量随着 AI 競賽的更新也迎來新一波增長,"AI 大模型訓練需要算力更高,相應的能耗也就更大,AI 芯片和 AI 伺服器的發熱量相比傳統伺服器也更大。數據中心的水消耗最主要還是用來蒸發散熱了,所以随着能耗、發熱量的增加,耗水必然會增加。" 黃超向記者介紹稱。
在采訪中,呂天文建議相關部門盡快為數據中心用水建立一套規範、統一的标準與利用效率評價方法,這将成為數據中心實現綠色低碳發展的又一關鍵标準工具。
" 目前國内對 WUE 指标還沒有廣泛的統一标準,現在較多聚焦在 PUE 層面,但其它如芯片能耗的控制、算法層面的節能,以及我們讨論的耗水問題,都不是簡單的 PUE 能夠代表的。" 黃超表示,進一步節能至少需要在數據中心選址、供配電設計、可再生能源利用、餘熱回收、雨水 / 廢水利用、芯片節能、軟體節能等全方面去做,最終實現在整體層面上的節能。
液冷有望逐步成為制冷領網域主力
在高密度、高能耗的數據中心龐大需求下,制冷領網域技術的革新也開始湧現,一個加速的趨勢就是,液冷出現且有望逐步成為制冷領網域的主力。
冷液冷技術是指使用液體取代空氣作為冷媒,與 CPU、芯片組、内存條以及擴展卡等發熱部件進行熱交換,帶走熱量的技術。相比于傳統的風冷技術,液冷技術的制冷效率更高,可有效降低制冷系統的運行能耗,使數據中心 PUE 達到 1.3 以下。
" 我國幅員遼闊,各地氣候條件差異大,各地數據中心的制冷需求也不盡相同,因此,制冷技術的普适性很重要。" 呂天文認為,液冷技術恰恰能無視海拔、地網域的差異,同時餘熱還可以創造經濟價值。
從市場規模來看,根據賽迪顧問的數據,2019 年我國液冷數據中心市場規模為 260 億元,預計 2025 年可達到 1283.2 億元以上。記者注意到,出于數據安全的保護,數據中心基礎設施的供應方面存在一定的地網域壁壘,目前國外廠商的產品的應用主要以其本國市場為主,國内市場的主要玩家有曙光數創、華為、阿裡巴巴、浪潮信息、廣東合一等。
呂天文告訴記者,得益于中國 AI 具體實踐、5G 創新應用的快速推廣,中國公司的液冷技術目前在國際競争中處于前列,國外掌握液冷技術的企業比較分散,其產品還處于比較早期的技術性驗證階段,投入商用的相對較少。
他判斷,由于風冷技術适用于中小規模的中低密度數據中心,因此不會完全被取代,未來,市場中風冷和液冷将會共同發展,出現一段共存的局面,長遠來看,液冷產品的市場份額會不斷擴大,逐漸成為主流。
黃超同樣認為,當前液冷是面對 AI 高密度需求的最佳制冷方式," 但這項技術還處于起步階段,面臨初期部署成本高、產業鏈不完善、定制化要求高、機房建設要求高等眾多問題,還需要產業進一步解決。" 他表示。