今天小編分享的互聯網經驗:算力兩極分化,邊緣計算AI更新,歡迎閲讀。
據 IDC 發布的《全球邊緣計算支出指南》預測,全球邊緣計算支出在 2024 年将達到 2280 億美元,預計到 2028 年将增長至 3780 億美元。
在中國,邊緣計算同樣展現出強勁的發展勢頭,2023 年中國邊緣計算市場規模達到 732 億元,預計 2024 年将增長至 975.8 億元。
而歸納邊緣計算產業得以提速發展的原因,行業大模型的應用無疑是重要推動因素之一。
邊緣計算迎來產業爆發
今年以來,随着大模型向行業側傾斜,越來越多應用場景湧現,也帶動了計算產業的發展。從目前發展态勢上看,算力正呈現出兩極化發展的趨勢。
一方面,大參數模型的預訓練過程,推動算力向着集群化發展,目前已有不少萬卡集群湧現,未來将會出現更多萬卡集群,集群效應也讓大模型的訓練更快、更高效。
另一方面,在行業應用側來看,企業本地化、私有化部署的需求正在推動邊緣 AI 算力的發展。目前大多數企業選擇本地部署小模型 + 雲端調用大模型的方式來賦能場景。對此,浪潮信息邊緣計算產品部高級產品經理劉香男告訴钛媒體 APP,邊緣 AI 可以提供靠近數據源,更低延時,更快的 AI 計算,同時有效節省數據流量的帶寬,能夠對一些業務密集型包括實時性要求比較高的應用提供很好的支持。
英特爾公司網絡與邊緣事業部高級副總裁兼總經理 Sachin Katti 也曾表示,人工智能的未來将依賴于開放的生态系統,人工智能的應用正在從數據中心向邊緣側延伸。
随着 AI 大模型的行業應用加速,邊緣計算成為科技企業布局的焦點。Gartner 也對邊緣側 AI 應用做出了預測,數據顯示,到 2026 年,全球 80% 的企業将在其業務中引入生成式 AI,其中邊緣場景下的 AI 普及率将達到 50%,AI 将成為邊緣場景的重要負載。
浪潮信息邊緣計算產品線總經理孫波對钛媒體 APP 表示,邊緣 AI 讓智能更接近設備本身,提供低延時、更安全、更強數據隐私保護的智能算力,邊緣計算到邊緣智算的邁進将重塑企業的業務模式、運營模式。
英特爾公司副總裁兼網絡與邊緣事業部中國區總經理陳偉也曾在與钛媒體 APP 的對話中表示,從發展趨勢上看,單就英特爾的客户而言,今年探索基于邊緣大模型落地的解決方案的客户更多," 今年完全不一樣。今年基本上可以説一半以上的客户都在探索基于邊緣大模型的落地解決方案,也有非常多的實際案例。" 陳偉進一步指出。
從目前應用上看,在邊緣側的模型參數要比通用大模型的參數小很多,目前在邊緣側的模型參數大多在 7B~10B 之間,而這時候,模型的壓縮就成了一件很重要且困難的事。目前主流的模式是,在壓縮的同時,将行業專屬知識灌進去,也就是俗稱的漸進式剪枝的技術方案。
從邊緣計算到邊緣智算,仍面臨四大挑戰
當下的邊緣計算與傳統的邊緣計算也有着一些差别,當下的邊緣計算應該具備智算的能力,具備承接多元異構算力的能力,所以,準确的説,現在及未來我們需要的是邊緣智算。
在邊緣計算向邊緣智算的發展過程中,也面臨着諸多挑戰。這其中,最大的一個挑戰就是多元異構算力的融合。原有的邊緣計算的架構幾乎都是基于 CPU 架構展開的,但随着 AI 技術在邊緣側的應用越來越多,邊緣側需要具備人工智能算力的能力,其設備整合 GPU 芯片,混合 GPU、CPU 架構,實現異構算力在邊緣側的融合、協同發展已成為當下邊緣計算向邊緣智算轉變過程中行業首要需要解決的問題。
對此,孫波告訴钛媒體 APP,AI 應用推理場景復雜,業務需求多樣,在邊緣側需要多元化、分布式的邊緣智算力。企業需要為人工智能、機器學習和大模型建設全新的 IT 基礎架構,異構計算将成為主流。邊緣側的異構計算能使企業擁有更高的并行計算和低延遲的計算能力,支持更大容量的内存,以滿足當下實時負載增加的需求。此外,邊緣 AI 場景還需要計算設備提供更多的外置硬碟插槽,并廣泛支持 NVMe/PCIe 等協定,以滿足數據洪流的需求。
其次,與傳統邊緣計算一樣,邊緣智算也面臨着環境帶來的挑戰,在邊緣側的算力往往部署在高温、高濕等極端環境中。這些環境條件對伺服器的穩定性和可靠性提出了更高的要求。" 需要采用先進的散熱技術、材料科學和制造工藝來确保伺服器在極端環境下仍能保持穩定的運行狀态。" 劉香男指出。
再次,因為邊緣側設備分散在各個節點,分布式、跨地網域的異構邊緣節點從應用場景、算力性能和環境資源等方面都存在差異性,管理難度較高。因此需要遠程對硬體、算法和應用進行智能化的運維,并且與雲端聯動,實現邊緣自治、雲邊資源協同管理等需求。
最後,在劉香男看來,生态的建設也是邊緣智算發展面臨的重要挑戰。邊緣智算作為新興技術趨勢,在推動與人工智能應用融合落地的過程中,面臨產業和技術鏈條不相匹配、系統間相互獨立,在不同行業、不同企業的生產環境中存在大量不同種類的設備、協定和應用程式,設備接口難統一的問題。這就需要構建更加開放的產品标準,推動產業鏈上下遊的聯合創新落地。
廠商積極布局
基于這些挑戰,包括浪潮信息、英特爾等眾多廠商也在邊緣智算方面開始展開積極的布局。
以浪潮信息為例,浪潮信息針對邊緣智算的發展趨勢,提出了 "4+3+X" 的全棧產品布局。 其中,"4" 代表了浪潮信息四類全新元腦邊緣算力產品,包括元腦邊緣微中心、元腦邊緣伺服器、元腦便攜 AI 伺服器和元腦邊緣微伺服器;"3" 則是在硬體產品之上,推出了緣視、緣腦、緣智三大智能化管理平台,分别滿足不同設備的運維監控;"X" 則是指面向多元場景的各類方案,為用户提供整合上下遊產業生态的產品方案能力。
孫波表示,AI 大模型在邊緣側擁有廣闊的應用場景,但制造、交通、能源等不同行業和企業的邊緣應用場景百花齊放,垂直行業 / 企業的大模型算法開發成本高昂、算力需求多樣、模型優化和遷移管理復雜。" 浪潮信息全面更新邊緣智算產品家族,4 大硬體產品線全部支持 AI 算力,3 大管理平台也融合了智能化,同時還和夥伴開發了近百種邊緣場景化解決方案。" 孫波如是説。
浪潮信息邊緣計算產品部高級架構師李寧告訴钛媒體 APP,交通行業的車路雲一體化、智慧交通方案是邊緣智算發展最為迅速的領網域之一。城市可以通過在路側部署強大的邊緣計算設備,實現各個路口智能 " 感知 " 路口事故、擁堵等交通問題,并通過交通流量均衡等算法實時的調控路口交通,不僅疏解擁堵,保障道路安全暢通,也為未來車路雲一體化和自動駕駛的落地提供了重要支撐。
英特爾在教育、零售等行業也有重點布局。其中,教育方面,英特爾聯合希沃推出了 "AI+ 教育 " 的解決方案,借助英特爾 ® 酷睿™ Ultra 處理器,希沃無需依賴雲端計算資源,即可在本地完成 AI 教學大模型的運行,從而提高系統響應速度和穩定性,确保教學過程中的流暢體驗。
在零售業方面,多樂之日通過邊緣計算技術,打造了智慧門店解決方案。該解決方案可借助門店已有的音視頻采集設備,并通過數據整合及優化的管理平台,針對不同門店需求和特點,為其打造一套專屬數智化門店模型,提供從商品陳列、門店服務、門店衞生、員工規範、到人群洞察、客流洞察的不同功能,提升了多樂之日門店運營差異化的管理能力、提高了管理效率、降低了人工巡店成本投入并強化了員工規範的執行,加速烘焙行業的智能化發展。
除了整體的解決方案,眾多雲廠商也開始積極布局邊緣側的平台型產品,阿裏雲是推出邊緣計算平台 " 雲邊一體 ",能夠實現低延遲、高帶寬的計算和數據處理,廣泛應用于智能制造、智慧城市等領網域;京東雲推出的邊緣計算平台則是着重在京東集團傳統優勢產業,據悉,平台能夠支持多種應用場景,如智能制造、智慧物流等。
硬體廠商、整體解決方案供應商、雲廠商等積極布局邊緣智算,推動了邊緣智算應用的不斷湧現,也為千行百業智慧化轉型注入了新動能。備受市場和企業關注的邊緣智算,将成為競争激烈的算力市場中的新藍海。(本文首發于钛媒體 APP,作者|張申宇,編輯丨蓋虹達)