今天小編分享的科技經驗:微軟首款定制 AI 芯片,Maia 100 更多規格公開,歡迎閱讀。
IT 之家 8 月 30 日消息,微軟公司出席 Hot Chip 2024 大會,分享了 Maia 100 芯片的規格信息。Maia 100 是台積電 5nm 節點上制造的最大處理器之一,專門為部署在 Azure 中的大規模 AI 工作負載而設計。
IT 之家附上 Maia 100 芯片規格如下
芯片尺寸:820 平方毫米
封裝:采用 COWOS-S 夾層技術的 TSMC N5 工藝
HBM BW/Cap;1.8TB/s @ 64GB HBM2E
峰值密集 Tensor POPS: 6bit: 3,9bit: 1.5, BF16: 0.8
L1/L2:500MB
後端網絡 BW:600GB/s(12X400gbe)
主機 BW(PCIe):32GB/s PCIe Gen5X8
設計 TDP:700W
Provision TDP:500W
Microsoft Maia 100 系統采用垂直集成方式,以優化成本和性能。它還采用定制伺服器板,配備專門設計的機架和軟體堆棧,以提高性能。
Maia 100 架構
高速 Tensor 單元可為訓練和推理提供高速處理,同時支持多種數據類型,單元采用 16xRx16 結構。
矢量處理器是一個松散耦合的超标量引擎,采用定制指令集架構(ISA),支持包括 FP32 和 BF16 在内的多種數據類型。
直接内存訪問(DMA)引擎支持不同的張量分片方案。
硬體 semaphores 支持 Maia 系統的異步編程。
為提高數據利用率和能效,大型 L1 和 L2 scratch pads 交由軟體管理。
Maia 100 采用基于以太網的互聯技術和類似 RoCE 的定制協定,可實現超高帶寬計算。它支持高達 4800 Gbps 的 all-gather 和 scatter-reduced 帶寬,以及 1200 Gbps 的 all-to-all 帶寬。
在軟體方面,Maia 軟體開發工具包(SDK)允許任何人快速将其 PyTorch 和 Triton 模型移植到 Maia。Maia SDK 為開發人員提供了多個組件,使他們能夠輕松地将模型部署到 Azure OpenAI 服務。