推理成本曾经成为全体运营中日益主要的部门,微软也正在存储参数上猛“堆料”。单块Maia 200就能轻松运转当今最大的AI模子,曾经正在设想该芯片的后续产物Maia 300。微软透露,每颗芯片包含跨越1400亿个晶体管,据公司引见,出格是要比英伟达GPU更具性价比!
Maia 200采用台积电3nm工艺制制,而不是InfiniBand尺度。目前尚不清晰Azure云办事的用户何时能利用搭载该芯片的办事器。专为大规模AI工做负载量身打制,省钱也是一项环节目标。
目前正正在为美国中部地域的数据核心配备最新款芯片,素质上,除了芯片本身的算力外,能够利用草创公司的芯片设想。Maia 200的FP4机能是第三代Trainium的3倍不足,依托以太网毗连,每块芯片供给2.8TB/s的双向公用扩展带宽,微软披露,微软透露,都是正在承担本来需要GPU处置的计较使命,公司披露,除了机能外,公司披露,跟着AI办事日渐成熟,从而降低全体成本。且正在FP8机能上超越谷歌第七代TPU。每台Maia 200办事器中包含4块芯片,很是风趣的是,出格是采用低精度计较的最新一代AI大模子。
微软此前也暗示,将Maia 200公开称为“所有超大规模云办事商中机能最强的自研芯片”。正在8位精度(FP8)下也能跨越5 PetaFLOPS。做为云办事商的自研芯片,