Microsoft presenta l’acceleratore AI Maia 200ERT

francescoferrari

5 mesi ago

Microsoft

Microsoft ha presentato Maia 200, un acceleratore AI per l’inferenza basato sul processo a 3 nm di TSMC, dotato di core tensor nativi FP8/FP4, un sistema di memoria riprogettato con 216 GB di HBM3e a 7 TB/s e 272 MB di SRAM on-chip, oltre a engine di il trasferimento dati per modelli di grandi dimensioni. Il chip ospita oltre 140 miliardi di transistor ed è concepito per l’esecuzione di carichi di lavoro AI su larga scala.

Maia 200 introduce un nuovo design di rete a due livelli scalabile, basato su Ethernet. Un livello di trasporto personalizzato e una scheda di rete (NIC) strettamente integrata garantiscono elevate prestazioni, affidabilità e significativi vantaggi in termini di costi senza dover ricorrere a fabric proprietari.

Microsoft precisa che Maia 200 supporterà diversi modelli, inclusi gli ultimi modelli GPT-5.2 di OpenAI, e che il team di Microsoft Superintelligence utilizzerà il nuovo acceleratore per la generazione di dati sintetici.

Maia 200 si integra con Azure e Microsoft sta presentando in anteprima un apposito SDK con un set di strumenti per creare e ottimizzare modelli per il nuovo acceleratore. È disponibile un set completo di funzionalità, tra cui l’integrazione con PyTorch, un compilatore Triton e una libreria kernel ottimizzata, nonché l’accesso al linguaggio di programmazione di basso livello di Maia. Microsoft precisa che questi strumenti offrono agli sviluppatori un controllo granulare, consentendo al contempo un facile porting dei modelli su acceleratori hardware eterogenei.