Qualcomm Technologies ha annunciato le sue soluzioni di nuova generazione ottimizzate per l’inferenza AI nei data center. Si tratta di schede acceleratrici e rack basati sui chip Qualcomm AI200 e AI250.
AI200 introduce una soluzione di inferenza AI a livello di rack ed è stata progettata per garantire un basso TCO e prestazioni ottimizzate per l’inferenza di modelli di grandi dimensioni (LLM, LMM) e altri carichi di lavoro AI. Ogni scheda supporta 768 GB di LPDDR.
La soluzione AI250, invece, è caratterizzata da un’innovativa architettura di memoria basata sul near-memory computing. Grazie alla possibilità di utilizzare una larghezza di banda di memoria effettiva oltre 10 volte superiore e a un consumo energetico significativamente ridotto, consente un’inferenza AI disaggregata che sfrutta l’hardware in modo efficiente, soddisfacendo allo stesso tempo i requisiti di prestazioni e costi dei clienti.
Entrambe le soluzioni rack sono dotate di raffreddamento a liquido diretto per una maggiore efficienza termica, supportano PCIe ed Ethernet per l’espansione, offrono elaborazione riservata per carichi di lavoro AI sicuri e garantiscono un consumo energetico di 160 kW a livello di rack.
Entrambe le soluzioni integrano un ampio stack software e assicurano la piena compatibilità con i principali framework di intelligenza artificiale.
La disponibilità commerciale di Qualcomm AI200 è prevista per il 2026, mentre AI250 arriverà nel 2027.