EO_511

I prodotti Le aziende che propongono acceleratori, in varie forme (chip, schede, architetture integrate) sono numerose, così come le gamme di prodotti, opportunamente differenziate, per rispondere alle esigenze dei diversi mercati. Tra gli acceleratori hardware più diffusi ci sono le GPU e NVIDIA è uno dei nomi più noti in questo specifico setto- re. Questo produttore ha realizzato da tempo acceleratori in grado di effettuare operazioni grafiche estremamente com- plesse. L’azienda ha infatti realizzato, per esempio, i Ray Tracing Core, unità di elaborazione nella GPU appositamen- te progettate per affrontare il notevole carico di lavoro delle operazioni di ray tracing, che può richiedere anche 39 ope- razioni per pixel per calcolare gli effetti di luce in una scena. Un esempio di architettura GPU recente di NVIDIA è quella chiamata Ada Lovelace (per il segmento consumer men- tre l’architettura per i data center è quella chiamata Grace Hopper) che migliora sensibilmente le prestazioni rispetto alle precedenti generazioni di GPU (Turing e Ampere). Ada, per esempio, utilizza i Tensor Core di quarta generazione. Si tratta di core di calcolo specializzati ad alte prestazioni che sono ottimizzati per eseguire le operazioni matemati- che fra matrici utilizzate nelle applicazioni AI e HPC. Que- ste prestazioni sono infatti determinanti per applicazioni come il deep learning e l’inferenza AI. La GPU NVIDIA AD102, basata su questa architettura e uti- lizzata dalla scheda GeForce RTX 4090, è stata progettata per offrire prestazioni molto elevate per giocatori e creatori di contenuti e consente alla scheda di fornire costantemen- te frame rate superiori a 100 fotogrammi al secondo con ri- soluzione 4K in molti giochi. In pratica NVIDIA, con AD102, ha realizzato una GPU con 76,3 miliardi di transistor (è seconda soltanto alla GPU H100, sempre di NVIDIA e basata sull’architettura Hopper, in termini di complessità) e 18.432 Core CUDA (il 70% in più rispetto all’architettura di Ampere) in grado di funzionare a clock superiori a 2,5 Ghz. La GPU AD102 dispone inoltre di 18MB di cache L1, 96MB di cache L2 (16 volte più di Ampere) e un registro da 36 MB. Parte di questi risultati derivano anche dal processo pro- duttivo utilizzato. Le GPU Ada sono fabbricate con il pro- cesso 4N di TSMC e gli ingegneri NVIDIA hanno lavorato a stretto contatto con TSMC per la sua ottimizzazione, riu- scendo a integrare notevolmente più core. Per i data center, offre la GPU NVIDIA L40, sempre basata sull’architettura Ada. Rispetto alla generazione preceden- te di GPU NVIDIA A40, il produttore precisa che L40 offre prestazioni di calcolo FP32 due volte superiori e prestazio- ni per il rendering quasi tre volte migliori. NVIDIA L40 è utilizzabile per i server che eseguono appli- cazioni IA generativa, simulazioni di guida di veicoli auto- nomi, calcolo ad alte prestazioni (HPC) FP32, workstation virtuali, cloud gaming e addestramento e inferenza AI. Anche AMD è particolarmente focalizzato sull’accele- razione hardware, come testimonia per esempio la sua architettura CDNA 2 per HPC e AI. Questo produttore realizza diverse serie di acceleratori, come la famiglia di schede acceleratrici Alveo, destinata ai data center, che offre un’accelerazione ottimizzata per i carichi di lavoro in settori come l’elaborazione finanziaria, l’apprendimen- to automatico, l’archiviazione computazionale, la ricerca e analisi dei dati, ma anche lo streaming video. AMD ha recentemente prodotto l’acceleratore multimedia- le AMDAlveoMA35D dotato di due unità di elaborazione vi- deo (VPU) basate su ASIC a 5 nmche supportano lo standard di compressione AV1 e appositamente costruito per accele- rare i servizi di streaming live interattivi su larga scala. Gli acceleratori di rete SmartNIC, inoltre, includono piat- taforme Alveo che forniscono accelerazione hardware software-defined. La famiglia AMD Pensando, invece, è concepita per ac- celerare i servizi di infrastruttura con una DPU Softwa- re-in-Silicon completamente programmabile e la suite di servizi definiti dal software. AMD offre anche soluzioni di computational storage drive (CSD) e Telco. GLi SmartS- SD CSD sono in grado di accelerare le applicazioni a uso in- tensivo di dati, mentre le schede acceleratrici Telco si de- dicano alle funzioni in banda base 5G sensibili alla latenza e ad alta intensità di throughput, liberando i processori dei server Telco che possono eseguire altri compiti. Per quanto riguarda Intel, i processori scalabili Intel Xeon di quarta generazione hanno diversi TECH FOCUS ACCELERATORI AMD ha recentemente presentato la scheda acceleratrice Alveo MA35D per applicazioni multimediali come streaming interattivo a bassa latenza e ad alto volume: watch party, acquisti dal vivo, aste online e social streaming ELETTRONICA OGGI 511 - GIUGNO/LUGLIO 2023 49