EO526

TECH INSIGHT GenAI strutture, del software di sistema e della periferia (edge) della rete. Inoltre, è presumibile che questi investimenti saranno destinati anche ai dispositivi di intelligenza ar- tificiale integrati nei veicoli, nelle abitazioni e nei luoghi di lavoro. Uno degli svantaggi di questa ondata di innovazioni è il rapido aumento del consumo di energia nei data center in cloud, che ospitano attività di formazione e addestra- mento per GenAI, aumento destinato a crescere ulterior- mente. Secondo quanto riportato in un articolo pubblica- to sul New York Times “In uno scenario intermedio, entro il 2027, i server per AI potrebbero utilizzare tra gli 85 e i 134 terawattora (TWh) all’anno, una quantità di energia che Argentina, Paesi Bassi e Svezia insieme utilizzano in un anno e rappresenta circa lo 0,5% dell’attuale consu- mo mondiale di elettricità”. L’AI generativa rappresenta quindi un grosso problema in termini di consumo ener- getico, che non è sicuramente allineata con gli obiettivi di emissioni “net-zero” e di riduzione dei gas serra. EO: Perchè GenAI richiede così tanta energia? M.W.: I processori utilizzati per l’addestramento di Ge- nAI utilizzano un numero enorme di transistor – 100 mi- liardi o più – realizzati impiegando tecnologie avanzate, come i chiplet CMOS da 4 nm, che disperdono corrente durante il loro funzionamento. Anche se la tensione di alimentazione di questi transistor è di soli 0,7 VDD, la richiesta di corrente continua può essere dell’ordine di 1000 ampere (o addirittura superiore), che si traduce in un TDP (Thermal Design Power) di 700 watt. La richiesta di corrente di picco può arrivare fino a 2.000 ampere, che equivale a una potenza di picco di 1.400 watt (o più) per un breve periodo. L’inferenza generata da GenAI, invece, consuma molta meno energia; una buona regola empirica è che il costo energetico dell’inferenza è circa la radice quadrata del costo energetico dell’addestramento dello stesso modello linguistico di grandi dimensioni (LLM). EO: Perché nelle applicazioni di GenAI (e HPC in gene- rale) la gestione delle correnti risulta così difficoltosa? M.W.: Questa problematica è legata alla natura forte- mente transitoria della domanda di corrente elettri- ca, che dipende dal carico algoritmico del processore di addestramento. In altre parole, a seconda che il carico delle attività del modello di rete neurale aumenta o di- minuisce, i requisiti di corrente variano anche in modo drastico, fino a 2.000 ampere per microsecondo. Inoltre, al fine di evitare danni ai transistor durante questi fre- quenti eventi transitori, qualsiasi fenomeno di overshoot o undershoot della tensione di alimentazione non deve essere superiore al 10% (o 0,07 V a 0.7VDD). Si tratta di un vincolo particolarmente impegnativo per le tradizionali architetture di erogazione della potenza. In secondo luogo, l’area del die di silicio dei processori di addestramento è abbastanza ampia, dell’ordine di 800 mm2 o più. Per evitare danni ai transistor e problemi di affidabilità a lungo termine, la tensione di alimentazio- ne minima deve essere mantenuta su tutta questa area del die. Le architetture tradizionali di erogazione, con l’alimentazione che viene distribuita dai quattro bordi del package del processore per GenAI, in genere devono mantenere una tensione di 0,75 V ai bordi del die per ga- rantire i 0,7 V al centro del die. Questi 50 mV aggiuntivi contribuiscono ad aumentano ulteriormente la dissipa- zione di potenza complessiva. EO: Le architetture di erogazione tradizionali sono in grado di affrontare le problematiche legate all’alimen- tazione generate dall’introduzione di GenAI? M.W.: Fino a poco tempo fa, i data center utilizzavano la distribuzione dell’alimentazione a 12VDC. Vicor, ne- L’erogazione della potenza e l’efficienza energetica sono diventate le principali problematiche dei sistemi di elaborazione su larga scala. Nel settore si è assistito a un aumento esponenziale della potenza consumata dai processori in virtù dell’avvento di ASIC e GPU che elaborano complesse funzioni di intelligenza artificiale. La potenza richiesta dal rack è conseguentemente aumentata, in quanto le potenzialità dell’intelligenza artificiale vengono utilizzate per applicazioni di apprendimento e di inferenza su larga scala ELETTRONICA OGGI 526 - MAGGIO 2025 26