Il punto sui chip grafici

Dalla rivista:
Elettronica Oggi

 
Pubblicato il 1 agosto 2012

Tra i componenti che si stanno evolvendo maggiormente negli ultimi mesi vi sono quelli relativi alla grafica. Le dinamiche tecnologiche e di mercato delle GPU (Graphics Processing Unit) stanno infatti cambiando il panorama per questo tipo di componenti, sia nel segmento dei prodotti per PC e notebook, sia in quello dei device mobile per il mercato consumer (tablet e smartphone).
Per esempio dal punto di vista dei trend tecnologici, si è potuto notare un passaggio decisamente importante nel 2011 per il mercato dei PC rappresentato dalla produzione in elevati volumi di processori multi core con architettura x86 dotati di componenti integrati per l’elaborazione grafica. Questo ha comportato come primo effetto la progressiva scomparsa degli IGP, cioè i componenti del chipset che integravano la sezione grafica.

Ci sono però alcune sfide di cui tenere conto che caratterizzano l’integrazione della sezione grafica nelle CPU e che potrebbero condizionare le dinamiche di sviluppo. Per esempio, le GPU sono componenti solitamente molto complessi, che richiedono alimentazione e raffreddamento particolari. A questo va aggiunto che quasi sempre gestiscono la memoria in modo molto diverso dalle CPU. Un altro elemento da considerare riguarda il fatto che il ciclo di sviluppo delle GPU è molto più veloce di quello delle CPU, e integrando i due componenti su uno stessi die di silicio potrebbe rendere i componenti rapidamente obsoleti. Un ulteriore problema deriva dal fatto che le GPU solitamente utilizzano molti più transistor di una CPU e hanno un die di dimensioni maggiori.

Uno sguardo al mercato
Se per esempio si considera il segmento dell’hardware dedicato al gaming, le stime degli analisi sono di un fatturato di 23,6 miliardi di dollari per il 2012, con la prospettiva d i raggiungere i 32 miliardi di dollari nel 2015. Per aree geografiche come quella BRIC, per sistemi dedicati al gaming, accessori e upgrade, la domanda prevista per il 2012 è in crescita e il valore è di circa 4,7 miliardi di dollari, con previsione di arrivare a 7,7 miliardi di dollari nel 2015.
Per quanto riguarda i dispositivi mobile, come tablet e smartphone, in base ai dati di Jon Peddie Research, il CAGR per consegne nel 2011 di GPU è stato del 18%. In termini di consegne, Qualcomm ha raggiunto il 31% di market share nel 2011, mentre Apple il 23% e TI il 17%.

Occorre considerare che molte GPU per dispositivi portatili sono ormai più potenti, in termini di capacità di calcolo, delle GPU entry level per PC e sono in grado di far funzionare applicazioni Open GL ES 1.1. o 2.0. Questi componenti sono dotati di shader programmabili e possono essere utilizzate per giochi anche piuttosto sofisticati, ma soprattutto dispongono, contrariamente a molte GPU per PC, di una versatile sezione dedicata all’image processing per gestire direttamente l’ingresso delle videocamere, oltre a una sezione per il video processing.
In questo mercato le architetture di molti componenti sono quelle di fornitori di IP come ARM, Imagination Technologies, DMP e Vivante.

Per avere un’idea di come è suddiviso il mercato delle schede grafiche add in per PC, i dati più recenti di Jon Peddie Research, riferiti al primo trimestre 2012, evidenziano un panorama dominato da schede con GPU Nvidia, con 61,9% di share, seguite da quelle AMD con il 37,8%, mentre altri produttori come S3 e Matrox sono abbondantemente sotto lo 0,5%.
Da notare che la grafica embedded nei processori sta semplicemente sostituendo quella integrata nei chipset e non sembra avere un impatto rilevante sulle schede add in per PC, con l’eccezione probabilmente delle nuove soluzioni di AMD che, grazie alle buone prestazioni, potrebbero condizionare il segmento delle schede grafiche add in di fascia più bassa.

AMD Tahiti
L’architettura più recente proposta da AMD per i suoi processori grafici Radeon è quella chiamata Tahiti. Questa architettura, utilizzata dai Radeon HD 7900, permette di utilizzare fino a 32 Compute Unit (CU) con un massimo 2048 stream processor e ha un engine a doppia geometria. La frequenza di clock dell’engine è di 925 MHz, e la GPU può contare su 128 unità per le texture con un fillrate di 118,4 GT/s. Tra gli altri elementi principali di questa architettura vanno annoverati otto back end per il rendering, una interfaccia a 384 bit per la memoria di tipo GDDR5 capace di trasferire fino a 264 GB/s, una interfaccia x16 per il bus PCI Express 3.0 e 768 KB di cache al secondo livello. Decisamente interessante è la gerarchia della memoria utilizzata, la cui struttura è particolarmente articolata.

Fig. 1 – Diagramma a blocchi dell’architettura Tahiti utilizzata per i processori Radeon HD 7900 di AMD

L’architettura prevede infatti la presenza di 16 KB di cache per le istruzioni e di 32 KB per i dati, quantità condivise per ogni gruppo di CU. Ogni CU ha i suoi registri e la condivisione dei dati locali. Utilizzando un collegamento in grado di spostare 64 Byte per ogni ciclo di clock, si arriva alla cache al primo livello e, successivamente, a quella al secondo livello suddivisa in partizioni. Il Global Data Share semplifica inoltre la sincronizzazione fra le CU.
Dal punto di vista costruttivo, il chip implementa 4,3 miliardi di transistor realizzati con un processo produttivo a 28 nm.

Fig. 2 – L’architettura Tahiti di AMD prevede un sistema articolato per gerarchia della memoria

Il cambiamento di Nvidia
Nvidia ha presentato le sue prime GPU GeForce basate sull’architettura di nuova generazione chiamata Kepler su cui sono e saranno basate anche per i prossimi mesi tutte le GPU dell’azienda, sia in ambito gaming sia professionale (le GPU Kepler sono utilizzate anche per applicazioni di HPC). Questa architettura, come sottolinea Nvidia, è il risultato di 1,8 milioni di ore di lavoro negli ultimi cinque anni e uno dei primi esempi è la GPU GeForce GTX 680 destinata ai PC desktop, mentre la nuova lineup di GPU GeForce 600M è dedicata, invece, agli Ultrabook.

Fig. 3 – Immagine del die di una GPU Kepler di Nvidia

Kepler è basata su tecnologia produttiva a 28 nanometri e succede all’architettura Fermi a 40 nm, che era stata inizialmente introdotta nel marzo del 2010. Le GPU realizzate con il nuovo processo produttivo a 28 nm di TSMC, supportano PCI-E Gen 3 e DX11.1
Uno degli elementi su cui punta Nvidia è relativo alle performance e infatti l’azienda dichiara che la GPU GeForce GTX 680 è più veloce del 300% nelle performance di tessellation con le DirectX 11 e fino al 43% più veloce con i giochi per PC più avanzati, ma con consumi inferiori del 28%. La GTX 680, sempre secondo i dati di Nvidia, assicura prestazioni per watt
doppie rispetto alla GeForce GTX580 basata su architettura Fermi cui Kepler va a sostituirsi.

Le nuove tecnologie utilizzate dalla GPU comprendono un nuovo streaming multiprocessor block, noto come SMX, caratterizzato da performance per watt doppie rispetto ai prodotti di precedente generazione. In pratica si tratta di una nuova concezione dello streaming multiprocessore che consente di applicare una percentuale maggiore delle risorse ai core di elaborazione invece che alla logica di controllo.
La tecnologia Nvidia GPU Boost regola invece dinamicamente le velocità della GPU per ottimizzare le performance di gioco. Per la qualità delle immagini l’architettura della GPU utilizza, inoltre tecnologie come antialiasing FXAA e TXAA e Adaptive Vsync. Sul versante della visualizzazione, è previsto il supporto di più display, fino a quattro complessivamente, di cui tre in 3D con una card singola.
La serie di GPU NvidiaGeForce 600M è invece dedicata ai notebook e mette a disposizione la tecnologia Nvidia Optimus, per prolungare l’autonomia della batteria scegliendo in automatico di attivare la GPU solo quando serve. Non manca il supporto per l’engine Nvidia PhysX che migliora il realismo dei giochi

La grafica di Intel
Anche se non si tratta di chip grafici veri e propri, ma di CPU dotati di una sezione grafica integrata, i nuovi processori Intel possono essere una soluzione molto interessate per numerose applicazioni, vista anche la loro diffusione. Lo scorso mese di aprile Intel ha presentato i nuovi processori Core, quelli di terza generazione chiamati Ivy Bridge, con grafica integrata e realizzati con un processo produttivo a 22 nm e transistor 3-D. I chip Ivy Bridge integrano nella CPU l’engine grafico, mentre altre funzioni sono integrate, invece, nel chipset.

Fig. 4 – Una parte rilevante del die dei nuovi processori Core di Intel è occupata dalla grafica

In generale, la sezione grafica dei processori Core di terza generazione ha posto particolare attenzione al media processing e alle prestazioni. La terza generazione di processori Intel Core, dal punto di vista della grafica, ha introdotto infatti numerose novità rispetto alla generazione precedente. La sezione HD Graphics 2500/4000 dei nuovi processori, rispetto a quella 2000/3000 dei Core di seconda generazione ha conservato l’architettura unificata per gli shader, ma il numero di execution unit massimo è passato a16 dalle 12 precedenti per i modelli di punta. È stata conservata la frequenza di clock di 1350 MHz del core, ma il supporto per le librerie DirectX è passato dalla versione 10.1 alle 11 così come quello per l’Open GL è arrivato alla versione 3.1. Il modello di shader supportato è sempre il 4.1 così come la massima risoluzione di 2560×1600 punti.

Questa architettura, in base ai dati di Intel, ha portato in alcuni casi un aumento di prestazioni doppio rispetto alla grafica implementata nella precedente generazione di processori. La grafica di Ivy Bridge inoltre, supporta in modo nativo tre display.

La grafica embedded
Oltre ai componenti grafici per PC, numeri molto significativi derivano dalla grafica embedded.
Occorre considerare infatti che il mercato dei dispositivi mobile non sta necessariamente sostituendo quelli dei PC, ma questo tipo di dispositivi sta diventando sicuramente più venduto rispetto ai PC.
Per la parte grafica, molti di questi dispositivi mobile utilizzano SoC (System on Chip), sotto forma di application processor che integrano direttamente questa sezione. Ci sono molti produttori di application processor, compresi quelli che si rivolgono a aziende esterne per acquistare sezioni grafiche sotto forma di IP (Intellectual Property) da altre aziende Fra i cinque principali fornitori ci sono ARM, DMP, Imagination Technologies, Takumi, e Vivante.

Fra questi, Imagination ha recentemente annunciato il primo prodotto della sua famiglia PowerVR Serie 6 noto in precedenza con il nome in codice Rogue.
Al secondo posto nelle GPU IP c’è Vivante che propone componenti basati sui processori Armada di Marvell e PXA.
Per AMD, una delle novità più interessanti presentate recentemente è costituita dalle APU R-Series.
In pratica la R-Series combina CPU con il nuovo core chiamato in codice Piledriver, con la sezione grafica Radeon serie 7000 in grado di supportare le librerie DirectX 11.
Al momento del lancio, AMD ha introdotto otto diverse versioni per la piattaforma R-Series, tutte disponibili sia in package PGA che BGA.

Fig. 5 – Diagramma a blocchi delle APU R-Series di AMD

Oltre che per la presenza di due o quattro core per la CPU (non sono previsti modelli a core singolo trattandosi di componenti destinati al segmento mid-range), i modelli si differenziano per le differenti caratteristiche del core Radeon, in modo da offrire scalabilità in termini di prestazioni e capacità grafiche.
Da notare che le APU R-Series supportano anche l’impiego di più sezioni grafiche grazie ala funzione Radeon Dual Graphics che permette di far funzionare contemporaneamente la sezione grafica integrata insieme a una esterna.
Per quanto riguarda le differenze rispetto alla sezione grafica implementata nelle APU G-Series che mettevano a disponibile 80 core grafici, con la R-Serie questo numero va da 128 a 384. Mentre poi le APU G-Serie erano indirizzate verso applicazioni low power e fanless, quelle R-Series sono destinate a soluzioni con grafica high end come per esempio gaming, medical imaging, chioschi multimediali, digital signage.

Francesco Ferrari



Contenuti correlati

  • I nuovi processori per l’edge AI di TI

    A embedded world 2022, Texas Instruments presenterà i nuovi processori Sitara AM62, componenti destinati a espandere l’elaborazione con intelligenza artificiale per nuove applicazioni e caratterizzati da una elevata efficienza dal punto di vista energetico. La struttura a...

  • Processori ad alte prestazioni per sistemi embedded

    Gli sviluppatori di sistemi embedded dipendono in misura sempre maggiore dagli standard e dai moduli già disponibili. Visti i tempi ristretti disponibili per lo sviluppo, i System on Module giocano un ruolo sempre più importante Leggi l’articolo...

  • I nuovi processori OCTEON TX2 di Marvell

    Marvell ha annunciato OCTEON TX2, una famiglia di processori per infrastrutture destinata a essere utilizzata in una vasta gamma di apparecchiature di rete cablate e wireless tra cui switch, router, gateway sicuri, firewall, sistemi di monitoraggio della...

  • I processori Jacinto 7 di TI per l’automotive

    Texas Instruments ha presentato la nuova piattaforma di processori a basso consumo Jacinto 7, destinati ad applicazioni nel settore automotive. Questa piattaforma infatti offre caratteristiche avanzate di deep learning e connettività di rete utilizzabili nei progetti di...

  • Intel introduce i processori Comet Lake per portatili

    Intel ha ampliato la sua gamma di processori Core di decima generazione per portatili con otto componenti della famiglia con il nome in codice Comet Lake. Queste CPU sono state progettate per aumentare la produttività offrendo prestazioni...

  • Marvell estende la partnership con Arm

    Marvell ha annunciato di aver ampliato la partnership strategica con Arm per accelerare la progettazione e lo sviluppo della tecnologia per i processori per server Marvell ThunderX di nuova generazione. Il nuovo accordo prevede il supporto dedicato...

  • I processori Intel di nona generazione per portatili

    La famiglia di processori Core di Intel per PC portatili è recentemente stata ampliata con nuovi modelli progettati per rispondere alle esigenze di content creator e gamer. I nuovi processori Core di nona generazione della serie H...

  • Toshiba: processori per dispositivi indossabili

    Toshiba Electronics Europe ha esteso la sua gamma di processori applicativi ApP Lite per realizzare dispositivi indossabili e soluzioni in ambito Internet of Things (IoT). Il chip TZ1201XBG è l’ultimo nato della serie TZ1000 ed è basato su...

  • Sitara AM57x, TI cerca la ’perfetta combinazione’ di core

    Il concentrato di potenza, ma anche di scalabilità della soluzione, reso disponibile sul mercato da Texas Instruments con l’introduzione a ottobre, nell’offerta Sitara, della famiglia di SoC AM57x – indirizzata a un’ampia rosa di applicazioni industriali ed...

  • I sensor hub crescono

    I sensor hub sono essenzialmente processori low power che sono utilizzati per effettuare, quando occorre, calcoli sui dati ricevuti dai sensori. L’uso di questo tipo di componenti, in base ai dati degli analisti, sta crescendo sensibilmente visto...

Scopri le novità scelte per te x