EO_463

TECH INSIGHT

NEWS/TECHNOLOGIES

le attività di elaborazione delle

reti neurali. I sistemi di visione

automotive basati su teleca-

mera, i droni e i sistemi di si-

curezza implicano fondamen-

talmente due tipi elaborazione

ottimizzata per le immagini. In

primo luogo, il miglioramento

dell’input dalla fotocamera tra-

mite algoritmi di calcolo tradi-

zionali per fotografia/imaging.

In secondo luogo, il rileva-

mento e il riconoscimento de-

gli oggetti tramite algoritmi di

riconoscimento basati su rete

neurale.

Le soluzioni di accelerazione

per reti neurali esistenti sono

elementi hardware collegati al

DSP di imaging in cui il codi-

ce di rete neurale è diviso tra

l’esecuzione di alcuni livelli di

rete e l’alleggerimento dell’ac-

celeratore dai livelli convoluzionali. Questa combinazione è inefficiente e consuma energia inutilmente. Configu-

rato come DSP dedicato e ottimizzato per le reti neurali, Vision C5 accelera non solo le funzioni di convoluzione

ma anche i livelli di elaborazione della rete neurale (convoluzione, connessione, condivisione e normalizza-

zione). Questo alleggerisce il DSP principale di visione/imaging permettendogli di eseguire le applicazioni di

ottimizzazione dell’immagine in modo indipendente, mentre il DSP Vision C5 esegue le attività di inferenza.

Minimizzando il trasferimento di dati tra il DSP per reti neurali e il DSP principale di visione/imaging, Vision C5

mette a disposizione una soluzione a consumo ridotto all’altezza degli acceleratori per reti neurali. Inoltre esso

offre anche un semplice modello di programmazione a singolo processore per reti neurali.

Caratteristiche e prestazioni

Il DSP Vision C5 integra delle prestazioni per reti neurali ai vertici della categoria in un engine autonomo carat-

terizzato da:

• Capacità di calcolo di 1TMAC/s (throughput 4 volte superiore rispetto al DSP Vision P6) in meno di 1 mm

silicio per un elevato throughput di calcolo su kernel di apprendimento profondo.

• 1024 MAC a 8-bit o 512 MAC a 16 bit per garantire elevate prestazioni con risoluzioni sia a 8 bit sia a 16 bit.

• Architettura VLIW SIMD con 128 vie, SIMD a 8 bit o SIMD a 16 bit a 64 vie.

• Configurazione per progetti multi-core che consente di ottenere prestazioni dell’ordine dei multi-teraMAC/s

in uno spazio ridotto.

• iDMA integrato e interfaccia AXI4.

• Utilizzo dello stesso collaudato set di strumenti software dei DSP Vision P5 e P6.

• Rispetto alle GPU concorrenti, DSP Vision C5 è in grado di eseguire il benchmark AlexNet CNN fino a 6 volte

più velocemente e il benchmark Inception V3 CNN fino a 9 volte più velocemente.

DSP Vision C5 supporta kernel con dimensioni, profondità e input variabili. Esso gestisce anche diverse tec-

niche di compressione/decompressione dei coefficienti, e permette di implementare il supporto di nuovi layer

man mano che evolvono. Al contrario, gli acceleratori hardware forniscono una soluzione meno flessibile a

causa della limitata riprogrammabilità. DSP Vision C5 è inoltre corredato dal set di tool di mappatura per reti

neurali Cadence. Questi strumenti permettono di mappare qualsiasi rete neurale addestrata con tool quali Caffe

e TensorFlow per ottenere un codice eseguibile e altamente ottimizzato per il DSP Vision C5, che beneficia di

una serie completa di funzioni di libreria per reti neurali ottimizzate.

- ELETTRONICA OGGI 463 - GIUGNO/LUGLIO 2017

Cadence è un DSP sotto forma di IP per reti neurali destinata alle applicazioni automotive e di sorve-

glianza, ai droni e ai dispositivi mobili