EO527
DIGITAL SOC AI Semiconductor ha avuto il vantaggio di esaminare i prin- cipi base e studiare le modalità di integrazione dell’AI in una MCU. La società ha tenuto innumerevoli incontri con gli OEM per comprendere i fattori che influiscono sulla loro scelta di utilizzare una MCU come SoC (System-on- Chip) AI in dispositivi endpoint alimentati a batteria. In sintesi, i quattro fattori fondamentali sono i seguenti: 1. L’accelerazione dell’elaborazione neurale deve essere strettamente accoppiata alla CPU Nella fase iniziale, per soddisfare la richiesta di poter di- sporre di funzionalità AI i produttori di MCU hanno svi- luppato kit di sviluppo software (SDK) AI per consentire l’esecuzione di algoritmi AI/ML (Machine Learning) sulla medesima CPU Arm Cortex-M, che svolgeva anche fun- zioni convenzionali di controllo. Tuttavia, una MCU per applicazioni ML su endpoint richiede un’unità di elabo- razione neurale (NPU), un tipo di processore ottimizzato per le operazioni multiply-accumulate (MAC) che sono il “pane quotidiano” delle applicazioni basate sulle reti neurali. Una CPU embedded incontrerà molte difficoltà nella gestione di carichi di lavoro ML, perché le inferenze prodotte dalla rete ML, notoriamente caratterizzata da un elevato parallelismo, devono essere risolte in modo seriale, il che richiede molto tempo e parecchia energia. La Figura 1 mostra il confronto, a livello di prestazioni AI, tra una CPU e una CPU abbinata a una NPU. La fami- glia di MCU Ensemble di Alif Semiconductor si avvale del core CPU Cortex-M55 abbinato a un co-processore NPU Ethos-U55. Le metriche mostrano un’inferenza ML sin- gola per quattro diversi modelli ML addestrati in esecu- zione su una MCU Ensemble: i modelli rappresentano le operazioni richieste per l’individuazione di parole chia- ve, il rilevamento di oggetti, la classificazione delle im- magini e il riconoscimento vocale. Il core Cortex-M55 utilizzato sugli MCU di Alif è tra le ar- chitetture CPU embedded più efficienti al momento di- sponibili e garantisce buoni risultati che sono già 5 volte migliori per i carichi di lavoro ML rispetto a quelli delle CPU Cortex-M delle generazioni precedenti. Nonostante un core Cortex-M55 rappresenti una valida scelta, l’ul- teriore aumento delle prestazioni è evidenziato dai dati nelle colonne gialle, pari a circa due ordini di grandezza (se non addirittura superiore) quando si usa la NPU+CPU rispetto alla sola CPU. Se si considera che il core Cor- tex-M55 già vanta prestazioni circa cinque volte migliori rispetto alle precedenti architetture Cortex-M ampia- mente utilizzate, risulta ragionevole quintuplicare que- sti guadagni. Per il riconoscimento vocale, si parla di una velocità 800 volte maggiore e un consumo energetico 400 volte minore per ciascuna inferenza rispetto alle CPU Cortex-M di tipo legacy. Un altro fattore importante dell’accoppiamento stretto tra NPU e CPU è rappresentato dall’ambiente di sviluppo software. Esistono numerose opzioni per implementare core di NPU proprietarie o di terze parti nei SoC. Gli OEM, dal canto loro, non hanno intenzione di effettuare il “re- tooling” della loro intera infrastruttura di sviluppo per lavorare con una nuova architettura soltanto per i carichi di lavoro AI/ML, in quanto ciò richiede l’adozione di nuo- 1) KWS: Dal documento ARMMicroNets. Quantized int8, addestrato con il set di dati “Comandi Vocali Google”. Ingombro del modello: 154KB MRAM, 28KB SRAM 2) Rilevamento degli oggetti: Risoluzione di scala di grigi e a colori 192x192. Quantized int8, addestrato con il set di dati “WIDER FACE”. Ingombro del modello: 431KB MRAM, 433KB SRAM 3) Classificazione delle immagini: Risoluzione 224x224 24 bit a colori. Quantized int8, addestrato sul set di dati “ImageNet”. Ingombro del modello: 3.552 KB MRAM, 1,47 KB SRAM 4) ASR: Tiny Wav2letter Pruned inserito nell’app demo ML ARM, che esegue il caso d’uso ASR. MRAM=2346,06 KB (ampiamente ottimizzato Vela da 3903,43 KB), SRAM=1197,20 KB Fig. 1 - I test comparativi evidenziano le prestazioni superiori e la maggiore efficienza di una NPU rispetto a una CPU quando si eseguono comuni funzioni ML ELETTRONICA OGGI 527 - GIUGNO/LUGLIO 2025 43
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzg4NjYz