EMB_90

EMBEDDED 90 • NOVEMBRE • 2023 40 Bibliografia [1] Yui, J. (2020), Blending DSP and ML features into a low-power general-purpose processor – how far can we go? [white paper] . *blending-dsp-and-ml-featu- res-into-a-low-power-general-purpose-processor. pdf (windows.net) [2]Grocutt, T.(2019), Making Helium: Why not just add Neon? (1/4)[blog], Making Helium: Why Not Just Add Neon? - Research Articles - Research Collaboration and Enablement - Arm Community [3] Yui, J. (2020), Introduction to Armv8.1-M ar- chitecture [white paper], introduction-to-ar- mv8-1-m-architecture.pdf (windows.net) [4] Grocutt, T.(2019), Making Helium: Sudoku, regi- sters and rabbits (2/4) [blog], Making Helium: Su- doku, registers and rabbits - Research Articles - Research Collaboration and Enablement - Arm Community [5] Botman, F.(2019), Making Helium: Going around in circles (3/4)[blog], Making Helium: Going around in circles - Research Articles - Research Collaboration and Enablement - Arm Community [6] Grocutt, T.(2019), Making Helium: Bringing Amdahl’s law to heel (4/4) [blog], Making Helium: Bringing Amdahl’s law to heel - Research Articles - Research Collaboration and Enablement - Arm Community [7] Menasveta, T.(2022), Introducing Cortex-M85: pushing the boundaries of performance and securi- ty for microcontrollers [blog], Cortex-M85: Highest Performing Cortex-M Processor ever - Internet of Things (IoT) blog - Arm Community blogs - Arm Community and Branch Target Identification), miglioramenti dei meccanismi di sicurezza Arm TrustZone, PXN (Privi- leged eXecute Never) per MPU e UDE (Unprivileged Debug Extensions). I risultati dei benchmark In considerazione di tutte le funzionalità presenti all’interno del core CM85, prove empiriche come i ben- chmark standard del settore o benchmark su diversi kernel possono consolidare la sua posizione come core per MCU capace di garantire le migliori prestazioni. Per esempio, dai valori CoreMark e DMIP riportati nella tabella 1, si evidenzia un aumento scalare del- le prestazioni grazie alle caratteristiche della nuova microarchitettura, tra cui il miglioramento del siste- ma di memorizzazione e della “branch prediction” e dual-issue (la capacità del processore di accorpare determinate coppie di istruzioni per aumentare il throughput) ottimizzato. Con l’integrazione della tecnologia Helium, come mo- strato nella figura 2, il core CM85 è in grado di su- perare il core CM7 in termini di prestazioni AI/ML di un fattore pari a 4 e il CM55 del 20%, grazie alle microarchitetture aggiuntive. Sicuramente la tecnologia Helium garantisce un si- gnificativo miglioramento rispetto ai dispositivi che non la prevedono. Nel dettaglio, MVE può migliorare ulteriormente le prestazioni del singolo kernel ML rispetto ai dispositivi senza MVE, come mostrato in figura 3a: il risultato dell’elaborazione di uno strato completamente connesso risulta nettamente migliore se supportato da Helium MVE. Per quanto riguarda le prestazioni che riguardano l’elaborazione digitale dei segnali (DSP) dei dispositivi MVE rispetto ai di- spositivi non MVE su kernel standard, come ad esem- pio la trasformata di Fourier e la risposta all’impulso finita, la figura 3b mostra un incremento del 57% e 64% rispettivamente per l’unità a virgola mobile: l’in- cremento sarebbe più significativo per calcoli interi, grazie al supporto nativo di MVE per una gamma più ampia di dati. L’aggiunta di centinaia di nuovi set di istruzioni all’interno di CM85, comprese quelle che migliorano la capacità dell’elaborazione delle immagini da parte dei core, comporta significativi miglioramenti: come riportato in figura 4, il dispositivo compatibile con tecnologia Helium assicura prestazioni 4 volte supe- riori rispetto al core CM7 prendendo come riferimen- to la libreria Arm 2D. In sintesi, il core CM85 con tecnologia Helium può contribuire ad aumentare in modo significativo le pre- stazioni per applicazioni AI/ML e per l’elaborazione DSP, attraverso caratteristiche quali miglioramenti della “branch prediction”, accesso alla memoria più veloce, parallelismi, aggiunta di nuove istruzioni per DSP, supporto di nuovi tipi di dato e supporto nativo per calcoli complessi. Il core CM85 assicura elevate prestazioni scalari e risulta nettamente migliore ri- spetto agli altri core Cortex-M, rendendolo la scelta ideale per attività di elaborazione più complesse. HARDWARE | MCUs

RkJQdWJsaXNoZXIy Mzg4NjYz