EMB97

EMBEDDED 97 • SETTEMBRE • 2025 27 INTELLIGENZA ARTIFICIALE | HARDWARE Inizialmente viene generato un controllo intelligente del movimento per compiti di manipolazione, principalmen- te in laboratori in condizioni semplificate e per compiti robotici specializzati. Attraverso l’apprendimento per rinforzo, i robot sono in grado di apprendere traiettorie attraverso tentativi ed errori basati sull’esperienza. L’obiettivo del progetto è di dare una risposta alla do- manda se sia possibile sviluppare più attività di mani- polazione dei robot senza programmare esplicitamente come eseguire le azioni desiderate. Inoltre, sono necessarie informazioni per progettare un sistema del genere, quali sono i sottosistemi di un con- trollo del movimento intelligente, come possono essere combinati e quali vantaggi avrà un robot utilizzando il controllo di movimento intelligente. Il confronto dello sviluppo delle funzioni di controllo del movimento utilizzando l’approccio proposto con gli approcci di sviluppo tradizionali introduce un approc- cio che contiene l’applicazione di metodi di intelligenza artificiale nello sviluppo del controllo del movimento dei robot. Di conseguenza, lo sviluppo diventa più flessibi- le e scalabile, il che è necessario per la progettazione di robot che devono operare in un ambiente altamente di- namico. Apprendimento per rinforzo L’intelligenza artificiale è la scienza e l’ingegneria per re- alizzare macchine intelligenti, composta da diversi sot- tocampi, come il Machine Learning (ML). Il ML è un campo dell’informatica che fornisce ai si- stemi la capacità di apprendere senza essere esplicita- mente programmati. Si compone di tre campi principa- li: apprendimento non supervisionato, apprendimento supervisionato e apprendimento per rinforzo. Nell’ap- prendimento per rinforzo, un agente IA apprende il comportamento attraverso interazioni per tentativi ed errori con l’ambiente dinamico. Un processo decisionale di Markov è un metodo mate- matico per modellare il processo decisionale, invece di descrivere la soluzione di un problema. Nel metodo matematico di Markov, un agente intera- gisce con il suo ambiente e cerca di ottenere una ri- compensa. Scopre diversi stati eseguendo determinate azioni. L’obiettivo è trovare la migliore soluzione che corrisponda a ciascuno stato e azione per ottenere la ricompensa più grande; questa ricompensa totale può essere definita come la somma delle ricompense. Tre attuali metodi di successo come il Deep-Q-Learning combinano le reti neurali profonde con l’apprendimen- to per rinforzo. Simulazione del progetto Gli approcci di apprendimento per rinforzo sono stati storicamente utilizzati per i videogiochi, ma recente- mente sono diventati significativamente più rilevanti per le simulazioni. Esistono diversi strumenti di simu- lazione che possono essere utilizzati per progettare un ambiente operativo.