EMB 96

EMBEDDED 96 • MAGGIO • 2025 18 IN TEMPO REALE | COMPUTER VISION ne artificiale ha visto la formalizzazione su larga scala di problemi difficili risolvibili. La divisione degli argomenti in gruppi ben formati con una nomenclatura adeguata ha aiutato i ricercatori di tutto il mondo a identificare i problemi e a lavorarci su in modo efficiente. Le attività di visione artificiale più popolari che troviamo regolarmente nel gergo dell’intelligenza artificiale inclu- dono la classificazione, rilevazione e segmentazione. La classificazione delle immagini è uno degli argomenti più studiati. Essendo il compito della visione artificiale più popolare intrapreso sia dai principianti che dagli esperti, la classi- ficazione delle immagini come dichiarazione del proble- ma è abbastanza semplice. Dato un gruppo di immagini, il compito è classificarle in un insieme di classi predefinite utilizzando esclusiva- mente un insieme di immagini campione già classificate. A differenza di argomenti complessi come il rilevamento di oggetti e la segmentazione delle immagini, che devo- no localizzare (o posizionare) le caratteristiche rilevate, la classificazione delle immagini si occupa dell’elabora- zione dell’intera immagine nel suo complesso e dell’as- segnazione di un’etichetta specifica ad essa. Il rilevamento degli oggetti, come suggerisce il nome, si riferisce al rilevamento e alla localizzazione degli oggetti utilizzando i riquadri di delimitazione. Il rilevamento degli oggetti cerca dettagli specifici della classe in un’immagine o in un video e li identifica ogni volta che appaiono. Queste classi possono essere auto- mobili, animali, esseri umani o qualsiasi cosa su cui è stato addestrato il modello di rilevamento. In precedenza, i metodi di rilevamento degli oggetti uti- lizzavano le funzionalità SIFT, HOG e Haar per rilevare le caratteristiche di un’immagine e classificarle in base ai classici approcci di apprendimento automatico. Questo processo, oltre ad essere dispendioso in termini di tempo e in gran parte impreciso, presenta gravi limi- tazioni sul numero di oggetti che possono essere rilevati. Pertanto, i modelli di deep learning che utilizzano milio- ni di parametri per superare queste limitazioni vengono comunemente utilizzati per questo compito. Il rileva- mento degli oggetti è spesso accompagnato dal ricono- scimento degli oggetti, noto anche come classificazione degli oggetti. La segmentazione dell’immagine è la suddivisione di un’immagine in sottoparti o sotto-oggetti per dimostrare che la macchina di visione può distinguere un oggetto dallo sfondo e/o un altro oggetto nella stessa immagine. Un segmento di un’immagine rappresenta una partico- lare classe di oggetti che la rete neurale ha identificato in un’immagine, rappresentata da una maschera di pixel che può essere utilizzata per estrarla. Questo dominio della visione artificiale è stato ampia- mente studiato sia con l’uso di algoritmi tradizionali di elaborazione delle immagini come la segmentazione ba- sata su clustering, sia con l’uso di architetture di deep learning moderne. Il riconoscimento facciale Il riconoscimento facciale è una sotto-sezione del rileva- mento di oggetti in cui l’oggetto principale rilevato è il volto umano. Sebbene sia simile al rilevamento di oggetti come attivi- tà, in cui le caratteristiche vengono rilevate e localizzate, il riconoscimento facciale esegue non solo il rilevamen- to, ma anche il riconoscimento del volto rilevato. I sistemi di riconoscimento facciale cercano caratteristi- che e punti di riferimento comuni come occhi, labbra o naso e classificano un volto utilizzando queste caratteri- stiche e il posizionamento di questi punti di riferimen- to. I metodi tradizionali basati sull’elaborazione delle immagini per il riconoscimento facciale sono facilmente accessibili tramite la libreria OpenCV. Rilevamento dei bordi degli oggetti Il rilevamento dei bordi è il compito di rilevare i confini degli oggetti. Viene eseguito mediante algoritmi con l’aiuto di metodi matematici che aiutano a rilevare cambiamenti bruschi o discontinuità nella luminosità dell’immagine. Spes- so utilizzato come fase di pre-elaborazione dei dati per molte attività, il rilevamento dei bordi viene eseguito Fig. 2 - Ricostruzione di un’immagine con image inpainting ( https://gigazine.net/gsc_news/en/20180425-nvidia-image-inpainting/ )