Il ruolo dei codec vocali in un mondo sempre più ad alta definizione

Pubblicato il 14 maggio 2019

Anche se fino a non molto fa un’interfaccia di tipo vocale era qualcosa che sembrava appartenere al futuro, ora si è tramutata in una realtà concreta. Quando si utilizza il telefono per parlare con un fornitore di servizi, spesso l’interfaccia è in primo luogo tecnologica e solo in un secondo tempo umana. Ancora più importante, i servizi di emergenza e i sistemi di sicurezza ora utilizzano la voce come interfaccia principale su una varietà di dispositivi tra cui linee telefoniche standard, sistemi interfonici privati e radio DMR (Digital Mobile Radio).

L’utilizzo della voce come mezzo di comunicazione sotto qualsiasi forma presuppone che la qualità del segnale venga mantenuta lungo l’intero percorso del segnale. Questo aspetto assume un’importanza ancora maggiore nel caso in cui chi riceve il segnale vocale non è una persona ma, anche nel caso in cui all’altro capo del ricevitore vi sia una persona, per la società attuale la bassa definizione appartiene oramai al passato.

Resta comunque un dato di fatto che la maggior parte degli investimenti effettuati nel recente passato in attività di ricerca sono stati indirizzati sui codec per dispositivi più o meno portatili con una particolare focalizzazione sugli aspetti multimediali, in particolar modo la musica. A questo punto è utile tener presente che esiste una significativa differenza tra un segnale vocale e un segnale musicale. Quest’ultimo è solitamente caratterizzato da un’ampiezza di banda molto più estesa e da una forma d’onda differente rispetto a quella di un segnale vocale: in pratica si tratta di due segnali completamente differenti. Per questo motivo non può certamente sorprendere il fatto che un codec progettato per applicazioni musicali non sia ottimizzato per fornire un segnale vocale di elevato livello qualitativo.

Dal punto di vista tecnologico, l’elemento fondamentale nella catena del segnale è rappresentato dal codec, o codificatore-decodificatore. Si tratta in sintesi del dispositivo che fa da tramite tra il dominio analogico e quello digitale. Esso acquisisce il segnale prodotto da un microfono e lo elabora nel dominio digitale prima di trasformare nuovamente i dati digitali in un segnale analogico in grado di pilotare un altoparlante. Dopo il microfono stesso, il codec è spesso il primo e l’ultimo collegamento nella catena del segnale per cui il livello qualitativo che è in grado di offrire influenza la fruizione da parte dell’utente.

Negli ultimi anni, la quasi totale assenza di investimenti nel settore dei codec vocali ha di fatto costretto i progettisti a utilizzare codec di tipo general purpose a elevata ampiezza di banda più orientati ad applicazioni musicali. Codec di questo tipo non sono stati progettati per l’uso in applicazioni telefoniche e quindi non sono in grado di supportare i microfoni di ultima generazione basati sulla tecnologia MEMS.

In un contesto di questo tipo, un codec vocale ad alto grado di integrazione e a bassissimo consumo predisposto per supportare l’alta risoluzione può fare sicuramente la differenza. I codec vocali di nuova generazione sono in grado di supportare direttamente i microfoni MEMS più recenti. Le versioni digitali solitamente codificano i dati utilizzando la modulazione PDM (Pulse Density Modulation) o l’interfaccia I2S (Inter-IC Sound). Sebbene il microfono definisca inizialmente la qualità del segnale,  è il codec che elabora il flusso dei dati e contribuisce a miglioralo, utilizzando funzionalità di elaborazione del segnale come ad esempio filtraggio vocale, controllo del guadagno e del livello automatico e filtraggio del rumore (noise gating). Alcuni modelli possono anche effettuare la soppressione del rumore utilizzando due microfoni su percorsi di segnali paralleli. Grazie a un amplificatore integrato il codec è anche in grado di pilotare direttamente un altoparlante. Scegliendo il dispositivo idoneo, l’intera catena del segnale potrebbe essere gestita da un unico dispositivo, con conseguente riduzione sia della complessità del progetto sia del costo complessivo della BoM.

Un codec vocale di nuova generazione

CMX655D di CML Microcircuits è un esempio di un codec vocale di nuova generazione espressamente progettato per supportare le moderne applicazioni basate sulla voce. Esso può essere utilizzato sia nella telefonia tradizionale (da 300 Hz a 3,4 kHz) sia nelle applicazioni vocali ad alta definizione (da 50 Hz a 7 kHz) e supporta ampiezze di banda audio di 21 kHz. L’aspetto più interessante da prendere in considerazione è la presenza di un amplificatore in classe D, in grado di fornire una potenza massima di 1 W per pilotare direttamente un altoparlante nei progetti che non prevedono la presenza di filtri. Ciò comporta numerosi benefici a diversi livelli.

Questo nuovo dispositivo di CML Microcircuits consuma solo 300 µA in modalità di ascolto (listening mode) e può quindi essere utilizzato anche per la realizzazione di dispositivi indossabili (alimentati a batteria). L’elaborazione del segnale audio, che prevede il controllo automatico del guadagno (AGC) e del livello (ALC) e il filtraggio del rumore, rende questo nuovo codec ideale per l’uso in un gran numero di applicazioni emergenti, compresi i sistemi di sicurezza che devono restare sempre attivi (always on), come quelli utilizzati per rilevare il suono prodotto da vetri infranti. Poiché il codec CMX665S supporta l’alta definizione, può essere utilizzato nei dispositivi a controllo vocale di ultima generazione, come pure nelle applicazioni di telefonia cablata e mobile. Esso è disponibile in versioni sia analogica sia digitale in modo da poter supportare sensori MEMS con uscita analogica o digitale. In effetti, sarebbe anche possibile utilizzarlo come amplificatore in classe D, grazie alla ridotta corrente di funzionamento e l’elevata potenza di uscita, nel progetto di un altoparlante privo di filtri.

Senza dubbio il mercato delle interfacce di tipo vocale sta vivendo una fase di crescita. Le interfacce basate sulla voce naturale e i sistemi vocali ad alta definizione, di tipo sia cablato sia wireless, sono sempre più usati in una molteplicità di applicazioni, come ad esempio IoT, abitazioni ed edifici “intelligenti”, sistemi interfonici pubblici e privati e veicoli autonomi, solo per citarne alcuni. La voce in alta definizione è destinata a modificare profondamente la fruizione da parte dell’utente e, più in generale, consentirà un’integrazione ancora maggiore della tecnologia nella vita di tutti i giorni.

Richard Walton Applications Engineer (CML Microcircuits)



Contenuti correlati

Scopri le novità scelte per te x