EO_488

DIGITAL VOICE PROCESSING 45 - ELETTRONICA OGGI 488 - SETTEMBRE 2020 e una libreria per generare file vocali e audio di alta qualità per unità comuni come valute, pesi e anche di- mensioni. Le registrazioni già definite possono anche essere esportate in Excel e scaricate in formato CSV per un’ulteriore elaborazione. Ottimizzate lo spazio di archiviazione senza perdere la qualità della voce Il tool di generazione di messaggi vocali ESPER2 utilizza il formato codec EOV (Epson Own Voice) di Epson per ridurre le dimensioni del file per una tra- smissione o un’archiviazione efficace. Rispetto alla compressione standard ADPCM (Adaptive Differential Pulse Code Modulation), il formato EOV è in grado di ridurre le dimensioni del file di un quarto fino a due terzi. Ciò nonostante, la trasmissione vocale mantiene ancora un’alta qualità a 16 kbps, 24 kbps, 32 kbps o 40 kbps. Il file .eov (memoria dati vocale e audio) è costituito da una tabella di ricerca e dai dati audio. Se a una frase con un determinato significato viene assegna- to lo stesso ID in diverse lingue, è molto semplice ri- produrre questa frase in diverse lingue richiamando sempre lo stesso ID della tabella di ricerca per le di- verse lingue. Ciò offre agli sviluppatori una visione d’insieme, soprattutto se è necessario pronunciare molte frasi differenti in diverse lingue. È possibile ridurre ulteriormente lo spazio di me- moria inserendo una barra convenzionale (/) per le frasi elementari o ripetitive, ad esempio quando si specificano le temperature. Il tool di generazione di messaggi vocali ESPER2 li comprende, e dispone e collega automaticamente tutte le formulazioni di testo, ad esempio: ID numero 1: “La temperatura/è di 38 gradi Celsius” ID numero 2: “La temperatura è di 39 gradi Celsius” ID numero 3: “La temperatura è di 40 gradi Celsius” I dati vocali generati in questo esempio sono: “La temperatura/è di 38 gradi Celsius”, “è di 39 gradi Cel- sius”, “è di 40 gradi Celsius” Soluzione disponibile sotto forma di microcontrollore o di IC con funzione vocale In base allo scenario di sviluppo, Epson offre una so- luzione integrata e una soluzione discreta per archi- viare e riprodurre i dati vocali generati con ESPER2. Il microcontrollore ARM Cortex-M0 a 32 bit S1C31D50 costituisce una soluzione integrata. In quest’ulti- ma, il processore hardware vocale e audio integrato nell’hardware offre la possibilità di riprodurre il suo- no contemporaneamente su due canali, attraverso il microcontrollore S1C31D50 (con una frequenza di campionamento di 15.625 kHz ciascuno). La riprodu- zione avviene tramite semplici funzioni di controllo: ESPER2 assegna un numero (ID) a tutti i dati vocali e audio generati. Questo numero (ID) viene scritto in un registro del processore hardware, che in seguito ri- produce i file audio corrispondenti. Ciò significa che non è necessario generare codice per collegare i file audio. All’avvio della riproduzione audio, non occor- rono le risorse della CPU, e quindi essa è disponibile per altre attività senza subire limitazioni, o viene sem- plicemente posta in modalità di sospensione durante la riproduzione audio. Questa variante è ad oggi l’unica soluzione disponi- bile sul mercato in grado di riprodurre testo e audio contemporaneamente. La caratteristica unica è che, se ad esempio viene riprodotta una musica di sotto- fondo in aggiunta al testo, i rispettivi volumi possono essere controllati indipendentemente l’uno dall’altro. Ad esempio, la musica di sottofondo può essere si- lenziata all’avvio della riproduzione vocale, semplifi- candone la comprensione. La modifica della cadenza (alta/bassa) e della velocità della parlata è realizzata su hardware. È possibile regolare la velocità della parlata in incre- menti del 5%, dal 75% al 125%. La soluzione a discreti è costituita dall’IC di ripro- duzione vocale S1V30xxx in combinazione con un microcontrollore host esterno. Si tratta quindi di un supplemento HMI ideale per i progetti esistenti, in cui un microcontrollore esistente non può o non deve es- sere sostituito per vari motivi. In linea di principio, è possibile utilizzare qualsiasi microcontrollore con un’interfaccia seriale integrata per controllare l’IC di riproduzione vocale. Attualmente, il primo dispositi- vo S1V3G340 non è ancora in grado di riprodurre la voce combinata a partire da due canali. Tuttavia, tutti i nuovi IC di riproduzione vocale di Epson saranno dotati di questa funzione e i primi dispositivi saranno commercializzati in volumi al più tardi all’inizio del 2021. Per gli sviluppatori interessati, è già disponibile la scheda di valutazione S5U1C31D50T1200 per testare la riproduzione vocale. Alla consegna della scheda, è già installato un software di test completo in diverse lingue. Qui la lingua desiderata viene selezionata at- traverso gli interruttori DIP. Per generare le vostre fra- si, tutto ciò che vi serve è l’installazione e la licenza del software gratuito ESPER2. Dopo aver completato l’installazione, è possibile de- finire le proprie frasi e modificarle come si desidera. Se necessario, è possibile caricarle in seguito sulla scheda di valutazione. Gli esperti di Rutronik sono a disposizione per forni- re consigli sulla selezione dei componenti e sulla re- alizzazione dei progetti, oltre che per rispondere alle domande su altri componenti adatti all’applicazione, come amplificatori operazionali, memorie flash NOR o altoparlanti.