Ramine Roane, Xilinx
Mentre la pandemia continua ad attirare la nostra attenzione, l’intelligenza artificiale sta cambiando il modo in cui i carichi di lavoro sono gestiti, dal cloud verso il bordo rete e i terminali
La pandemia continua a dominare i nostri pensieri sulle condizioni attuali e sulle prospettive per l’immediato futuro. Le restrizioni imposte dalle autorità in tutto il mondo, sebbene volte a proteggere i cittadini e gestire il carico sui servizi sanitari, sono state davvero severe e molte persone cercano disperatamente di riconquistare le libertà di un tempo. Alla fine ovviamente, supereremo la situazione in cui ci troviamo ora, ma il mondo cambierà.
I cambiamenti nel nostro stile di vita e nelle nostre economie sono stati enormi e diffusi. Le aziende tecnologiche, per la maggior parte, hanno riportato prestazioni stellari, mentre quelle che si basano sulla presenza fisica – come i negozi tradizionali, l’industria dell’ospitalità, i viaggi e i trasporti – hanno avuto difficoltà. Anche se è vero che le vendite al dettaglio convenzionali subiscono la concorrenza dell’online già da qualche tempo, la pandemia ha solo accelerato questa tendenza. Aiutati dalle restrizioni che impongono il distanziamento sociale, le vendite al dettaglio online, la pubblicità online, l’intrattenimento online, le consegne di generi alimentari, la prenotazione di immobili per le vacanze, le soluzioni di tipo infrastructure and software as a service sono state in grado di consolidare la propria posizione ed è improbabile che le quote di mercato acquisite vengano perse dopo la pandemia. I FAANG (Facebook, Amazon, Apple, Netflix, Google) ne sono esempi evidenti.
I titoli tecnologici, in generale, sono stati solidi sotto ogni aspetto, per via dei nuovi e considerevoli investimenti effettuati nelle infrastrutture per il lavoro da casa e nei servizi di streaming. Forse Apple è stata coraggiosa a lanciare l’iPhone 12 al culmine della pandemia. Tuttavia, la risposta dei consumatori ha mostrato il valore percepito dello smartphone come strumento per lavorare, connettersi con gli amici, accedere ai servizi e monitorare il benessere.
Naturalmente, quando le restrizioni saranno finalmente abolite, possiamo aspettarci che molte persone torneranno alle attività e ai luoghi che frequentavano in precedenza. Netflix e Zynga hanno già osservato un rallentamento dell’impennata della crescita di abbonati registrata durante la pandemia, sebbene altri fattori abbiano influenzato il rallentamento; la concorrenza di altri servizi di streaming in particolare è una di queste. Dopo che gli effetti del «ritorno alla libertà» si saranno stabilizzati, vedremo che il mondo sarà cambiato radicalmente. Le persone hanno scoperto nuovi modi di vivere e lavorare che continueranno ad affermarsi in futuro.
Un’accelerazione esponenziale
Rispetto alle precedenti pandemie, il mondo è più preparato che mai, tecnologicamente, a gestire le minacce verso la nostra salute, i nostri posti di lavoro e le nostre economie. La tecnologia sta progredendo in modo esponenziale da quando è apparso il primo Homo Sapiens, 300.000 anni fa. Più recentemente, nel nostro settore, le leggi esponenziali (la legge di miniaturizzazione di Dennard, la legge di Moore) hanno fissato nella pratica le aspettative del mercato sulle prestazioni delle generazioni successive dei computer, diventando un obiettivo da soddisfare.
Nel mondo di oggi, in cui la legge di miniaturizzazione di Dennard appartiene al passato e la legge di Moore si è molto ridimensionata, il miglioramento della tecnologia su silicio non è più sufficiente per mantenere i ritmi esponenziali di crescita. Oggi, gli ingegneri di tutte le discipline, dall’architettura di sistema, al software, all’hardware, stanno compiendo un passo avanti per garantire che le prestazioni dei carichi di lavoro continuino a migliorare di pari passo.
Se guardiamo allo sviluppo del software, il cambiamento epocale si sta allontanando dagli approcci tradizionali per sfruttare le tecniche di apprendimento approfondito (Deep Learning). Allo stesso tempo, la progettazione hardware ha sfruttato architetture multicore, e in particolare le GPU, per gestire i carichi di lavoro per l’IA e più recentemente ha offerto nuove architetture specifiche per un dominio (DSA) come le unità di elaborazione tensoriale (TPU) e altri processori di apprendimento approfondito, allo scopo di aumentare ulteriormente le prestazioni. Tuttavia, stiamo arrivando al punto in cui anche queste architetture specifiche per un dominio stanno raggiungendo il loro limite di scalabilità. La velocità dell’innovazione nell’intelligenza artificiale ha superato i cicli di progettazione su silicio. Tecniche creative di progettazione dei chip che si spingono oltre il miglioramento delle tecnologie su silicio sono evidenti anche in soluzioni come i die impilati, i chiplet e i System-InPackage (SiP), che hanno permesso di comprimere i cicli di progettazione di pari passo con l’aumento delle funzionalità dei chip.
Inoltre, Xilinx ha sfruttato le proprie competenze sulla tecnologia FPGA per progettare il primo SoC adattivo, con la nostra famiglia Versal. I SoC adattivi consentono agli innovatori di accelerare intere applicazioni creando architetture specifiche per un dominio o per un’applicazione, superando il collo di bottiglia associato al trasferimento dei dati tra le unità di calcolo e la memoria esterna. La nostra architettura eterogenea include un sottosistema processore per carichi di lavoro seriali, una matrice FPGA per carichi di lavoro a bassa latenza e in tempo reale e le nostre nuove unità di intelligenza artificiale per carichi di lavoro IA/ML ad alta velocità o di elaborazione dei segnali. Queste unità di calcolo sono strettamente accoppiate alla memoria interna ed esterna e a un NOC (network-on-chip), per offrire prestazioni per watt svariate volte superiori rispetto ai processori tradizionali e agli acceleratori discreti.
Inferenza ai terminali
L’adozione dell’intelligenza artificiale sta rivoluzionando ovunque gli approcci all’informatica, dal cloud, al bordo rete, ai terminali. L’inferenza a basso consumo consente di gestire localmente carichi di lavoro come l’intelligenza artificiale o l’apprendimento approfondito o l’elaborazione tradizionale dei segnali, risparmiando banda di rete e ottenendo latenze più basse. Abbiamo eseguito la nostra unità Versal AI Engine in sistemi wireless 5G, radar, satelliti ecc. Nei sistemi di trasmissione per la copertura di eventi sportivi, i nostri SoC adattivi hanno spostato le funzioni di IA/ML e post-elaborazione video dall’elaborazione a bordo rete e su cloud verso le telecamere. Ciò ha consentito di ottenere un’elaborazione dal vivo impossibile in precedenza.
Le nostre piattaforme flessibili ci hanno permesso non solo di spostare carichi di lavoro sensibili alla latenza verso il bordo rete e il terminale, ma anche di accelerare le attività ad alta intensità dati ed altamente energivore come le ricerche, le raccomandazioni, le analisi su database e big data, la genomica, la transcodifica video, ecc. Xilinx vanta inoltre una presenza significativa nelle soluzioni infrastructure as a service con AWS e Microsoft Azure.
Con funzionalità SoC adattive per gestire grandi quantità di dati e l’inferenza per l’IA ad alte prestazioni e a basso consumo e latenza nel cloud, a bordo rete e nei terminali, ritengo che stiamo gettando le basi per consentire agli innovatori di trasformare e migliorare il nostro stile di vita. I nostri ruoli, come lavoratori e come persone, sono destinati a cambiare drasticamente e, mentre alcuni ruoli saranno assunti dalle macchine, dobbiamo essere preparati ad abbracciare le nuove opportunità che queste entusiasmanti tecnologie porteranno con sé.
Mentre iniziamo a gestire questa pandemia, aiutati dalle tecnologie che ci aiutano ad essere produttivi e ad interagire efficacemente tra di noi anche a distanza, il ritmo del progresso tecnologico continua con la stessa inesorabile legge esponenziale.