Una nuova architettura di rete neurale ottica utilizza la modulazione del fronte d’onda per gestire con precisione il movimento degli impulsi ultracorti attraverso fibre multimodali, consentendo il calcolo ottico non lineare.
Gli attuali sistemi di intelligenza artificiale si basano su miliardi di parametri regolabili per raggiungere obiettivi complessi. Tuttavia, la grande quantità di questi parametri comporta spese significative. L’addestramento e l’esecuzione di modelli così grandi richiedono una quantità significativa di memoria e potenza di elaborazione e sono disponibili solo nei data center di grandi dimensioni, che consumano energia in modo simile alla domanda di elettricità delle città di medie dimensioni. In risposta, i ricercatori stanno attualmente rivalutando l’infrastruttura IT e Apprendimento automatico Algoritmi per garantire un progresso continuo e sostenibile nell’intelligenza artificiale ai ritmi attuali.
L'implementazione ottica delle architetture di rete neurale è un approccio promettente grazie all'implementazione a basso consumo delle comunicazioni tra moduli. Nuova ricerca riportata in Fotonica avanzata Combina la propagazione della luce all'interno di una fibra multimodale con un numero limitato di parametri programmabili digitalmente e raggiunge le stesse prestazioni nelle attività di classificazione delle immagini con sistemi completamente digitali con oltre 100 volte più parametri programmabili.
Questa struttura informatica semplifica i requisiti di memoria e riduce la necessità di operazioni digitali ad alta intensità energetica, raggiungendo allo stesso tempo lo stesso livello di… Precisione In una varietà di attività di apprendimento automatico.
Una svolta nei calcoli ottici non lineari
Il nucleo di questo lavoro pionieristico, guidato dal professor Dimitri Psaltis e Christoph Moser dell’EPFL (École Polytechnique Fédérale de Lausanne), risiede nel controllo preciso degli impulsi ultracorti all’interno delle fibre multimodali utilizzando una tecnica nota come modulazione del fronte d’onda. Ciò consente di eseguire calcoli ottici non lineari utilizzando microwatt di potenza ottica media, compiendo un passo cruciale nella realizzazione del potenziale delle reti neurali ottiche.
“In questo studio, abbiamo scoperto che con un piccolo insieme di parametri, possiamo selezionare un insieme specifico di pesi del modello dalla banca dei pesi fornita dall'ottica e utilizzarli nel compito computazionale target. In questo modo, abbiamo utilizzato i fenomeni naturali come dispositivi senza preoccuparsi di produrre e utilizzare un dispositivo specializzato per questo scopo”, afferma Ilker Oguz, co-autore principale di questo lavoro.
Questo risultato rappresenta un passo importante verso la risoluzione delle sfide poste dalla crescente domanda di modelli di machine learning più ampi. Sfruttando la potenza computazionale della propagazione della luce attraverso fibre multimodali, i ricercatori hanno aperto la strada a soluzioni hardware IA a basso consumo e ad alta efficienza.
Come mostrato nell’esperimento di ottica non lineare riportato, questo quadro computazionale può anche essere utilizzato per programmare in modo efficiente vari fenomeni non lineari ad alta dimensione per eseguire attività di apprendimento automatico e può offrire una soluzione trasformativa alla natura avida delle risorse del modello di intelligenza artificiale esistente.
“Fanatico di zombi da una vita. Praticante di web hardcore. Pensatore. Esperto di musica. Studioso di cultura pop impenitente.”