visione artificiale
Sistema che utilizza circuiti analogici neuromorfi nell’emulazione della trasduzione ed elaborazione del segnale che avviene nel sistema visivo, e in partic. nella retina. La v. a., o visione computerizzata, si pone l’obiettivo di costruire macchine capaci di ‘vedere’, che siano cioè in grado di elaborare l’informazione raccolta da sensori visivi (per es., telecamere) al fine di riconoscere e classificare forme, oggetti e scene bidimensionali e tridimensionali. Sono stati sviluppati sistemi che imparano a riconoscere oggetti in scene complesse, e algoritmi che imparano a sintetizzare nuove sequenze di immagini a partire da un piccolo numero di immagini reali.
Le retine di silicio, e altri chip per la visione neuromorfa, sono costruiti come modelli dei sistemi visivi biologici e si basano su efficienti algoritmi per l’elaborazione preliminare dei segnali sensoriali. L’organo sensoriale periferico, ossia l’occhio, è il naturale punto di inizio per lo sviluppo di un sistema neuromorfo analogico, dato che la luce che cade sulla retina è un segnale analogico continuo. La struttura della retina ha un’organizzazione relativamente semplice, essendo costituita da griglie di elementi di elaborazione simili, che interagiscono solo con i primi vicini. Questo tipo di circuito ha una struttura bidimensionale ripetitiva, ‘cristallina’, che può essere riprodotta sulla superficie di un singolo chip, e l’output dell’elaborazione può essere letto da un campionamento a scansione. Lo strato plessiforme esterno della retina (OPL, Outer Plexiform Layer) dei vertebrati ha suscitato l’interesse degli ingegneri neuromorfi perché è in grado di svolgere operazioni di analisi d’immagine altamente ottimizzate usando solamente tre strati di neuroni: i fotorecettori, le cellule orizzontali e le cellule bipolari. A partire dalla fine degli anni Ottanta del secolo scorso sono state sviluppate numerose retine di silicio su singoli chip che possiedono le importanti proprietà dell’OPL. Questi circuiti consistono di solito in una griglia di pixel (il più piccolo elemento in cui è scomposta l’immagine originale), che realizzano una codifica del contrasto dell’immagine con adattamento; i pixel controllano i nodi di una griglia resistiva esagonale, la quale fornisce un filtraggio spazio-temporale.
Invece di costruire una macchina cablata o un programma per risolvere un compito visivo specifico, gli studi di visione computerizzata stanno cercando di sviluppare sistemi che possano essere addestrati con esempi per un certo numero di compiti visivi. L’obiettivo è lo sviluppo di macchine che imparino a svolgere compiti come l’analisi visiva e il riconoscimento visivo a partire da un insieme di esempi di addestramento. Ciò riflette una tendenza globale: costruire sistemi intelligenti che non abbiano bisogno di essere completamente e faticosamente programmati per compiti specifici. In altre parole, i calcolatori devono essere molto più simili al nostro cervello, ossia devono imparare a vedere piuttosto che essere programmati per vedere. Così, l’apprendimento è anche la frontiera dove la v. a. si incontra con la scienza della visione biologica. I sistemi visivi biologici sono più efficienti e flessibili di quelli per la v. a., principalmente perché si adattano continuamente e imparano dall’esperienza. Dal punto di vista delle applicazioni, la possibilità di costruire sistemi per la visione che si possano adattare a diversi compiti può avere un enorme impatto in numerosi settori, come l’analisi automatica, l’elaborazione delle immagini, l’editing video, la realtà virtuale, le banche dati multimediali, la grafica computerizzata e le interfacce uomo-macchina. Diversi compiti visivi e grafici si possono formulare in termini dell’addestramento di una ‘scatola che impara’ con insiemi appropriati di esempi, cioè di coppie input-output (➔ reti neurali), e la teoria su cui si fonda il metodo fa uso di tecniche di approssimazione di funzioni, architetture di reti neurali e metodi statistici. Sono stati sviluppati sistemi che imparano a riconoscere oggetti, in partic. facce, sistemi che imparano a trovare oggetti specifici in scene complesse, programmi che imparano a disegnare (per es., personaggi dei cartoni animati) a partire dai disegni prodotti da un disegnatore, algoritmi che imparano a sintetizzare nuove sequenze di immagini da un piccolo numero di immagini reali.