L’Intelligenza Artificiale (IA), cioè la capacità delle macchine di emulare comportamenti umani, ha compiuto di recente notevoli progressi. Questo si deve principalmente alla disponibilità di grandi volumi di dati e all’applicazione ad essi di sofisticati metodi di apprendimento automatico, resa a sua volta possibile dall’aumento vertiginoso delle capacità di calcolo anche per sistemi a basso costo. Incubata per decenni nei laboratori di ricerca e nelle università, l’IA è divenuta mainstream industriale, non solo ad opera di aziende di nicchia e startup, ma anche per la spinta di colossi come Google, Apple, Microsoft, Ibm. In gioco c’è un salto di qualità nei sistemi di business, dai search engine semantici agli assistenti virtuali, dai riconoscitori di immagini e situazioni al trasporto automatizzato di persone e merci. Anche se non mancano eccellenze europee (comprese quelle italiane), parliamo per lo più di una rivoluzione post-industriale guidata dagli Stati Uniti, dove pure divampa il dibattito se, grazie ai suoi progressi, l’IA possa soppiantare il genere umano in molti lavori e attività. O soppiantare il genere umano tout-court. Tuttavia, proprio dalla Association of Computing Machinery (ACM), la più grande associazione internazionale di informatici con sede in New York, giunge oggi un monito: molte delle sofisticate competenze che oggi vorremmo emulare con le macchine richiedono ragionamenti di senso comune (commonsense reasoning) sui quali anche i migliori algoritmi di IA applicati con la massima efficienza sulle più vaste basi di dati ancora annaspano (E. Davis, G. Marcus, Commonsense Reasoning and Commonsense Knowledge in Artificial Intelligence, Communications of the ACM, Sett. 2015). E allora? Come stanno le cose? Su quali basi poggia il nuovo mainstream industriale?
Ragionamenti di senso comune sono ad esempio quelli che ci permettono di capire a chi si riferisce un pronome o chi è il soggetto di un verbo. Nella frase ‘hanno proibito il corteo perché temono la violenza’ il soggetto implicito del verbo ‘temere’ sono le autorità. Ma se sostituiamo il ‘temere’ con ‘minacciare’ (‘hanno proibito il corteo perché minacciano la violenza’) il soggetto del nuovo verbo allude chiaramente ai manifestanti. Osservate che la forma della frase è esattamente la stessa: per risolvere i puzzle che il linguaggio ci presenta non basta la superficie sintattica, ma bisogna applicare intuitivamente quadri di riferimento (frame) concettuali. Di quanti e di quali frame abbiamo bisogno per comprendere fino in fondo il linguaggio? Difficile dirlo, anche perché ne nascono di continuo. La comprensione delle immagini (computer vision) presenta problemi analoghi. Anche qui, la superficie delle immagini presenta spesso forme che dobbiamo interpretare con l’immaginazione, basandoci sulla nostra conoscenza di sfondo (background knowledge). Quella forma che emerge dietro al tavolo nella foto che osserviamo è per noi ovviamente una sedia, ma la stessa forma in un altra foto ci sembrerebbe tutt’altro, o nulla. Anche qui, per dare la corretta interpretazione ai dati che abbiamo davanti, dobbiamo far ricorso a ciò che conosciamo delle situazioni tipiche nel mondo, come il fatto che attorno ai tavoli vi siano solitamente alcune sedie. Quante situazioni esistono nel mondo? Chi ne fornisce l’elenco?
Di commonsense reasoning e delle sue difficoltà si parla fin dalla nascita dell’IA, verso la metà del secolo scorso. La novità, secondo l’articolo della ACM, è che oggi, nonostante i progressi, non ci sono novità. Il fatto è che i punti di forza delle tecniche attuali, l’apprendimento automatico, i ‘big data’, sono senz’altro notevoli, ma non sembrano in grado di accostarsi al problema del senso comune. Ad esempio, nel campo della traduzione automatica, mediante l’analisi della distribuzione delle parole in grandi corpora testuali, si ottiene una certa accuratezza, ma non si possono evitare errori marchiani. Prendete il verbo inglese ‘to work’, che significa sia ‘lavorare’, sia ‘funzionare’. Se lo accostate a un mestiere (‘the electrician is working’) otterrete correttamente il primo significato (‘l’elettricista lavora’), ma se inserite un inciso tra soggetto e verbo, e questo menziona un artefatto (‘the electrician who came to fix the telephone is working’) otterrete un risultato indesiderato (‘l’elettricista che è venuto a riparare il telefono funziona’). Questo succede perché, ignaro dei concetti, l’algoritmo cerca di cavarsela ragionando sugli accostamenti delle parole. Anche tralasciando la non lieve questione filosofica se sia possibile giungere sulla sponda dei concetti navigando in un oceano di dati, l’idea di surrogare i frame del senso comune applicando algoritmi ai dati sembra di fatto ancora impraticabile.
Ricapitolando: oggi siamo in grado di costruire macchine intelligenti con le quali si possono emulare alcune funzioni cognitive, e un nuovo tipo di industria sta nascendo attorno ad esse. Ma queste , per funzionare in modo accurato, devono riuscire ad applicare strutture concettuali complesse in grado di interpretare i dati. Non siamo sicuri che ci sia un modo automatico per dotare le macchine di queste strutture, anzi c’è il dubbio che questo sia impossibile, e che i metodi statistici che lavorano sui dati potranno fornirci al più alcune approssimazioni. L’avanzata dell’IA nel territorio del lavoro cognitivo è già in atto e proseguirà. Tuttavia, non sarà un’avanzata napoleonica, fulminea e inarrestabile. Il terreno dell’intelligenza umana sarà conquistato palmo a palmo, caso per caso, applicazione per applicazione, con successi e fallimenti, come in tutte le umane vicende. E tra queste vicende vi saranno auspicabilmente anche quelle che consentiranno al genere umano di adattarsi socialmente al cambiamento in atto.
(Nòva, 15 Ottobre 2015)