"Le parole che usate nella ricerca non sono solo parole: si riferiscono alle cose!" annuncia con grande eccitazione Jack Menzel, un ragazzo che – si legge – è Product Management Director presso Google. Una dichiarazione forse un po' bizzarra, ma sicuramente da includere tra quelle che annunciano una nuova fase del nostro rapporto con le tecnologie dell'informazione. Dal diluvio di dati bruti che si riversa nel Web, annuncia Mountain View, attingeremo la realtà delle cose, non più soltanto i loro pallidi simulacri testuali.
PuntoInformatico, un webzine molto attento, fa notare come Google eviti il ricorso alle diciture tipiche del Web Semantico, che è il modo in cui Berners-Lee immaginò, una decina di anni or sono, un Web in cui in si possa parlare di cose vere, non solo rimandare vagamente da un ipertesto ad un altro. Ma è chiaro che è di questo che stiamo parlando: individui, fatti, relazioni che stracciano l'involucro del linguaggio e si offrono nella loro nuda realtà allo sguardo delle persone. 500 milioni di cose e 3,5 miliardi di relazioni, precisano da Google, numeri che gli osservatori più accorti accostano a quelli degli utenti di Facebook, per suggerire che la competizione tra i due giganti sembra aver preso la seguente forma: conoscenza versus socialità.
Estrarre senso dalle parole è cosa che chiunque fa normalmente e con grande naturalezza, e tuttavia è molto difficile riprodurre questo processo nelle macchine, perché, a quanto si evince da più di due millenni di discussioni filosofiche, non è molto chiaro il modo in cui ci riusciamo. C'è inoltre il fondato sospetto che il processo non sia del tutto determistico (cioè sia anche un po' casuale) e qualche pessimista ha pure sostenuto che sia largamente imperscrutabile. Ma tant'è: nella misura in cui ci riusciamo noi, ci riusciranno (in qualche altra misura) anche le macchine.
Come? Sicuramente (Google lo conferma) descrivendo cose, fatti, situazioni in un immane Grafo della Conoscenza (Knowledge Graph, come lo chiamano a Mountain View). Il modello dunque è quello della conoscenza enciclopedica, secondo la classica definizione di Umberto Eco. E il pensiero corre a Wikipedia. L'esplorazione del giardino della conoscenza iniziò per Google con l'acquisizione di Freebase (ne avevo parlato qui). Un progetto che, al tempo (si era nel 2010), aveva raccolto dagli utenti circa 12 milioni di 'proposizioni' e le distribuiva liberamente, sul modello dell'enciclopedia libera. Oggi le cose sono cambiate, e di aprire il Knowledge Graph non mi sembra che si parli (ma spero di essere smentito).
Che il Grafo della Conoscenza debba essere aperto alla pubblica critica, a mille visioni e revisioni, è cosa la cui importanza ciascuno può giudicare. Non si tratta più di un indice di parole chiave, come quello su cui Google ha costruito la sua sintattica fortuna. Si tratta, in larga parte, di giudizi belli e buoni, la cui presenza (o assenza) può avere un profondo significato politico. Non è roba da tener chiusa nel walled garden di un'azienda. Per questo bisogna dar forza agli Open Linked Data, anche se l'impresa è tutt'altro che banale.