Il Google delle cose (e dei giudizi)

Google-things"Le parole che usate nella ricerca non sono solo parole: si riferiscono alle cose!" annuncia con grande eccitazione Jack Menzel, un ragazzo che – si legge – è Product Management Director presso Google. Una dichiarazione forse un po' bizzarra, ma sicuramente da includere tra quelle che annunciano una nuova fase del nostro rapporto con le tecnologie dell'informazione. Dal diluvio di dati bruti che si riversa nel Web, annuncia Mountain View, attingeremo la realtà delle cose, non più soltanto i loro pallidi simulacri testuali.

PuntoInformatico, un webzine molto attento, fa notare come Google eviti il ricorso alle diciture tipiche del Web Semantico, che è il modo in cui Berners-Lee immaginò, una decina di anni or sono, un Web in cui in si possa parlare di cose vere, non solo rimandare vagamente da un ipertesto ad un altro. Ma è chiaro che è di questo che stiamo parlando: individui, fatti, relazioni che stracciano l'involucro del linguaggio e si offrono nella loro nuda realtà allo sguardo delle persone. 500 milioni di cose e 3,5 miliardi di relazioni, precisano da Google, numeri che gli osservatori più accorti accostano a quelli degli utenti di Facebook, per suggerire che la competizione tra i due giganti sembra aver preso la seguente forma: conoscenza versus socialità.

Estrarre senso dalle parole è cosa che chiunque fa normalmente e con grande naturalezza, e tuttavia è molto difficile riprodurre questo processo nelle macchine, perché, a quanto si evince da più di due millenni di discussioni filosofiche, non è molto chiaro il modo in cui ci riusciamo. C'è inoltre il fondato sospetto che il processo non sia del tutto determistico (cioè sia anche un po' casuale) e qualche pessimista ha pure sostenuto che sia largamente imperscrutabile. Ma tant'è: nella misura in cui ci riusciamo noi, ci riusciranno (in qualche altra misura) anche le macchine.

Come? Sicuramente (Google lo conferma) descrivendo cose, fatti, situazioni in un immane Grafo della Conoscenza (Knowledge Graph, come lo chiamano a Mountain View). Il modello dunque è quello della conoscenza enciclopedica, secondo la classica definizione di Umberto Eco. E il pensiero corre a Wikipedia. L'esplorazione del giardino della conoscenza iniziò per Google con l'acquisizione di Freebase (ne avevo parlato qui). Un progetto che, al tempo (si era nel 2010), aveva raccolto dagli utenti circa 12 milioni di 'proposizioni' e le distribuiva liberamente, sul modello dell'enciclopedia libera. Oggi le cose sono cambiate, e di aprire il Knowledge Graph non mi sembra che si parli (ma spero di essere smentito).

Che il Grafo della Conoscenza debba essere aperto alla pubblica critica, a mille visioni e revisioni, è cosa la cui importanza ciascuno può giudicare. Non si tratta più di un indice di parole chiave, come quello su cui Google ha costruito la sua sintattica fortuna. Si tratta, in larga parte, di giudizi belli e buoni, la cui presenza (o assenza) può avere un profondo significato politico. Non è roba da tener chiusa nel walled garden di un'azienda. Per questo bisogna dar forza agli Open Linked Data, anche se l'impresa è tutt'altro che banale. 

 

  • Giovanni Semeraro |

    Ciao,
    c’è un articolo molto recente in cui si sostiene che è possibile scaricare il dizionario come risorsa statica serializzata da qui:
    http://www-nlp.stanford.edu/pubs/crosswikis-data.tar.bz2/
    L’articolo è: “A Cross-Lingual Dictionary for English Wikipedia Concepts” by
    Valentin I. Spitkovsky, Angel X. Chang (Google US)
    Trovato assolutamente per caso – serendipità? 😉 (uno dei miei dottorandi difende la sua tesi su ESA – Explicit Semantic Analysis – e Recommender Systems il prossimo 8 Giugno).

  • guido |

    la cosa che mi preoccupa è che questa conoscenza è nelle mani di ragazzini che dicono: “wow! le parole si riferiscono alle cose!” – insomma fanno qualcosa di orwelliano ma non sanno neanche cosa è

  • Alessandro Oltramari |

    @Guido: Knowledge Graph senza Open Linked Data ha un sapore orwelliano. Sono affascinato dal potere che Google potrebbe acquisire se KG rimanesse “chiuso”. Mi vengono in mente gli scenari cyberpunk di Gibson e Sterling, con le multi-nazionali (li’ erano giapponesi, ma il senso non cambia) a governare il mondo, combattute solo da sparuti gruppi di hacker.
    @Alfredo: non vorrei apparire polemico…ma so what?KG non e’ fatto da un grafo assoluto, ma e’ costituito dai grafi di conoscenza degli utenti che fanno ricerche, che esprimono il loro “+1” su alcuni contenuti, che chattano su GoogleChat, etc. Puoi vederlo come la sintesi dialettica del modo in cui tutti cercano e valutano un contenuto d’interesse.
    Best, Alessandro

  • Alfredo Bregni |

    Ho scritto un post su Facebook, nel gruppo ERMENEUTICA E FILOSOFIA, http://www.facebook.com/groups/195584467153392/ , intitolato “RELATIVISMO ASSOLUTO”, dove ipotizzo / sostengo che la conoscenza NON sia un grafo “banale” (tipo quelli memorizzabili in un computer), ma:
    a) Un grafo “membranoso-frattale” (GMF), con ogni concetto NON racchiuso da un confine netto e impermeabile, ma da una membrana che apre connessioni e scambi con l’esterno, e con ogni connessione fra concetti non nella forma di archi di grafi, ma di qualcosa di più simile a un frattale;
    b) Ciascuno di noi non solo ha un proprio dominio di conoscenza / esperienza diverso da ciascun altro, ma poi un proprio GMF del tutto personale (dove l’apprendimento opera come strumento per farlo evolvere), donde il titolo del post.
    In conseguenza, da un lato plaudo al progetto di google (sarebbe un salto in avanti epocale, …se funziona), dall’altro tenderei a evidenziarne i limiti intrinseci.
    Consiglierei google di partire dall’ornitorinco. Quando l’hanno scoperto, non sapevano dove classificarlo… Con il grafo, lo si collega dappertutto (mammifero, oviparo, con il becco, …), il che – da un certo punto di vista – è forse come non collegarlo con nulla.

  Post Precedente
Post Successivo