Il web dei nomi

«Usate identificatori come nomi per le cose, fate in modo che la gente possa usarli per accedere alle risorse del web, attaccateci informazione utile, e riferitevi a ciò che è correlato mediante altri identificatori». «Non usiamo più gli identificatori per i documenti, ma per le cose di cui i documenti parlano: persone, luoghi, prodotti, eventi. Tutti i concetti possono avere un nome che inizia con "http"»

Se la gente desse retta a queste parole di Berners-Lee, il web col tempo potrebbe trasformarsi in una gigantesca base di dati fra loro correlati, dove ciascun identificatore (URI) sarebbe singolarmente in grado di rappresentare qualcosa, e tutti assieme sarebbero capaci di dare un senso compiuto e unitario a quello che fluisce sul web. Si tratterebbe di dati liberamente disponibili (Open Data) in formato standard, messi a disposizione da istituzioni ed aziende, ma anche dalle singole persone, secondo il motto: «fate il vostro pezzo di lavoro, gli altri faranno il loro».

Sulla strada verso questo ideale di onniscienza telematica "dal basso" sono però in agguato i mille inganni del nominare linguistico, di cui parlavo nel post precedente.  Assegnare un nome ad un ente è qualcosa che ciascuno fa per sé, dato il contesto, le intenzioni e le credenze del momento, al meglio delle proprie conoscenze e capacità. Il rischio che si rinnovi nei Linked Data la babele onomastica del linguaggio è assai concreto.

Per questo hanno importanza le nomenclature standard (di fatto) come quella della Wikipedia, e per questo sono in corso progetti come OKKAM che hanno lo scopo di istituire anagrafi delle entità che vivono in rete (anagrafi potenzialmente immense, se davvero andiamo verso una “Internet of Things” ).

Questi nomi denotano “particolari” come ad esempio: io, il mio cellulare, le coordinate geografiche in cui mi trovo. Cosa possiamo dire invece degli “universali”, cioè i predicati come persona, telefono, piazza? Essi forniscono ai particolari i loro connotati, e dovrebbero essere non solo nominati, ma anche interpretati con una certa regolarità da tutti gli 'agenti' che si agitano nel web. Cioè, a meno che non siano vuote stringhe, gli universali dovrebbero poter essere applicati ai particolari (es. persona(io)) senza creare irriducibili dissensi o grosse contraddizioni.

L’idea di Berners-Lee sembra essere quella di accompagnare nel web processi di natura linguistica, confidando in un naturale e spontaneo convergere del nominare verso un 'senso comune', qualsiasi cosa questo sia, così come, per qualche ragione ancora poco chiara, accade, grosso modo, con le parole. Ora, su questa convergenza si può ben essere scettici, ma non mi sembra che qualcuno abbia un'idea migliore.

  • Enrico Franconi |

    Zuckerberg fa i miliardi all’interno del suo mondo chiuso, quindi non gli interessa che ci sia una referenza universale; anzi, con la copertura che ha potrà pretendere che tutto il resto del mondo faccia riferimento ai suoi identificatori — peraltro questo già succede con l’API di “facebook login”…
    Larry invece è impegnato seriamente a studiare i modelli di comunicazione per indurre le relazioni fra lessemi: cosa è se non questo la sofisticata path analysis che Google fa sui nostri comportamenti per indurre mappings, strutture, identificatori che vengono, per esempio, usati nell’organizzare le risposte?

  • Guido |

    @Aldo è vero, TBL non ne parla direttamente, ma un certo ‘positivismo’ traspare, non trovi? Nominate, nominate, qualcosa prima o poi accadrà.. Nel semantic web neats e scruffy falliscono entrambi, qui ci vuole una ‘terza via’ 🙂

  • Aldo Gangemi |

    TBL non parla mai di convergenza “universale” delle entità e dei concetti. Non gliene importa neanche molto dei riferimenti univoci e della negoziazione del significato fra tutti e per qualsiasi motivo.
    Come nella vita quotidiana della maggior parte di noi (a parte quella di alcuni filosofi e logici) 🙂
    il significato e la co-referenza possono essere visti come fenomeni emergenti, in cui talvolta un servizio come quello fornito da dizionari, pagine gialle, enciclopedie, richieste di chiarimento, etc., e i loro correlati sul web, diventa utile per determinati scopi.
    Nel Web dei Dati è possibile immaginare alcuni di questi scopi e servizi in modo più semplice e generalizzato.
    Il dibattito fra i duri e puri dell’integrazione semantica e i “freaks” della URI-based data integration è dovuto all’assunzione di diversi paradigmi, non alla frizione fra approcci neat vs. sloppy 🙂

  • Guido |

    @Enrico, secondo me il problema è che TBL crede che non ci sia bisogno di convincere nessuno, perché per avere una semantica basta una sintassi, buona volontà e un po’ di tempo.
    Hai ragione a dire che dobbiamo studiare i modelli della comunicazione, la linguistica novecentesca l’ha per molti versi trascurata. Ma non me li vedo tipi come Larry Page o Mark Zuckerberg aspettare che arrivi a conclusione una discussione che va avanti da duemila anni per fare il loro prossimo miliardo.

  • Enrico Franconi |

    Questa proposta di sir TBL a me pare un delirio di onnipotenza.
    Convinciamo tutti a parlare la stessa lingua, ad avere gli stessi modelli culturali, a riferirci alle stesse opinioni: solo così i lessemi possono avere una identità universale.
    Lo hanno capito per esempio le biblioteche nazionali europee, che in quasi quindici anni di lavoro hanno allineato neanche un migliaio di soggetti nei soggettari nazionali europei, rappresentanti l’essenza delle peculiarità culturali e linguistiche dei diversi paesi.
    Una idea migliore: smettiamo di cercare scorciatoie, rimbocchiamoci le maniche, e continuano a studiare e a capire i modelli della comunicazione.
    L’information integration non è così naîve come avere una tabella universale con le identità risolte 🙁

  Post Precedente
Post Successivo