La scorsa settimana ero alla conferenza LangTech 2008 dedicata alle tecnologie del linguaggio, che quest’anno ha ripreso il suo corso a Roma.
Una sessione era dedicata al Knowledge Management, con due interessanti keynote dei cari amici Enrico Motta e Chris Welty.
Enrico Motta ha parlato del Semantic Web. Ha detto che il Semantic Web, attorno al quale aleggia un certo scetticismo, in realtà esiste già: sul Web ci sono 12 milioni di pagine annotate con RDF, e più di 10.000 ontologie. Com’è possibile ottenere da tutto questo il Semantic Web? Sarebbe relativamente semplice se potessimo integrare le ontologie. Al Knowledge Media Institute di Enrico questo si sperimenta considerando i concetti delle ontologie alla stregua di ‘sensi linguistici’ e associandoli in base alla loro sinonimia. In (circa) due casi su tre il gioco riesce. Cosa fare negli altri casi, quelli in cui l’ambiguità del linguaggio guasta la festa agli ontologi? E’ un problema dei linguisti, dice Enrico, che devono migliorare la ‘word sense disambiguation’. Eh sì, ma i linguisti in cosa confidano per migliorare la disambiguazione? Proprio nelle ontologie. Come se ne esce?
Chris Welty di IBM Research non ha risposto alla domanda, ma ne ha illustrato la difficoltà. Le ontologie sono teorie logiche che servono nella misura in cui sono precise. In logica, il fatto che Chris visita Roma si dice precisamente: Visit(‘Chris’,’Rome’). Nel linguaggio, invece, si può trovare di tutto. Quanti modi anche impliciti e contorti ci sono per dire una cosa? Praticamente infiniti. Ci avvertiva Tullio De Mauro nella Guida all’uso delle parole:
Diciamo: Il letto è in disordine. Ma sono stanco e a vederlo mi fa venire sonno lo stesso. [] Se diciamo []: Un’aura ipnotica promana comunque dal talamo verso di me nell’atto solo della percezione ottica catalizzata dall’astenia ci capiscono solo i laureati (2,8%), e nemmeno tutti. Se la questione è giocare a non capirsi, possiamo ancora dire frasi come: L’astenicità del mio privato fa sí che lo sciabugliamento talamico sia auraticamente ipnotico o, per dir meglio, ipnoticamente auratico nella mia introiezione psichica del percetto ottico.
Per motivi di questo tipo, ci informa Chris, chi fa sistemi di Machine Translation o Question Answering tende ancora oggi a tenersi alla larga dalle ontologie.