L’ascesa dei dati al monte della conoscenza

Pietranera2 Siamo sommersi da un diluvio dati: se ne producono migliaia di petabyte all'anno, e la situazione peggiora (o migliora, dipende dai punti di vista) di giorno in giorno. Per gli automi che ci navigano, i dati sono una massa amorfa di zeri e uni, ma per noi umani questi zeri e uni diventano informazione, e tavolta perfino conoscenza. Trasformare il piombo dei dati in oro di conoscenza con gli automi stessi, traendone cospicui guadagni, è l'obiettivo di un'alchimia moderna che si coltiva nei laboratori delle maggiori Corporation (anche le più caute), nel lavoro quotidiano di un numero crescente di aziende specializzate, nell'ardimento di romantiche start-up. La pietra filosofale degli antichi alchimisti donava l'onniscienza; quella di oggi, strofinata sui dati, dovrebbe far salire zeri e uni al rango di sapere. Come può funzionare quest'ascesa epistemica?

Prendiamo ad esempio una base di dati. Questa è un insieme di relazioni logiche tra valori, come ad esempio IMPIEGATO('Bristow','Ufficio_Acquisti'), CAPO('Fudge','Ufficio_Acquisti'), dove i nomi delle relazioni, i tipi dei valori che possono associare, i vincoli che devono essere soddisfatti tra questi valori corrispondono a ciò che si chiama schema.  La base di dati però non sa nulla di cosa significhi il suo schema, non sa cosa significhi per il povero Bristow avere Fudge come capo. Saranno gli utenti e le applicazioni che accedono al database, semmai, a  preoccuparsene. In una base di conoscenza le cose stanno diversamente. Al posto dello schema, c'è un'ontologia: non un insieme di regole associative e combinatorie tra dati bruti, ma una teoria su quello che c'è nel Mondo, qualsiasi cosa il Mondo sia, anche eventualmente quello narrativo del tenero impiegato della Chester-Perry. Al posto delle n-uple di dati ci sono individui (es. Bristow), proprietà (essere impiegato) e associazioni (lavorare nell'ufficio acquisti). Cosa cambia? Tutto: la base di conoscenza è impegnata a mantenere una relazione semantica con la realtà, il dato non è una sequenza di bit più o meno vincolata ma ancora da interpretare, è il rappresentante nell'automa di un oggetto che c'è nel Mondo. Grazie alla sussistenza nel sistema di questa relazione, l'automa potrà ragionare, fare deduzioni, rispondere alle domande sul Mondo in modo non banale.

Come può avvenire questo miracolo? La cattiva notizia è che non c'è nessun miracolo. Ci dev'essere qualcuno che si prende la briga di fare una teoria, mettere in piedi un dominio di individui, assegnare  proprietà, associazioni e tutto il resto, dovendo utilizzare, in molti casi, le oscure basi di dati esistenti. Ma, si obietterà, anche le basi di dati vanno progettate e popolate. Certo, ma l'impegno che il progettista di basi di dati assume è, per quanto non banale, molto più lieve, perché saranno le applicazioni e gli utenti a percorrere lo spazio dell'interpretazione, a ragionare sui dati con un occhio alla realtà, ognuno eventualmente a modo suo. Eh, si obietterà ancora, ma una buona base di dati dovrebbe essere realizzata a partire da un modello concettuale che in genere sottointende un impegno ontologico e semantico. Sì, questo è quel che succede nei casi migliori, cioè quasi mai. In una base di conoscenza invece questa buona e rara pratica deve realizzarsi.

La pietra filosofale dell'ascesa epistemica è dunque il duro lavoro dell'ingegno umano. Bisogna rimboccarsi le maniche, possibilmente scegliendo obiettivi commisurati alle risorse disponibili, e valutando bene la sostenibilità del progetto.

  • Rocco |

    Complimenti, davvero un bel post.
    Proprio ieri mi trovavo a scrivere che le ontologie informatiche fungono da interpretante per l’elaboratore ponendosi tra il segno e l’oggetto descritto.

  Post Precedente
Post Successivo