Giovanni,

sempre non volendo tediare la audience - ma facendolo :-) - abbozzo una breve risposta.

«Any RDF system can consume RDF from any other RDF system without any
type of coordination.»

questo è vero, ma lo è esattamente per il fatto che la struttura di rappresentazione (la tripla) è semanticamente neutra.

ora, sulla scala del web, la scelta di Lee-Lassila anni '90 fu ben comprensibile: si voleva preservare la natura totalmente decentralizzata della rete

per questo, il W3C evitò di promulgare standard ontologici, e la comunità dei logici che fecero OWL non diede ascolto agli ontologi che avrebbero voluto almeno incardinare nozioni di base come quella di 'parte', o la distinzione tra oggetto ed evento. Troppo dogmatico, troppo metafisico, si diceva, le ontologie nasceranno 'dal basso'.

Morale della favola: oggi ci troviamo con lo Schema di Google, con foaf, con dublin core e poco più

Per rappresentare in modo inter-organizzativo, ad esempio, che un Paziente deve avere uno StatoClinico ad una certa data oggi dobbiamo dunque mettere mano a una nostra concettualizzazione. Ma se ciascuna organizzazione fa la sua, la semantica del sistema di cooperazione risiederà non nelle ontologie, ma nella loro reciproca mappatura. Dove si trova questa mappatura? Chi la mantiene? Chi è in grado di fare una query sul sistema integrato? Sappiamo rispondere nel caso centralizzato (es. Google Knowledge Graph), molto più complesso sarebbe rispondere nel caso decentralizzato.

Per questo è importante che si adotti *la stessa* ontologia: perché in tal caso le sorgenti di dati si impegnano direttamente, 'ex ante', su convenzioni di significato condivise e sottoscritte.

Tutto ciò non è necessariamente dogmatico: si può ben immaginare un processo partecipativo. Ma alla peggio, andrebbe bene anche un dogmatismo illuminato - con Draghi ci avviamo su questa strada? :-)

On Mon, 8 Feb 2021 at 15:00, Giovanni Biscuolo <giovanni@biscuolo.net> wrote:

Caro Guido,

Guido Vetere <vetere.guido@gmail.com> writes:

>> Io ho detto "database RDF" e "Linked Data" apposta: ogni regione, ente,
>> laboratorio, individuo si faccia il suo database RDF un po' come gli
>> pare, definisca e _pubblichi_ l'ontologia e l'ente centrale responsabile
>> della sintesi (tipo l'ISS), con una meta-ontologia sviluppata
>> appositamente, sarebbe in grado di "linkare" e interrogare i dati a
>> piacere grazie alle proprietà delle basi dati RDF e dei tool connessi
>> come SPARQL.

> non vorrei addentrarmi in una discussione tecnica ma credo sia utile e
> importante cogliere un aspetto:

Sono d'accordo, evitiamo di entrare nel tecnico e cerchiamo di cogliere
il concetto rivoluzionario che RDF e Linked Data introduce nell'universo
di discorso della gestione semantica delle informazioni.

> è necessario che il 'commitment ontologico' sia condiviso sia dal
> produttore sia dal consumatore, altrimenti, di fatto, il commitment diventa
> quello del consumatore (es. il sistema di integrazione)

Hai ragione nell'evidenziare che un impegno a fornire determinati dati
da parte del produttore ci deve essere, però il produttore deve poter
essere libero di scegliere lo schema che più gli aggrada, se lo vuole.

«Any RDF system can consume RDF from any other RDF system without any
type of coordination.» [1]

Ciascuno, poi, si prende la responsabilità di quello che *afferma*
quando definisce la semantica (nell'ontologia) e il contenuto dei dati
che fornisce o che aggrega, magari attraverso un buon meccanismo di
gestione della provenienza del dato (con adeguate provenance
assertions).

> questo è più o meno quello che è successo tra Regione Lombardia e Iss, dove
> il consumatore (Iss) ha inteso i dati a modo suo, ed è quello che in genere
> accade nel modello 'data lake'

Non conoscevo il termine "data lake", ma se ti riferisci a
https://en.wikipedia.org/wiki/Data_lake mi pare di poter dire con
assoluta certezza che è l'opposto di quello che "immaginavo" io nello
scenario descritto nella mia citazione sopra e rispetto ai Linked Data.

...direi *anzi* che il fatto che il "data lake" include dati strutturati
provenienti da database relazionali *e* dati strutturati in XML evidenzi
quanto tentare di condividere un unico schema per descrivere il domain
da cui provengono i dati è perdente in partenza.

RDF e Linked Data NON fanno parte dei "data lake", sono anzi il loro
*antidoto*.

> del team digitale: tutti forniscono i dati come gli pare

Non mi pare in RDF con ontologia pubblica (o quantomeno pubblicata): o
sì?

> e poi c'è qualcuno al centro che li interpreta con regole sue
> in scenari di questo tipo, il fatto che i dati siano RDF\OWL è in pratica
> irrilevante: chi fa integrazione a modo suo può benissimo ignorare i
> vincoli logici

Chi fa integrazione può "solo" sbagliare a interpretare la semantica -
che dovrebbe essere _ben_ documentata nell'ontologia resa disponibile
dalla "periferia" - dei dati definiti nei diversi graph knowlegge che
vuole integrare in uno solo.

Significa anche che RDF e Linked Data non sono bacchette magiche ma
servono "solo" a facilitare (di due ordini di grandezza) il lavoro di
integrazione di basi di dati eterogenee... e le basi dati sono
*irrimediabilmente* eterogenee.

> i linked data sono una effettiva condivisione di 'commitment
> ontologico' solo se tutti usano le stesse uri, ma appunto ci vuole un
> accordo 'erga omnes' a monte insomma ontologie sì, ma solo se sono le
> stesse :-)

Beh ma allora a 'sto punto che differenza c'è tra usare 21 database RDF
tutti con le stesse URI e semantica centralizzate (cioè con lo stesso
schema) oppure database relazionali o serializzazioni XML con lo stesso
schema e una semantica "esterna" centralizzata? Secondo me
_esattamente_ nessuna ed è proprio per questo che non funzionerebbe come
non sta funzionando il "data lake" :-)

AFAIU la forza di RDF sta proprio nel permettere di integrare basi di
dati eterogenee, senza necessità di concordare preventivamente uno
schema [2].

In altre parole: RDF è stato creato _esattamente_ per... rompere gli
schemi :-D

[...]

Saluti, Giovanni.

[1]
https://www.ibm.com/developerworks/library/wa-data-integration-at-scale_rdf/wa-data-integration-at-scale_rdf-pdf.pdf «Data integration at scale: Creating webs of data with
RDF - How resource-oriented thinking benefits data integration», pag. 4

[2] anzi consentendo anche all'interno di una singola organizzazione di
ampliare lo schema a piacere quando necessario, senza essre costretti a
migrare l'intera base dati al nuovo schema.

--
Giovanni Biscuolo