Buongiorno, Guido Vetere <vetere.guido@gmail.com> writes:
ecco un mio breve commento sulla vicenda:
https://www.agendadigitale.eu/cultura-digitale/algoritmi-e-noi-cosi-la-lomba...
Ottima la sottolineatura che si tratta di un problema di natura prettamente semantica, troppe persone in _tutti_ i campi [1] ignorano totalmente il problema come se non esistesse, come se non fosse *centrale* (e storico) nel sistema di trattamento dei dati. Tuttavia ci sono alcune considerazioni da fare: 1. il sistema nel suo complesso è troppo complesso (pun intended) e le strutture periferiche, quelle che raccolgono i dati, probabilmente (purtroppo) non hanno nemmeno idea di cosa sono e come si usano le ontologie. Forse potrebbero avere supporto "mettendole in rete" adeguatamente e/o rivolgendosi ad un supporto qualificato nella PA... ma non andiamo OT; 2. considerato quanto in 1. il gestore lombardo ha deciso (giustamente) di fornire a chi raccoglie i dati un kit, che però è un sistema "Desktop As A Service" (olè!)... ma qual'è lo strumento messo a disposizione per la raccolta dati? Usa una qualche ontologia? Pare di no: pare che il kit fornito consenta perfino di inserire date che vengono convertite in modo errato quando caricate nel «DB Covid-19» regionale, a proposito di semantica e unità di misura; Bellissima poi la considerazione «la carenza semantica nella gestione dei dati pubblici ha origini costituzionali, in particolare nel regime delle autonomie locali.». Sono allora andato a curiosare il repertorio di ontologie che citato [2] e vedo che c'è un «elenco delle basi di dati chiave » [3] che dice: --8<---------------cut here---------------start------------->8--- In base ai fattori precedentemente discussi, si sono individuati cinque macro ambiti di riferimento per le basi di dati chiave/dataset chiave del 2017; gli ambiti sono di seguito riportati utilizzando le denominazioni del vocabolario dei temi per i dati del profilo di metadatazione nazionale DCAT-AP_IT: - Trasporti (che include anche dati relativi in generale alla mobilità); - Istruzione, cultura e sport (che include anche il turismo); - Economia e finanze; Giustizia, sistema giuridico e sicurezza pubblica; - Regioni e città. --8<---------------cut here---------------end--------------->8--- In quell'elenco manca "Salute", che *però* è presente nell'elenco temi [4] delle «Linee guida per i cataloghi dati». Ricordo, infine, che la stessa Iss ha adottato uno schema XML e non una ontologia RDF per il database centralizzato... insomma ciascuno _autonomamente_ si reinventa la ruota ogni volta che c'è bisogno di un carretto [5]? :-D Un bel pasticcio sistemico e sistematico. Saluti, Giovanni. P.S.: rimane il fatto che a quanto ci è dato sapere le altre 19 regioni italiane non hanno avuto simili problemi nel "caricare" i dati nel database Iss. [...] [1] anche solo con le unità di misura, la base della semantica dei dati https://www.mentalfloss.com/article/25845/quick-6-six-unit-conversion-disast... https://spacemath.gsfc.nasa.gov/weekly/6Page53.pdf [2] https://github.com/italia/daf-ontologie-vocabolari-controllati [3] https://docs.italia.it/italia/daf/pianotri-elencobasidatichiave/it/stabile/e... [4] https://docs.italia.it/italia/daf/linee-guida-cataloghi-dati-dcat-ap-it/it/s... [5] che poi, RDF è talmente avanti che lo permette pure *se* si definisce l'ontologia dei dati raccolti: è nato anche per questo, per consentire di connettere basi di dati differenti, i famosi Linked Data. -- Giovanni Biscuolo