A supporto e integrazione di quanto scritto precedentemente da Stefano Quintarelli e Guido Vetere in questo thread. Nel 2017 pubblicammo un piccolo studio con una tesista e analizzammo i dati sui contratti pubblici delle università: - tra le “top” 25 università indicate nel 2014 dal Sole 24 ore, a qualche anno dal decreto trasparenza, solo 12 avevano pubblicato i dati; ovvero: non bastò Ada Lovelace rediviva, ma predominò l’art. 117.r COST… - sui circa 123000 contratti analizzabili, trovammo che circa 1/3 dei dati erano invalidi in merito a accuratezza, completezza e consistenza sia interna sia rispetto allo schema XML dato dall’ANAC Ovviamente può essere che la situazione a 4 anni di distanza sia migliorata, ma è un esempio storico ben documentato e verificabile. A. ps. Per chi volesse approfondire, cfr nexa lunch seminar nr.37 o mi scriva per avere il puntatore all’articolo scientifico
Il giorno 8 feb 2021, alle ore 08:38, Antonio Iacono <antiac@gmail.com> ha scritto:
ed è quello che in genere accade nel modello 'data lake' del team digitale: tutti forniscono i dati come gli pare e poi c'è qualcuno al centro che li interpreta con regole sue
Grazie Guido di avere introdotto nella discussione un elemento importantissimo. Il "Data Lake". In alcuni posti d'Italia quando la situazione è difficile, quasi disperata, si dice "siamo a mare". In questo caso, "siamo al lago".
Il "data lake" è la resa, il fallimento. Ovvero, dato che non siamo riusciti a creare un data warehouse strutturato, allora, che ognuno si tenga i suoi dati, strutturati, semi-strutturati, persino un RM COBOL data va bene.
OK, prendiamo per buono il "data lake", e ora, come si procede? Chi lo scrive il codice che serve per adeguare i dati delle periferie?
L'ho già citato altre volte in lista, io consiglierei di dare un'occhiata al progetto Solid di Tim Berners-Lee. E' vero che è nato per "sostituire" i social ma, con un po' di fantasia, si potrebbe benissimo adattare ai dati della Pubblica Amministrazione. In fondo Solid cosa fa, tiene i dati in locale e li mette in condivisione con gli altri. E non è questo quello serve alla P.A.?
Antonio _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa