Perché gli open data del governo sul Pnrr non hanno dignità di pubblicazione
Buonasera, https://www.openpolis.it/perche-gli-open-data-del-governo-sul-pnrr-non-hanno... --8<---------------cut here---------------start------------->8--- [...] I dati rilasciati sul portale “Italia domani”, che rappresentano comunque una pubblicazione ufficiale del governo, devono essere necessariamente corretti e affidabili. Ad oggi invece rileviamo che non è così. Tali dati risultano non solo inutilizzabili ma perfino dannosi per chiunque vi faccia riferimento per cercare di comprendere cosa sta accadendo. Per questo invitiamo l’esecutivo a prendere atto della situazione e a sospendere la sezione open data, almeno fin quando non ci sarà la sicurezza di poter mettere a disposizione di cittadini e analisti dati affidabili. Come detto, nel portale Italia domani erano stati caricati 2 file. Uno con l’elenco delle misure che prevedono un finanziamento (non sono presenti quindi quelle riforme che non comportano flussi finanziari) aggiornato al 30 settembre. L’altro invece con le scadenze (traguardi e obiettivi) e risalente al 12 luglio. Già nel precedente approfondimento avevamo evidenziato come questi file, oltre a non rispettare le più comuni pratiche in tema di open data, presentassero degli evidenti errori di compilazione. Ad esempio, sia la descrizione testuale delle singole misure che i relativi codici identificativi non coincidevano. Tali errori peraltro sono finiti anche in alcuni atti ufficiali. Come ad esempio un decreto del presidente del consiglio dei ministri pubblicato recentemente. In questo Dpcm si cita infatti l’investimento “I2.2.1”. Tuttavia nel file con l’elenco delle scadenze non esiste questo codice identificativo. [...] La rimozione di milestone e target “italiani” tuttavia non è la sola differenza tra i due file. Infatti anche il tracciato record (cioè l’insieme delle informazioni disponibili per ogni singola voce) delle misure risulta modificato. Come possiamo vedere anche nell’immagine, non sono più presenti alcuni campi significativi (quelli evidenziati in grassetto). Tra cui anche la fonte dei dati che sarà utilizzata per la verifica degli obiettivi. Tra i campi eliminati vi è quello denominato “misura” il quale conteneva un codice identificativo che permetteva di associare tale voce alla relativa scadenza. Stesso discorso per quanto riguarda la voce “sub-misura”, relativa alle sottomisure. Questa categorizzazione non era chiarissima ma permetteva quantomeno di capire con certezza la struttura gerarchica delle fonti. Adesso tale operazione risulta impossibile. Un altro campo rimosso rispetto al vecchio file è quello definito “Codice identificativo”. In tale campo, come si può capire dal nome, era presente un codice alfanumerico che permetteva di individuare missione, componente, misura e sub-misura. Tale voce, pur non risultando indispensabile, poteva rappresentare una buona base identificativa per associare le misure alle relative scadenze. Il problema però è che questo codice è presente solo in questo file e non nell’altro. Di conseguenza l’unico modo possibile per associare misure e scadenze al momento è quello di esaminare il campo “Misura correlata (riforma o investimento)”. Tale campo tuttavia non è costituito da un codice ma da un testo inserito manualmente. Questa purtroppo è una cattiva pratica abbastanza diffusa che però può portare a errori di compilazione. Errori che, puntualmente, abbiamo riscontrato. Non si possono più individuare le amministrazioni responsabili di reporting e implementazione. Altri campi rimossi e che avevano però una grande importanza erano quelli identificati come “Fonte dei dati/Metodologia” e “Responsabilità per il reporting e l’implementazione”. Tali campi fornivano informazioni importanti. Ovvero su quali basi metodologiche si fondavano i dati e le valutazioni riportate nel primo caso e chi era l’amministrazione responsabile dell’implementazione nel secondo. [...] Nel nostro precedente approfondimento avevamo ipotizzato che i file caricati sul portale Italia domani avessero essenzialmente un fine “divulgativo” e che perciò fossero inutilizzabili a fini di analisi e monitoraggio. L’impressione dunque era che il governo e le altre istituzioni coinvolte lavorassero su altri database più attendibili e circostanziati a cui però cittadini e analisti non hanno accesso. Impressione che trova ulteriore conferma. [...] In conclusione, evidenziamo che i file presenti contraddicono in maniera palese le norme in materia di pubblicazione di dati aperti. --8<---------------cut here---------------end--------------->8--- propongo di rinominare il PNRR in "Piano Nazionale di Riluttanza e Reticenza" ...o forse "Piano Nazionale RiRinascita"? :-O saluti, 380° -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.
Ciao a tutti! su questo tema, a Synapta - start-up spin off del Centro Nexa - stiamo contribuendo all'azione di advocacy portata avanti dalla campagna #datibenecomune anche rispetto ai dati sull'impiego delle risorse del PNRR: https://www.datibenecomune.it/advocacy/ Nelle scorse settimane abbiamo contattato il Servizio Centrale per il PNRR (l'ufficio che presso Ragioneria Generale dello Stato è competente per il coordinamento operativo, monitoraggio, rendicontazione e controllo del PNRR https://www.rgs.mef.gov.it/VERSIONE-I/ragioneria_generale/struttura_e_funzio...) segnalando criticità affini a quelle che emergono dall'articolo su Open Polis, in tema di mala-pubblicazione dei dati sul portale Italia Domani. Il succo di quanto abbiamo evidenziato loro con una nota informale, lo trovate in questo post: https://www.datibenecomune.it/2021/10/22/gli-open-data-di-italia-domani-senz... Un caro saluto Claudio Il giorno gio 18 nov 2021 alle ore 19:59 380° <g380@biscuolo.net> ha scritto:
Buonasera,
https://www.openpolis.it/perche-gli-open-data-del-governo-sul-pnrr-non-hanno...
--8<---------------cut here---------------start------------->8---
[...] I dati rilasciati sul portale “Italia domani”, che rappresentano comunque una pubblicazione ufficiale del governo, devono essere necessariamente corretti e affidabili. Ad oggi invece rileviamo che non è così. Tali dati risultano non solo inutilizzabili ma perfino dannosi per chiunque vi faccia riferimento per cercare di comprendere cosa sta accadendo. Per questo invitiamo l’esecutivo a prendere atto della situazione e a sospendere la sezione open data, almeno fin quando non ci sarà la sicurezza di poter mettere a disposizione di cittadini e analisti dati affidabili.
Come detto, nel portale Italia domani erano stati caricati 2 file. Uno con l’elenco delle misure che prevedono un finanziamento (non sono presenti quindi quelle riforme che non comportano flussi finanziari) aggiornato al 30 settembre. L’altro invece con le scadenze (traguardi e obiettivi) e risalente al 12 luglio. Già nel precedente approfondimento avevamo evidenziato come questi file, oltre a non rispettare le più comuni pratiche in tema di open data, presentassero degli evidenti errori di compilazione. Ad esempio, sia la descrizione testuale delle singole misure che i relativi codici identificativi non coincidevano.
Tali errori peraltro sono finiti anche in alcuni atti ufficiali. Come ad esempio un decreto del presidente del consiglio dei ministri pubblicato recentemente. In questo Dpcm si cita infatti l’investimento “I2.2.1”. Tuttavia nel file con l’elenco delle scadenze non esiste questo codice identificativo.
[...] La rimozione di milestone e target “italiani” tuttavia non è la sola differenza tra i due file. Infatti anche il tracciato record (cioè l’insieme delle informazioni disponibili per ogni singola voce) delle misure risulta modificato. Come possiamo vedere anche nell’immagine, non sono più presenti alcuni campi significativi (quelli evidenziati in grassetto). Tra cui anche la fonte dei dati che sarà utilizzata per la verifica degli obiettivi.
Tra i campi eliminati vi è quello denominato “misura” il quale conteneva un codice identificativo che permetteva di associare tale voce alla relativa scadenza. Stesso discorso per quanto riguarda la voce “sub-misura”, relativa alle sottomisure. Questa categorizzazione non era chiarissima ma permetteva quantomeno di capire con certezza la struttura gerarchica delle fonti. Adesso tale operazione risulta impossibile.
Un altro campo rimosso rispetto al vecchio file è quello definito “Codice identificativo”. In tale campo, come si può capire dal nome, era presente un codice alfanumerico che permetteva di individuare missione, componente, misura e sub-misura. Tale voce, pur non risultando indispensabile, poteva rappresentare una buona base identificativa per associare le misure alle relative scadenze. Il problema però è che questo codice è presente solo in questo file e non nell’altro.
Di conseguenza l’unico modo possibile per associare misure e scadenze al momento è quello di esaminare il campo “Misura correlata (riforma o investimento)”. Tale campo tuttavia non è costituito da un codice ma da un testo inserito manualmente. Questa purtroppo è una cattiva pratica abbastanza diffusa che però può portare a errori di compilazione. Errori che, puntualmente, abbiamo riscontrato.
Non si possono più individuare le amministrazioni responsabili di reporting e implementazione.
Altri campi rimossi e che avevano però una grande importanza erano quelli identificati come “Fonte dei dati/Metodologia” e “Responsabilità per il reporting e l’implementazione”. Tali campi fornivano informazioni importanti. Ovvero su quali basi metodologiche si fondavano i dati e le valutazioni riportate nel primo caso e chi era l’amministrazione responsabile dell’implementazione nel secondo.
[...] Nel nostro precedente approfondimento avevamo ipotizzato che i file caricati sul portale Italia domani avessero essenzialmente un fine “divulgativo” e che perciò fossero inutilizzabili a fini di analisi e monitoraggio. L’impressione dunque era che il governo e le altre istituzioni coinvolte lavorassero su altri database più attendibili e circostanziati a cui però cittadini e analisti non hanno accesso. Impressione che trova ulteriore conferma.
[...] In conclusione, evidenziamo che i file presenti contraddicono in maniera palese le norme in materia di pubblicazione di dati aperti.
--8<---------------cut here---------------end--------------->8---
propongo di rinominare il PNRR in "Piano Nazionale di Riluttanza e Reticenza"
...o forse "Piano Nazionale RiRinascita"? :-O
saluti, 380°
-- 380° (Giovanni Biscuolo public alter ego)
«Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché»
Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>. _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa
-- Claudio Artusio Fellow Centro Nexa su Internet & Società Politecnico di Torino – DAUIN
Buongiorno Claudio, il Re (aka il governante) è nudo. grazie per l'ulteriore materiale inviato ... e grazie per la campagna #DatiBeneComune, lo dico da esponente della campagna #SoftwareBeneComune... che poi è la stessa cosa :-D Claudio Artusio <claudioartusio@gmail.com> writes: [...]
in merito al PNRR ho trovato interessante questo bel riassunto che spiega in pochi paragrafi come stanno le cose --8<---------------cut here---------------start------------->8--- Il Piano viene approvato senza possibilità di modifiche da entrambi i rami del Parlamento. Il 29 aprile il Piano torna in Consiglio dei Ministri che lo approva e lo invia a Bruxelles. [...] Non solo, la Fondazione Openpolis rileva un’ altra criticità: secondo le loro ricostruzioni al 7 giugno i conti non tornano. In base alle nostre ricostruzioni il governo avrebbe inviato alla commissione europea un testo diverso da quello presentato al parlamento la scorsa settimana. Tra le due versioni, oltre 400 milioni di euro avrebbero cambiato destinazione. https://t.co/DhTz4e1cZe — openpolis (@openpolis) May 7, 2021 [...] Si tratta della terza versione diversa del PNRR: la prima, approvata in Parlamento, viene modificata in corso di votazione, senza avvertire deputati e senatori; la seconda, quella modificata, appare sul sito di Palazzo Chigi come versione «inviata alla Commissione europea», ma mancano gli allegati. Della terza sappiamo che non è stata pubblicata sui siti istituzionali italiani e europei e che non è una semplice traduzione del piano italiano, ma rileva dettagli significativi sui progetti che l’Italia vorrà attuare con i soldi europei. Questi documenti aggiuntivi al Piano non vengono pubblicati ufficialmente, ma circolano iformalmente nelle varie chat e sui social network. Così OnData prende tutto il pacchetto e lo pubblica su Archive.org. https://twitter.com/ondatait/status/1391092270150176768 Il percorso del PNRR parte con il piede sbagliato: poca partecipazione, poca trasparenza e con il rischio che, nella fase di implementazione, non possa essere monitorato da tutti i cittadini e le cittadine. Così come Campagna #datiBeneComune decidiamo di lavorare anche sulla trasparenza del Piano Nazionale di Ripresa e Resilenza. --8<---------------cut here---------------end--------------->8--- Siccome tre indizi congruenti e concordanti fanno una prova, questo dimostra che il governo e l'Unione Europea /non vogliono/ gestire il PNRR in modo trasparente nei confronti dei cittadini italiani, AUGURI! [...]
Il succo di quanto abbiamo evidenziato loro con una nota informale, lo trovate in questo post: https://www.datibenecomune.it/2021/10/22/gli-open-data-di-italia-domani-senz...
Bellissimo articolo, grazie!!! Il PNRR (quello vero o solo specchietto per le allodole?) è redatto usando fogli di calcolo fatti coi piedi e pubblicato alla carlona: di questo stiamo parlando; deve essere una best practice usata negli ambienti di alta finanza. [1] Sento una fortissima puzza di "Reinhart-Rogoff error", quello che ha dato giustificazione tecnocratica a un decennio di politica economica di austerity [2]: scienza allo stato puro! :-O [...] Ribadisco la mia proposta:
rinominare il PNRR in "Piano Nazionale di Riluttanza e Reticenza"
[...] Saluti, 380° [1] fuochino... http://eusprig.org/horror-stories.htm [2] https://en.wikipedia.org/wiki/Growth_in_a_Time_of_Debt http://peri.umass.edu/fileadmin/pdf/working_papers/working_papers_301-350/WP... P.S.: per essere una cosa seria, il PNRR dovrebbe essere pubblicato non solo con i dati ma con tutto il software utilizzato per regiderlo... ma non viene fatto nemmeno per gli articoli scientifici, figuriamoci per le manovre economiche -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.
participants (2)
-
380° -
Claudio Artusio