...
La mia esperienza su questo punto è stata deprimente: in un progetto per l’uso di tecniche di Natural Language Processing per analizzare ed estrarre informazioni dalle cartelle cliniche, pur finanziato dalla Regione Toscana, ci sono voluti quasi 2 anni per avere di straforo una piccola porzione di dati dalla ASL toscana su cui fare esperimenti (http://tanl.di.unipi.it/ris-ws/).
Ah, i dati, i dati, pensa che da "normale cittadino" un tempo mi sono pure illuso, i dati della P.A., di trovarli tutti qui: https://dati.gov.it/ All'inizio sembrava funzionare, il "contatore" incrementarsi, poi ad un certo punto il flusso è diminuito, dataset con il contagocce e per di più contenenti dati parziali, non aggiornati e, nel complesso, poco utili. Ad oggi l'elenco [1] riporta, sterilmente, il numero di 35425 dataset forniti da 730 amministrazioni. Peccato non li metta in rapporto con il totale delle pubbliche amministrazioni che sono oltre 23000 e anche non volendo considerare scuole e piccoli comuni, sono comunque diverse migliaia. Mancano poi i dataset più importanti, quelli delle amministrazioni centrali, i quali rappresentano davvero (come scritto nel libro bianco) "una vera e propria miniera di informazioni che sarebbero utilissime per generare applicazioni di Intelligenza Artificiale al servizio dei cittadini". Antonio [1] https://dati.gov.it/amministrazioni