Buongiorno, da _dilettante_ del diritto e di filosofia mi permetto un paio di commenti Carlo Blengino <blengino@penalistiassociati.it> writes: [...]
Non sono sicuro che la cessione nel caso GEDI fosse per sperimentare servizi basati su RAG, ma se anche così fosse, e i dati non fossero utilizzati per addestramento, vi sarebbe comunque un trasferimento di dati ad OpenAI,
lasciando da parte gli "esercizi di cattivo gusto" (giuridico) degli accordi tra editori e aziende informatiche, che differenza c'è tra l'indicizzazione degli articoli pubblicati - e sottolineo ottanta volte pubblicati - e altri tipi di elaborazione, dal punto di vista del GDPR? scusa l'ignoranza ma la circostanza che i _presunti_ "dati" siano stati resi _pubblici_ (pubblicati) da un organo di /informazione/ non rende quei "dati" /liberi/ da GDPR? (cioè: io non li ottengo dalla persona, li ottengo da una pubblicazione) [...]
il problema per cui un archivio pubblico come l'archivio di un grande quotidiano per il GDPR non sarà mai usabile da un fornitore per l'addestramento è vera, quale che sia la modalità di acquisizione (che sia con lo scraping o con accordi).
Tipo il /dato/ che un tale è stato condannato a X anni di carcere con sentenza passata in giudicato, ecc, ecc, ecc: quello è /trattamento di dati personali/? Questo vale anche per i libri nelle biblioteche, giusto? Questo vale solo per "l'addestramento LLM" o per qualsiasi tipo di trattamento per mezzo di elaboratore?
Non ci sarà mai infatti per fini commeriali/imprenditoriali una base giuridica che legittimi il trattamento di archivi così rilevanti, almeno in UE, perchè quel dataset contiene per forza dati particolari ex art.9 e dati giudiziari ex art. 10, circostanza questa che esclude il legittimo interesse.
Quindi la Treccani non è legittimata a trattare gli archivi delle sentenze passate in giudicato, per esempio? Nelle questioni /pubbliche/ (cioè _pubblicate_) non è forse mio legittimo interesse conoscere i fatti e le circastanze (dati) che determinano la vita della mia nazione, inclusi dati personali? [...]
Per salvare il trattamento dei motori di ricerca quali titolari del trattamento sulla base del legittimo interesse si sono compiute capriole interpretative notevoli là dove tale base è recessiva rispetto al divieto di trattamento di dati particolari,
faranno delle capriole ancora più contorte anche per gli LLM ...fino a riformare il GDPR :-)
ma lì era più facile e nessuno poteva vietare Google Search.
"Too big to stop"? [...]
E mi chiedo cosa intenda il Garante quando parla di "licenza",
farà parte delle capriole (sgraziate) che tocca fare al Garante [...]
i dati personali, a maggior ragione se pubblici, non sono di nessuno (il titolare è il titolare del trattamento, non dei dati, e l'interessato non possiede i suoi dati, può pretenderne la protezione, a determinate condizioni).
protezione tipo che nessuno può leggere la sua corrispondenza privata (email, chat, compiti in classe, risultati di test scolastici, risultati di visite mediche, ecc. ecc. ecc. ecc.) come parte integrante del /servizio/, perché questo ha sempre fatto schifo e deve continuare a farlo? il GDPR dovrebbe servire a _questo_, non a stabilire chi può e chi non può trattare dati, anche personali, contenuti in archivi _pubblici_ (pubblicati)
E bene che sia così, perchè i dati, rectius le informazioni, anche personali devono circolare santo cielo! Sono la base della conoscenza,
Amen. [...]
Quando uscì il GDPR (2016) ricordo che in studio ci dicemmo: ma sta roba è incompatibile con il BigData (in allora il termine era una buzzword).
Io, che sono ingenuo da fare paura, ho sempre pensato che il GDPR servisse a garantire che i dati _privati_ - e sottolineo ottanta volte privati - rimanessero tali, ovvero /riservati/ tra me e il mio fornitore, che non si deve azzardare a trasmetterli a terzi se non per l'esecuzione degli _specifici_ compiti inclusi nel rapporto _contrattuale_ (e di tali trasferimenti devo essere informato). ...e invece, il mio numero di cellulare è da anni in una lista che innumerevoli "agenti del male" (quello che sento per loro) usano insistentemente per tentare di interrompermi almeno 3 volte al giorno non mi risulta che i numeri di cellulare siano _pubblicati_ dagli organi di informazione, sicuramente non il mio
Minimizzazione, limitazione della conservazione, stretta finalità...tutta roba contraria al valore informativo dei dati,
non capisco perché i miei dati personali non debbano essere trattati secondo quei principi, _soprattutto_ perché il valore informativo dei miei dati personali VOGLIO che diventi zero una volta che con quel determinato fornitore ho cessato ogni rapporto cosa ben diversa è la _pubblicazione_ di ALCUNI dati personali, che SE avviene nell'ambito del c.d. interesse pubblico dovrebbe già essere ampiamente tutelata dal codice penale e civile, che superano di gran lunga il GDPR... ma io sono dilettante e ingenuo il solo pensiero che "la privacy" venga di tanto in tanto abusata come mezzo di CENSURA sia di attività di pubblica informazione che di attività di pubblica sicurezza mi disturba alquanto [...]
Però non facciamolo usando il GDPR come fosse il baluardo che difende l'umanità
soprattutto non facciamolo usando il GDPR come una _clava_ contro "la qualsiasi", perché fa malissimo allo stato di diritto
dall'AI cattiva e dai cattivi che la governano. I problemi sono altri e necessitano di risposte diverse.
tipo: vogliamo vietare o no che TONNELLATE di dati personali riservatissimi quali email, chat, compiti in classe, risultati di test scolastici, risultati di visite mediche, ecc. vengano raccolti ed elaborati? Certe cose non dovrebbero essere fatte NEMMENO col consenso dei "titolari dei diritti", perché sono comunque /minorati/. [...] Grazie per l'attenzione. Saluti, 380° -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.