Provo ad inserirmi sul problema degli out-put falsi e “fantasiosi” con alcune considerazioni che non sono affatto sicuro stiano in piedi, ma la difficoltà del diritto non tanto a governare, quanto a comprendere e a collocare al suo interno, in norme e leggi, le realtà generate dalle nuove tecnologie è uno degli aspetti più affascinanti ed al contempo più complessi che questo tempo ci offre (Nexa nasce anche per questo!).
Parto dalla tesi di fondo, per poi argomentare.
I dati generati da ChatGPT ed in generale dalle attuali forme di AI Generativa, anche per immagini come Dall-e, anche quando apparentemente riferibili ad una persona fisica identificata o identificabile, non dovrebbero mai esser considerati dati personali, e ciò a prescindere dalla loro verità/falsità o dalla loro più o meno marcata aderenza alla realtà.
Sono dati sintetici che non rappresentano altro se non loro stessi.
Per comprendere l’affermazione, forse azzardata, è bene definire cosa è un dato per il diritto: il dato è una rappresentazione di fatti, informazioni o concetti. Il dato informatico è sin dalla Convenzione di Budapest del 2001 definito come una “presentazione di fatti, informazioni o concetti in forma suscettibile di essere utilizzata in un sistema computerizzato…”
Ora, per quanto ho capito io anche leggendo i contributi passati su questa lista, le frasi generate da ChatGPT, come le immagini di Dall-e, sono sempre “false”, o meglio “contraffatte”, anche quando corrispondono per “magia” (i millemila parametri) a fatti, concetti o informazioni reali.
Sono artefatti sintetici (come la carne, che in effetti l’abbiamo vietata Sic!) generati da una macchina che non ha alcuna contezza di ciò che il dato vuole rappresentare (e che è poi ciò che ontologicamente caratterizza il "dato"). E se ho ben capito, non ne hanno contezza neanche i “padroni” della macchina, che agisce in autonomia generando quegli pseudo-dati (pseudo-informazioni) più o meno plausibili.
Con le foto è altrettanto evidente: l’immagine generata da Dall-e può esser identica alla realtà (una veduta di Mondovì, per dire..) o rappresentare realisticamente un “fatto” mai accaduto (le foto dell’arresto di Trump) ma in entrambi i casi l’artefatto non è e non può esser "vero", o meglio, non ha le caratteristiche informative (i dati) che noi attribuiamo alla fotografia come rappresentazione di un fatto, in un dato tempo e in un dato posto.
Le creazioni di questi sistemi, da quel che ho capito, anche quando appaiono “dati” personali, rappresentano unicamente loro stessi, ovvero una sequenza di parole o numeri o di pixels, e null’altro.
Per questo a mio giudizio quei dati non dovrebbero esser oggetto ex sé di protezione e di tutela alcuna. Non contengono alcuna rappresentazione di fatti concetti o informazioni in qualche modo degni di tutela dall’ordinamento (infatti non c'è diritto d'autore, che comunque è un diritto intimamente legato nei suoi aspetti morali all’identità della persona, esattamente come il diritto alla protezione dei dati).
Pensare di tutelare e “proteggere” come dati personali gli out-put di questi sistemi significa oggi conferire loro una valenza che non hanno ed avallare temo l’allucinazione che stiamo vivendo con l’intelligenza artificiale.
Queste considerazioni non vogliono negare le potenzialità lesive di quei dati sintetici o la pericolosità delle macchine che li generano, ma consentono di spostare il focus e l’attenzione da quel dato che non "rappresenta" nulla (se non se stesso), all'uso che di quell’artefatto sintetico e delle macchine che lo producono ne facciamo noi umani.
Forse il mio ragionamento non sta in piedi, ma io sotto il profilo “protezione dei dati personali” vedo enormi e quasi insormontabili problemi in relazione ai data-set di addestramento (e a mio giudizio non sono problemi legati agli errori di output quanto meno in relazione al GDPR) e vedo problemi possibili ma a me (e temo anche al Garante) ignoti in relazione ai dati degli utenti/fruitori ed ai dati da questi immessi nel prompt.
Trovo invece un po’ folle pensare di attenzionare le risposte sbagliate, attribuendo a quei non-dati uno status di tutela che, a mio giudizio, allo stato dell’arte, non dovrebbero avere.
Ultima annotazione: l’uso di dati falsi, inesatti o le lesioni ad onore e reputazione legati all’uso di informazioni comunque ottenute da quegli artefatti sono tutte condotte adeguatamente presidiate dall’ordinamento. Assai più preoccupante e poco presidiata la folle corsa alle API ed all’utilizzo di quei sistemi per automatizzare processi diversi come search...vedremo.
CB
Certo. Ma questo è l'altro aspetto: quello del trattamento dei dati in *input* a ChatGPT, che esiste ed è potenzialmente problematico dal punto di vista della privacy, a prescindere dalla veridicità delle risposte date.
La mia domanda era su quale sia l'impatto della falsità dell'*output* (che sollevavi come fattore a se stante nella mail precedente) sui profili giuridici di violazione della privacy.
Saluti
On April 2, 2023 11:22:03 PM GMT+02:00, Maurizio Borghi <maurizio.borghi@unito.it> wrote:
>On Sun, 2 Apr 2023 at 20:19, Stefano Zacchiroli <zack@upsilon.cc> wrote:
>
>>
>> Che GhatGPT dica panzane a proposito di persone specifiche (viventi) è
>> in effetti evidente a tutti. Ma, da non giurista, faccio veramente
>> fatica a capire perché questo ponga problemi al Garante per la
>> protezione dei dati personali. Se pubblico un sito web pieno di panzane
>> su persone viventi, il Garante ha il potere di farmelo chiudere? Direi
>> (sempre da non giurista), che al massimo rischio una querela per
>> diffamazione
>
>
>Se la produzione di quelle panzane richiede il trattamento dei dati di
>milioni di ignari cittadini, allora sì, attrai le ire del Garante (oltre
>che quelle dei destinatari delle tue panzane).
>
>>
>> --
>_______________
>*Maurizio Borghi*
>Università di Torino
>https://www.dg.unito.it/persone/maurizio.borghi
>Co-Director Nexa Center for Internet & Society <https://nexa.polito.it/>
>
>My Webex room: https://unito.webex.com/meet/maurizio.borghi
--
Sent from my mobile phone. Please excuse my brevity and top-posting.
_______________________________________________
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa