E' bene considerare che i LLM sono pre-addestrati con dati liberamente accessibili sul web, cioè resi manifestamente pubblici dagli interessati, per trattare i quali non occorre il consenso (art. 9)
Non risulta che OpenAI abbia chiesto e ottenuto dati tutelati da GDPR, ad es. cartelle cliniche, e in tal caso andrebbe perseguito soprattutto chi glieli ha ceduti.
Non risulta neppure che il sistema interroghi l'utente in modo da ottenere dati del genere; le circostanze in cui un utente spontaneamente le rivela non sono diverse da quelle in cui lo stesso utente le manifesta in qualsiasi altra interazione, ad esempio quando usa l'assistente vitruale di una piattaforma di e-commerce.
E' inoltre chiaro, oltre che noto, che ChatGPT non fa 'ingestion' delle interazioni con l'utente nel Language Model, sarebbe peraltro costosissimo; semmai può correggere a posteriori certi suoi 'atteggiamenti'.
Infine, appare evidente che il sistema sia stato condizionato per non rispondere a domande 'sensibili': pur essendo, come sappiamo, del tutto ignaro del significato delle sue parole, si mostra assolutamente rispettoso della privacy dei soggetti terzi.
Allego uno screeshot, un po' per celia.
Buona settimana.
G.