Re: [nexa] The Curious Case of David Mayer, the man ChatGPT cannot name

Dec. 3, 2024

      Ciao Carlo,

On Mon, Dec 02, 2024 at 11:55:50PM +0100, Carlo Blengino wrote:
...
La cosa più certa, al di là del caso Mayer, è che, mi pare, il GDPR se
interpretato restrittivamente non è compatibile con la tecnologia degli
LLM.
lo dici in considerazione del livello di difficoltà di cancellare da un
LLM dati che ha memorizzato e che, ai sensi del GDPR (interpretato
restrittivamente) devono essere dimenticati? Chiedo perché,
concettualmente, non vedo una profonda differenza tra un LLM che
memorizza qualcosa che non dovrebbe (ai sensi di GDPR) od un motore di
ricerca o ancora un archivio digitale. Ritieni che anche queste altre
tecnologie più datate siano fondamentalmente incompatibili con GDPR?

A me pare che la differenza sia solamente nella difficoltà di
cancellazione da un LLM, che oggi è oggettivamente molto alta (di fatto
l'unico modo sicuro è fare retraining dopo avere pulito il training
dataset, il che è molto costoso). Ma non è detto che questo difficoltà
tecnica resti tale in futuro --- penso ad esempio a potenziali progressi
nell'ambito del machine unlearning (mondo che alcuni Nexiani mi hanno di
recente fatto scoprire, h/t a Antonio e Maurizio).

Ciao
-- 
Stefano Zacchiroli . zack@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science              o     o   o     \/|V|\/
Télécom Paris, Polytechnic Institute of Paris     o     o o    </>   <\>
Co-founder & CSO Software Heritage            o o o     o       /\|^|/\
Mastodon: https://mastodon.xyz/@zacchiro                        '" V "'