Ciao Carlo, On Mon, Dec 02, 2024 at 11:55:50PM +0100, Carlo Blengino wrote:
La cosa più certa, al di là del caso Mayer, è che, mi pare, il GDPR se interpretato restrittivamente non è compatibile con la tecnologia degli LLM.
lo dici in considerazione del livello di difficoltà di cancellare da un LLM dati che ha memorizzato e che, ai sensi del GDPR (interpretato restrittivamente) devono essere dimenticati? Chiedo perché, concettualmente, non vedo una profonda differenza tra un LLM che memorizza qualcosa che non dovrebbe (ai sensi di GDPR) od un motore di ricerca o ancora un archivio digitale. Ritieni che anche queste altre tecnologie più datate siano fondamentalmente incompatibili con GDPR? A me pare che la differenza sia solamente nella difficoltà di cancellazione da un LLM, che oggi è oggettivamente molto alta (di fatto l'unico modo sicuro è fare retraining dopo avere pulito il training dataset, il che è molto costoso). Ma non è detto che questo difficoltà tecnica resti tale in futuro --- penso ad esempio a potenziali progressi nell'ambito del machine unlearning (mondo che alcuni Nexiani mi hanno di recente fatto scoprire, h/t a Antonio e Maurizio). Ciao -- Stefano Zacchiroli . zack@upsilon.cc . https://upsilon.cc/zack _. ^ ._ Full professor of Computer Science o o o \/|V|\/ Télécom Paris, Polytechnic Institute of Paris o o o </> <\> Co-founder & CSO Software Heritage o o o o /\|^|/\ Mastodon: https://mastodon.xyz/@zacchiro '" V "'