On 08/09/24 12:31, Guido Vetere wrote:
Quando un LLM 'rigurgita' un frammento (ma questo è un evento eccezionale) lo fa comunque in un processo generativo non deterministico in cui quel frammento diviene temporaneamente "attrattore" in forza delle "tracce mnestiche" che ha prodotto nei parametri, cioè qualche cifra decimale nelle gigantesche matrici del modello.
Non ho tempo di continuare una discussione su un articolo che non condivido. Propongo però due domande come esercizio per il lettore: 1. se uno studente componesse una tesi di laurea con i SALAMI che la sua università ha acquistato da qualche oligopolista dell'editoria scientifica commerciale e che gli sono stati raccomandati dall'università stessa e dal venditore come strumento per migliorare il suo lavoro creativo. se nella sua tesi (pubblicata dopo la discussione nell'archivio del suo ateneo) ci fossero *riproduzioni letterali* di pezzi di articoli usciti in riviste di detto oligopolista e usati come dati di addestramento potremmo accusarlo a ragione di aver violato il copyright (diritto morale dell'autore compreso) oppure potrebbe discolparsi dicendo che le riproduzioni sono (un raro) esito di un processo generativo non deterministico? 2. se la risposta alla domanda fosse "sì", e lo studente ne subisse la conseguenze, questi avrebbe titolo a rivalersi su chi gli ha offerto i SALAMI presentandoli come strumenti per migliorare il suo lavoro creativo? A presto, MCP (*) Per non influenzare chi avesse tempo di rispondere non dico come tratterei un laureando che scoprissi a fare le cose di cui in (1), soprattutto se questi sostenesse che i SALAMI da lui usati stanno in una bolla giuridica rispetto alla normativa vigente a partire dai regolamenti di ateneo.