Re: [nexa] AI Training is Copyright Infringement

Sept. 8, 2024

      Scusate la domanda *molto* ingenua: non si potrebbe discutere di quanto
associato all'output di un LLM partendo dal concetto di '"opera derivata"
nel senso dei Creative Commons? https://it.wikipedia.org/wiki/Opera_derivata

Il giorno dom 8 set 2024 alle ore 17:34 GC F <gcfrosio@gmail.com> ha
scritto:
...
Quel che conta è che si utilizzino espressioni proteggibili per
creare/addestrare uno strumento che genera espressioni diverse e
trasformative rispetto a quelle proteggibili utilizzate come input per
l’addestramento. Anche se il processo di training AI si basa su
riproduzioni meccaniche di opere nella loro interezza, questo non implica
di per sé la violazione del diritto d'autore, se tale riproduzione è votata
alla creazione di uno strumento che poi utilizzi quelle riproduzioni
meccaniche a fini trasformativi. Ovviamente, come ho cercato di spiegare in
precedenza, le posizioni in materia sono molteplici e divergenti, anche in
base al sistema giuridico di riferimento. Se conoscesse un poco il
dibattito si renderebbe conto che certe sue affermazioni sono forse
"ingenue", come già è stato notato mi pare (eg "Anche se poi le aziende
forniscono accesso a quelle opere derivate "a pezzetti", le opere sono
state integralmente incluse nel processo di programmazione statistica (il
"training" della "AI")"). La questione dell'applicazione della "dicotomia
idea/espressione" al TDM è proprio relativa al fatto che per estrarre dati,
non proteggibili, si debbano effettuare copie meccaniche integrali
dell'espressione proteggibile in cui quei dati sono contenuti.
Giancarlo
On Sun, Sep 8, 2024 at 3:25 PM Giacomo Tesio <giacomo@tesio.it> wrote:
...
Caro Giancarlo,
On Sun, 8 Sep 2024 13:46:50 +0100 GC F <gcfrosio@gmail.com> wrote:
...
La τέχνη specifica è irrilevante.
Non parliamo infatti di tecniche ma di finalità.
Il data mining è definito dalla finalità di estrarre informazioni
intellegibili da grandi volumi di dati, NON dal generare in output
testi o immagini che appaiano plausibili ai profani della materia.
Dunque le eccezioni specifiche per il data-mining non sono applicabili
alle "AI generative", anche nei casi in cui alcune tecniche usate per
la programmazione di questi software siano utilizzabili anche per il
data mining.
Attenzione però a non affermare che le AI generative siano "un processo
connesso, simile ma diverso o alternativo" rispetto al data mining.
Sarebbe grossolanamente sbagliato, evidenza di una assoluta ignoranza
rispetto alla materia oggetto del discorso.
Significherebbe affermare che non giò la τέχνη, ma la realtà stessa
sia irrilevante.
A quel punto non sarebbero gli LLM ad "allucinare", ma i giuristi. ;-)
Cui prodest?
...
Che sia propriamente text-and-and-data mining o processo
connesso, simile ma diverso, o alternativo è di rilevanza
tangenziale. I principi di diritto sono strutturati per adattarsi
all'evoluzione tecnologica. Dottrina e giurisprudenza svolgono questo
ruolo, quando non intervenga una riforma legislativa, applicando
principi e precedenti giurisprudenziali a nuova casistica per
analogia.
Tangenziale?
Solo chi non ha mai fatto né data mining né "training" di una "IA
generativa" può immaginare l'esistenza di analogie fra le due attività.
Non ce ne sono, anche quando si utilizzano gli stessi strumenti.
Un po' come non ci sono analogie fra le norme applicabili ad un omicida
e ad un fabbro che abbiano entrambi utilizzato un martello.
Giacomo

Re: [nexa] AI Training is Copyright Infringement

Franco Marra