Scusate la domanda *molto* ingenua: non si potrebbe discutere di quanto associato all'output di un LLM partendo dal concetto di '"opera derivata" nel senso dei Creative Commons? https://it.wikipedia.org/wiki/Opera_derivata Il giorno dom 8 set 2024 alle ore 17:34 GC F <gcfrosio@gmail.com> ha scritto:
Quel che conta è che si utilizzino espressioni proteggibili per creare/addestrare uno strumento che genera espressioni diverse e trasformative rispetto a quelle proteggibili utilizzate come input per l’addestramento. Anche se il processo di training AI si basa su riproduzioni meccaniche di opere nella loro interezza, questo non implica di per sé la violazione del diritto d'autore, se tale riproduzione è votata alla creazione di uno strumento che poi utilizzi quelle riproduzioni meccaniche a fini trasformativi. Ovviamente, come ho cercato di spiegare in precedenza, le posizioni in materia sono molteplici e divergenti, anche in base al sistema giuridico di riferimento. Se conoscesse un poco il dibattito si renderebbe conto che certe sue affermazioni sono forse "ingenue", come già è stato notato mi pare (eg "Anche se poi le aziende forniscono accesso a quelle opere derivate "a pezzetti", le opere sono state integralmente incluse nel processo di programmazione statistica (il "training" della "AI")"). La questione dell'applicazione della "dicotomia idea/espressione" al TDM è proprio relativa al fatto che per estrarre dati, non proteggibili, si debbano effettuare copie meccaniche integrali dell'espressione proteggibile in cui quei dati sono contenuti.
Giancarlo
On Sun, Sep 8, 2024 at 3:25 PM Giacomo Tesio <giacomo@tesio.it> wrote:
Caro Giancarlo,
On Sun, 8 Sep 2024 13:46:50 +0100 GC F <gcfrosio@gmail.com> wrote:
La τέχνη specifica è irrilevante.
Non parliamo infatti di tecniche ma di finalità.
Il data mining è definito dalla finalità di estrarre informazioni intellegibili da grandi volumi di dati, NON dal generare in output testi o immagini che appaiano plausibili ai profani della materia.
Dunque le eccezioni specifiche per il data-mining non sono applicabili alle "AI generative", anche nei casi in cui alcune tecniche usate per la programmazione di questi software siano utilizzabili anche per il data mining.
Attenzione però a non affermare che le AI generative siano "un processo connesso, simile ma diverso o alternativo" rispetto al data mining. Sarebbe grossolanamente sbagliato, evidenza di una assoluta ignoranza rispetto alla materia oggetto del discorso.
Significherebbe affermare che non giò la τέχνη, ma la realtà stessa sia irrilevante.
A quel punto non sarebbero gli LLM ad "allucinare", ma i giuristi. ;-)
Cui prodest?
Che sia propriamente text-and-and-data mining o processo connesso, simile ma diverso, o alternativo è di rilevanza tangenziale. I principi di diritto sono strutturati per adattarsi all'evoluzione tecnologica. Dottrina e giurisprudenza svolgono questo ruolo, quando non intervenga una riforma legislativa, applicando principi e precedenti giurisprudenziali a nuova casistica per analogia.
Tangenziale?
Solo chi non ha mai fatto né data mining né "training" di una "IA generativa" può immaginare l'esistenza di analogie fra le due attività.
Non ce ne sono, anche quando si utilizzano gli stessi strumenti.
Un po' come non ci sono analogie fra le norme applicabili ad un omicida e ad un fabbro che abbiano entrambi utilizzato un martello.
Giacomo