mi pare che la violazione del diritto d'autore sia in origine. da dove sono presi i testi, senza violare tpm? Hanno scansionato e fatto ocr dei testi? Il 6 settembre 2024 12:09:18 UTC, Daniela Tafani <daniela.tafani@unipi.it> ha scritto:
Caro Giacomo, caro 380°,
Tuttavia NON è ciò che avviene durante la programmazione statistica di un "AI generativa" che è semplicemente un'opera derivata dei dati sorgente
Il software (programmato statisticamente) è un'opera derivata dei testi (dati?) utilizzati per il "machine learning": ho capito bene?
Per essere considerata opera derivata, è mio modestissimo parere che tale opera debba essere espressa in una forma (linguaggio) comprensibile agli umani, ma non mi pare proprio che il software programmato statisticamente (che è del tutto analogo al software binario) rientri in questa categoria.
non troppo dissimile da un jpeg o da uno zip danneggiato ma ancora utilizzabile.
...oppure ho capito male e tu non ti stai riferendo al software (binario) come opera derivata ma all'output dei sistem "AI generativi"?
La questione che state discutendo è l'elemento che mi ha indotta a segnalarvi l'articolo. Ted Chiang l'ha posta sostenendo che ChatGPT sia come un certo tipo di fotocopiatrice: quello che produce è un "JPEG sfuocato del web", una "lossy compression" del web*, che potrebbe essermi utile, ad esempio, se stessi per perdere per sempre l'accesso a Internet e volessi salvare tutto il testo del web su un server privato, in uno spazio pari a un centesimo dell'originale.
Con una simile compressione di gruppo, non potrei più avere accesso alle opere nella loro forma originale, ma potrei ottenerne, per interpolazione, delle approssimazioni, tramite queries dalla forma di domande (senza alcuna garanzia che il sistema sia in grado anche solo di indicare il titolo della singola opera originaria).
A me pare che questo modo di concettualizzare la questione fornisca un buon punto di partenza per discuterne, dal punto di vista politico.
Un saluto, Daniela
*https://www.newyorker.com/tech/annals-of-technology/chatgpt-is-a-blurry-jpeg...