Caro Stefano, On Mon, 9 Sep 2024 11:33:44 +0200 Stefano Maffulli wrote:
A me personalmente piacerebbe capire *perché*, prima di pensare a *se*, un LLM dovrebbe essere un'opera derivata dal dataset di addestramento.
La realtà può non piacerci, ma rimane pur sempre reale. Un LLM è un'opera derivata dai dataset utilizzati durante la sua programmazione. Una volta compreso questo (piuttosto ovvio) concetto, possiamo ragionare se le normative vigenti vadano modificate a vantaggio delle grandi aziende che vogliono sfruttare gratuitamente tali opere per produrre software opachi che ne riproducono gli interessi ovunque vengono eseguiti, o meno.
Ovvero, avendo come obiettivo la diffusione della conoscenza, è collettivamente positivo per la società pensare che opere di creatività debbano essere coperte da diritti esclusivi nuovi (o estensione di quelli vecchi --diritto d'autore, marchi, ecc) prima di poter essere trasformate in token e passati in pasto all'addestramento automatico?
Non sono certo di comprendere cosa tu intenda con questa frase. Esimere dal rispetto della Legge chi usa proxy software per violare i diritti altrui è deleterio sia per le vittime che per la società. D'altro canto, nessuno vuole impedire, ad esempio, la creazione di software come GitHub CopyALot: l'importante è che tali software e i software che includono i loro output rispettino i diritti degli autori che hanno contribuito alla loro creazione e le licenze che li veicolano. Ad esempio, Microsoft potrebbe riprogrammare un servizio come GitHub Copilot utilizzando esclusivamente i sorgenti di cui detiene il copyright (e quelli in pubblico dominio). In questo modo nessuno (eccetto Microsoft) avrebbe diritto di lamentarsi per l'inclusione di tali sorgenti in altri software, proprietari o meno. Microsoft invece vuole violare liberamente il copyright altrui, ma si guarda bene dall'automatizzare la violazione del proprio! Cui prodest? (questa volta rispondere è proprio facile... ;-) In qualunque caso non serve né estendere ne comprimere il diritto d'autore, basta applicarlo come viene applicato a qualsiasi altro software compilato a partire da testi. Giacomo