Ciao Marco, On July 2, 2021 4:34:37 PM UTC, Marco Ciurcina wrote:
Allo stato non è elementi per escluderlo con certezza. Mi dicono che l'output può include snippet del sw di training.
https://mobile.twitter.com/MaxALittle/status/1410939808382394370 Qui ha sparato fuori (ovvero distribuito), senza attribuzione, ma con tanto di commenti e licenza (sbagliata), il codice GPLv2 di Quake III Arena tratto da https://github.com/id-Software/Quake-III-Arena Il che termina istantaneamente la loro licenza e costituisce una violazione del copyright anche solo per la mancata attribuzione che è prevista anche dalle licenze più permissive.
In ogni caso la risposta dipende (oltre che dalla legge applicabile, che cambia da paese a paese) dal codice usato per il training e da altre variabili.
Non mi è chiaro cosa hai in mente. Il modello è dichiaratamente un'opera derivata (algoritmicamente) del codice su GitHub. Il suo output anche. Possiamo discutere se Microsoft detenga un diritto d'autore sul "modello" di OpenAI (oltre che, ovviamente, sul software che lo esegue) o se la natura "algoritmica" della derivazione non la renda opera creativa. In tal caso, come credo, GitHub non potrebbe vantare alcun copyright sul modello o sull'output esattamente come se tu compili un software che scrivo io, non puoi vantare un copyright sul binario o sull'output del software stesso. Tuttavia se creo un archivio zip di un opera sotto copyright, questo non elimina il copyright ma lo estende all'archivio come opera derivata. Ed il modello AI di copilot può essere anche visto come un archivio un po' più complicato dei sorgenti iniziali da cui vengono estratti selettivamente dei pezzi da copilot. Dunque il modello AI e l'output prodotto sono opere derivate soggette al copyright di tutti gli utenti GitHub.
Siamo sicuri che il sw di training includa sw con licenza AGPLv3?
Sì. Il problema è come dimostrarlo. In Microsoft stanno gia correndo ai ripari e fargli sputare fuori codice così riconoscibile diventerà a breve molto più difficile.
Immagino che in MS abbiano ragionato con attenzione sui profili legali della cosa.
Si direbbe di no. Credo contino che comunque nessuno gli farà causa. E di poter circuire il Giudice straparlando di intelligenza artificiale, nell'eventualità. Giacomo