Secondo Creative Commons, l’utilizzo di pagine web per l’addestramento di modelli, costituisce “fair use”:
—
On 27 Feb 2024, at 12:00, nexa-request@server-nexa.polito.it wrote:
From: Stefano Zacchiroli <zack@upsilon.cc>To: nexa <nexa@server-nexa.polito.it>Subject: Re: [nexa] Microsoft, Mistral AI e l'AI ActMessage-ID: <20240227093929.hnchfamvlyh2lo75@upsilon.cc>Content-Type: text/plain; charset=utf-8On Tue, Feb 27, 2024 at 09:17:10AM +0100, Giuseppe Attardi wrote:
Facciamolo con fondi pubblici un modello davvero completamente Open,
dai dati di apprendimento, al codice, ai pesi del modello, ai test di
valutazione.
Concordo con l'obiettivo e sul fatto che una AI che possa dirsi "open"(o meglio: "libera") dovrebbe esserlo in tutto: dataset di training,codice di training, codice di inferenza, pesi del modello.Ma attenzione al fatto che, a leggi vigenti, tale obiettivo non èraggiungibile per modelli a-la ChatGPT. Il motivo è che includono neiloro dataset di training grandi parti del Web (solitamente ottenute viacrawling fatto in casa), che nessuna parte terza può legittimamenteredistribuire, dato che solo una piccolissima parte del Web èdisponibile sotto licenze libere.Una AI "libera", secondo i criteri accennati sopra, ha quindi oggi unosvantaggio competitivo enorme rispetto a quelle chiuse --- il che èmolto deprimente. L'evoluzione tecnologica e scientifica sta andando nelverso giusto, con modelli sempre più aperti che riescono sempre meglio arivalizzare con quelli chiusi (o ibridi) ma la strada è ancora lunga enon è detto che il gap sia completamente colmabile.Nel mentre dovremmo guardare criticamente alle regolamentazioni chehanno permesso tutto questo "yolo training", che dà un vantaggiocompetitivo enorme a chi libero non vuole essere.Ciao-- Stefano Zacchiroli . zack@upsilon.cc . https://upsilon.cc/zack _. ^ ._Full professor of Computer Science o o o \/|V|\/Télécom Paris, Polytechnic Institute of Paris o o o </> <\>Co-founder & CTO Software Heritage o o o o /\|^|/\https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro '" V "'