Re: [nexa] Microsoft, Mistral AI e l'AI Act

Feb. 29, 2024

      Mi pare che il quarto fattore alla base dell'analisi di CC del perché si 
tratta di "fair use" (4. Whether the secondary use harms the market for 
the original) possa andare forse bene per la dottrina US, perché si 
limita a considerare i danni per lo specifico originale su cui ci si è 
addestrati, ma nella mia visione più europea andrebbe considerato il 
danno al mercato per l'insieme delle opere su cui ci si è addestrati.

In altre parole, mi pare che i potenziali danni sociali di un uso del 
tutto non regolamentato di qualunque cosa si trovi sul web (e, mi pare 
di capire, anche fuori dal web, visto che - se non mi sbaglio - 
nell'intero articolo non si parla mai di web o di rete) non possano 
essere considerati dei trascurabili danni collaterali di una 
competizione capitalistica (come penso lasci intendere l'articolo), 
altrimenti staremmo ancora a far lavorare i minori in fabbrica per 12 
ore e più.

Ciao, Enrico

Il 28/02/2024 15:29, Giuseppe Attardi ha scritto:
...
Secondo Creative Commons, l’utilizzo di pagine web per l’addestramento 
di modelli, costituisce “fair use”:
https://creativecommons.org/2023/02/17/fair-use-training-generative-ai/
—
...
On 27 Feb 2024, at 12:00, nexa-request@server-nexa.polito.it wrote:
From: Stefano Zacchiroli <zack@upsilon.cc>
To: nexa <nexa@server-nexa.polito.it>
Subject: Re: [nexa] Microsoft, Mistral AI e l'AI Act
Message-ID: <20240227093929.hnchfamvlyh2lo75@upsilon.cc>
Content-Type: text/plain; charset=utf-8
...
On Tue, Feb 27, 2024 at 09:17:10AM +0100, Giuseppe Attardi wrote:
Facciamolo con fondi pubblici un modello davvero completamente Open,
dai dati di apprendimento, al codice, ai pesi del modello, ai test di
valutazione.
Concordo con l'obiettivo e sul fatto che una AI che possa dirsi "open"
(o meglio: "libera") dovrebbe esserlo in tutto: dataset di training,
codice di training, codice di inferenza, pesi del modello.
Ma attenzione al fatto che, a leggi vigenti, tale obiettivo non è
raggiungibile per modelli a-la ChatGPT. Il motivo è che includono nei
loro dataset di training grandi parti del Web (solitamente ottenute via
crawling fatto in casa), che nessuna parte terza può legittimamente
redistribuire, dato che solo una piccolissima parte del Web è
disponibile sotto licenze libere.
Una AI "libera", secondo i criteri accennati sopra, ha quindi oggi uno
svantaggio competitivo enorme rispetto a quelle chiuse --- il che è
molto deprimente. L'evoluzione tecnologica e scientifica sta andando nel
verso giusto, con modelli sempre più aperti che riescono sempre meglio a
rivalizzare con quelli chiusi (o ibridi) ma la strada è ancora lunga e
non è detto che il gap sia completamente colmabile.
Nel mentre dovremmo guardare criticamente alle regolamentazioni che
hanno permesso tutto questo "yolo training", che dà un vantaggio
competitivo enorme a chi libero non vuole essere.
Ciao
-- 
Stefano Zacchiroli . zack@upsilon.cc . https://upsilon.cc/zack  _. ^ ._
Full professor of Computer Science              o     o   o     \/|V|\/
Télécom Paris, Polytechnic Institute of Paris     o     o o    </>   <\>
Co-founder & CTO Software Heritage            o o o     o       /\|^|/\
https://twitter.com/zacchiro . https://mastodon.xyz/@zacchiro   '" V "'
_______________________________________________
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa
--
-- EN

https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html
	======================================================
Prof. Enrico Nardelli
Past President di "Informatics Europe"
Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI
Dipartimento di Matematica - Università di Roma "Tor Vergata"
Via della Ricerca Scientifica snc - 00133 Roma
home page: https://www.mat.uniroma2.it/~nardelli
blog: https://link-and-think.blogspot.it/
tel: +39 06 7259.4204 fax: +39 06 7259.4699
mobile: +39 335 590.2331 e-mail: nardelli@mat.uniroma2.it
online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont
======================================================

--