"OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us"
*OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us* /OpenAI shocked that an AI company would train on someone else's data without permission or compensation./ Jason Koebler Jan 29, 2025 at 9:43 AM The narrative that OpenAI, Microsoft, and freshly minted White House “AI czar” David Sacks are now pushing to explain why DeepSeek was able to create a large language model that outpaces OpenAI’s while spending orders of magnitude less money and using older chips is that DeepSeek used OpenAI’s data unfairly and without compensation. Sound familiar? Both Bloomberg and the Financial Times are reporting that Microsoft and OpenAI have been probing whether DeepSeek improperly trained the R1 model that is taking the AI world by storm on the outputs of OpenAI models. [...] continua qui: https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-da...
Il 30/01/2025 08:14, J.C. DE MARTIN ha scritto:
/... an AI company would train on someone else's data without permission or compensation./
Hanno la faccia come ... <CENSORED> -- -- EN https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html ====================================================== Prof. Enrico Nardelli Past President di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www.mat.uniroma2.it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat.uniroma2.it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ====================================================== --
Immagino si lamentino di violazione di segreti industriali (teoricamente il dataset può essere oggetto di protezione da SI) e competizione sleale, non di violazione dei diritti autoriali di cui invece si è discusso molto finora. Giancarlo On Thu, Jan 30, 2025 at 7:14 AM J.C. DE MARTIN < juancarlos.demartin@polito.it> wrote:
*OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us*
*OpenAI shocked that an AI company would train on someone else's data without permission or compensation.*
Jason Koebler
Jan 29, 2025 at 9:43 AM
The narrative that OpenAI, Microsoft, and freshly minted White House “AI czar” David Sacks are now pushing to explain why DeepSeek was able to create a large language model that outpaces OpenAI’s while spending orders of magnitude less money and using older chips is that DeepSeek used OpenAI’s data unfairly and without compensation. Sound familiar?
Both Bloomberg and the Financial Times are reporting that Microsoft and OpenAI have been probing whether DeepSeek improperly trained the R1 model that is taking the AI world by storm on the outputs of OpenAI models.
[...]
continua qui: https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-da...
Per quanto Lemley, Mark A. and Henderson, Peter, The Mirage of Artificial Intelligence Terms of Use Restrictions (December 09, 2024). Princeton University Program in Law & Public Affairs Research Paper No. 2025-04, Available at SSRN: https://ssrn.com/abstract=5049562 or http://dx.doi.org/10.2139/ssrn.5049562<https://dx.doi.org/10.2139/ssrn.5049562> suggerirebbe che TS non ci possa essere (almeno come ToU) [cid:image001.jpg@01DB735E.82AC4690] __________________________________________ Prof. Avv. Marco Ricolfi C.so Galileo Ferraris, 43 - 10128 Torino T (+39) 011.554.54.11 F (+39) 011.518.45.87 E marco.ricolfi@weigmann.it<mailto:marco.ricolfi@weigmann.it> PEC marcoricolfi@pec.ordineavvocatitorino.it<mailto:marcoricolfi@pec.ordineavvocatitorino.it> www.weigmann.it<https://urlsand.esvalabs.com/?u=http%3A%2F%2Fwww.weigmann.it%2F&e=6b170c62&h...> [cid:image002.jpg@01DB735E.82AC4690] Member of The Parlex Group of European Lawyers EEIG with associated law firms in the main capitals of the European Union, U.S.A., Israel and Malaysia; web site: www.parlex.org<https://urlsand.esvalabs.com/?u=http%3A%2F%2Fwww.parlex.org%2F&e=6b170c62&h=...> DISCLAIMER: Le informazioni contenute in questa comunicazione sono riservate e destinate esclusivamente alla/e persona/e o all'ente/i destinatario. È vietato a soggetti diversi dai destinatari di questa comunicazione qualsiasi uso, copia o diffusione delle informazioni e dei dati in essa contenuti, sia ai sensi dell'art. 616 c.p. sia ai sensi del Regolamento (UE) 2016/679. Se questa comunicazione Vi è pervenuta per errore, Vi preghiamo di informarci chiamando il numero (+39) 011.554.54.11, ovvero di rispondere a questa e-mail e successivamente, di cancellare dal Vostro sistema la e-mail ed ogni suo allegato. DISCLAIMER: The information contained in the e-mail is confidential and intended only for the attention of the named individual(s) or organisation(s) to whom it is addressed. If you are not the intended recipient be aware that any use, copying or distribution of the information contained herein is prohibited pursuant to Article 616 of the Italian Penal Code and (EU) Regulation 2016/679. If the communication has been sent to you in error, please notify us by telephone on (+39) 011.554.54.11, or reply to the e-mail. Please then delete the e-mail and any attachments from your system. Da: nexa <nexa-bounces@server-nexa.polito.it> Per conto di GC F Inviato: giovedì 30 gennaio 2025 20:53 A: Nexa <nexa@server-nexa.polito.it> Oggetto: Re: [nexa] "OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us" Immagino si lamentino di violazione di segreti industriali (teoricamente il dataset può essere oggetto di protezione da SI) e competizione sleale, non di violazione dei diritti autoriali di cui invece si è discusso molto finora. Giancarlo On Thu, Jan 30, 2025 at 7:14 AM J.C. DE MARTIN <juancarlos.demartin@polito.it<mailto:juancarlos.demartin@polito.it>> wrote: OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us OpenAI shocked that an AI company would train on someone else's data without permission or compensation. Jason Koebler Jan 29, 2025 at 9:43 AM The narrative that OpenAI, Microsoft, and freshly minted White House “AI czar” David Sacks are now pushing to explain why DeepSeek was able to create a large language model that outpaces OpenAI’s while spending orders of magnitude less money and using older chips is that DeepSeek used OpenAI’s data unfairly and without compensation. Sound familiar? Both Bloomberg and the Financial Times are reporting that Microsoft and OpenAI have been probing whether DeepSeek improperly trained the R1 model that is taking the AI world by storm on the outputs of OpenAI models. [...] continua qui: https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-data-openai-stole-from-us/<https://url.de.m.mimecastprotect.com/s/phj8CWPxMXTGp0Gf6fWSokAg4?domain=404media.co/>
non capisco la questione dataset riseptto alla distillazione puoi espandere, per piacere ? On 30/01/25 20:53, GC F wrote:
Immagino si lamentino di violazione di segreti industriali (teoricamente il dataset può essere oggetto di protezione da SI) e competizione sleale, non di violazione dei diritti autoriali di cui invece si è discusso molto finora.
Giancarlo
On Thu, Jan 30, 2025 at 7:14 AM J.C. DE MARTIN <juancarlos.demartin@polito.it <mailto:juancarlos.demartin@polito.it>> wrote:
__ *OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us*
/OpenAI shocked that an AI company would train on someone else's data without permission or compensation./
Jason Koebler
Jan 29, 2025 at 9:43 AM
The narrative that OpenAI, Microsoft, and freshly minted White House “AI czar” David Sacks are now pushing to explain why DeepSeek was able to create a large language model that outpaces OpenAI’s while spending orders of magnitude less money and using older chips is that DeepSeek used OpenAI’s data unfairly and without compensation. Sound familiar?
Both Bloomberg and the Financial Times are reporting that Microsoft and OpenAI have been probing whether DeepSeek improperly trained the R1 model that is taking the AI world by storm on the outputs of OpenAI models.
[...]
continua qui: https://www.404media.co/openai-furious-deepseek-might- have-stolen-all-the-data-openai-stole-from-us/ <https:// www.404media.co/openai-furious-deepseek-might-have-stolen-all-the- data-openai-stole-from-us/>
-- You can reach me on Signal: @quinta.01 (no Whatsapp, no Telegram)
Se il claim è solo distillazione, così a occhio non può essere violazione di segreto industriale ma solo concorrenza sleale (magari mi sbaglio). Giusto anche l'articolo che ha postato Marco di Lemley. Le lagnanze di OpenAI sono comunque poco sostenibili. Giancarlo On Thu, Jan 30, 2025 at 8:52 PM Stefano Quintarelli <stefano@quintarelli.it> wrote:
non capisco la questione dataset riseptto alla distillazione puoi espandere, per piacere ?
On 30/01/25 20:53, GC F wrote:
Immagino si lamentino di violazione di segreti industriali (teoricamente il dataset può essere oggetto di protezione da SI) e competizione sleale, non di violazione dei diritti autoriali di cui invece si è discusso molto finora.
Giancarlo
On Thu, Jan 30, 2025 at 7:14 AM J.C. DE MARTIN <juancarlos.demartin@polito.it <mailto:juancarlos.demartin@polito.it>> wrote:
__ *OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole From Us*
/OpenAI shocked that an AI company would train on someone else's data without permission or compensation./
Jason Koebler
Jan 29, 2025 at 9:43 AM
The narrative that OpenAI, Microsoft, and freshly minted White House “AI czar” David Sacks are now pushing to explain why DeepSeek was able to create a large language model that outpaces OpenAI’s while spending orders of magnitude less money and using older chips is that DeepSeek used OpenAI’s data unfairly and without compensation. Sound familiar?
Both Bloomberg and the Financial Times are reporting that Microsoft and OpenAI have been probing whether DeepSeek improperly trained the R1 model that is taking the AI world by storm on the outputs of OpenAI models.
[...]
continua qui: https://www.404media.co/openai-furious-deepseek-might- have-stolen-all-the-data-openai-stole-from-us/ <https:// www.404media.co/openai-furious-deepseek-might-have-stolen-all-the- data-openai-stole-from-us/>
-- You can reach me on Signal: @quinta.01 (no Whatsapp, no Telegram)
ma direi nemmeno concorrenza sleale. solo violazione dei terms of service che pero' va capito se sono leciti da qualche parte ho letto che deepseek avrebbe usato escamotage per aggirare delle protezioni (rate limiting?) forse cercano di buttarla sulla violazione di TPM, ma (IANAL) AFAIK l'output di un LLM non è protetto da copyright a meno che non ci sia un sostanziale contributo umano. forse cercano che un giudice dica che c'e' ujn sostanziale contributo umano nell'output degli LLM e quindi sono tuttelati e quindi deepseek ha violato misure di protezione ? mi sembra un long shot piu' FUD che altro On 30/01/25 22:31, GC F wrote:
Se il claim è solo distillazione, così a occhio non può essere violazione di segreto industriale ma solo concorrenza sleale (magari mi sbaglio). Giusto anche l'articolo che ha postato Marco di Lemley. Le lagnanze di OpenAI sono comunque poco sostenibili.
Giancarlo
On Thu, Jan 30, 2025 at 8:52 PM Stefano Quintarelli <stefano@quintarelli.it <mailto:stefano@quintarelli.it>> wrote:
non capisco la questione dataset riseptto alla distillazione puoi espandere, per piacere ?
On 30/01/25 20:53, GC F wrote: > Immagino si lamentino di violazione di segreti industriali (teoricamente > il dataset può essere oggetto di protezione da SI) e competizione > sleale, non di violazione dei diritti autoriali di cui invece si è > discusso molto finora. > > Giancarlo > > On Thu, Jan 30, 2025 at 7:14 AM J.C. DE MARTIN > <juancarlos.demartin@polito.it <mailto:juancarlos.demartin@polito.it> <mailto:juancarlos.demartin@polito.it <mailto:juancarlos.demartin@polito.it>>> > wrote: > > __ > *OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole > From Us* > > /OpenAI shocked that an AI company would train on someone else's > data without permission or compensation./ > > Jason Koebler > > Jan 29, 2025 at 9:43 AM > > The narrative that OpenAI, Microsoft, and freshly minted White House > “AI czar” David Sacks are now pushing to explain why DeepSeek was > able to create a large language model that outpaces OpenAI’s while > spending orders of magnitude less money and using older chips is > that DeepSeek used OpenAI’s data unfairly and without compensation. > Sound familiar? > > Both Bloomberg and the Financial Times are reporting that Microsoft > and OpenAI have been probing whether DeepSeek improperly trained the > R1 model that is taking the AI world by storm on the outputs of > OpenAI models. > > [...] > > continua qui: https://www.404media.co/openai-furious- deepseek-might- <https://www.404media.co/openai-furious-deepseek-might-> > have-stolen-all-the-data-openai-stole-from-us/ <https:// > www.404media.co/openai-furious-deepseek-might-have-stolen-all- the- <http://www.404media.co/openai-furious-deepseek-might-have- stolen-all-the-> > data-openai-stole-from-us/> >
-- You can reach me on Signal: @quinta.01 (no Whatsapp, no Telegram)
-- You can reach me on Signal: @quinta.01 (no Whatsapp, no Telegram)
Pare anche a me. Se capisco bene la vicenda DeepSeek per come si sta sviluppando finora mi pare che i chatbot e in generale gli LLM: 1) risulterebbero di difficile escludibilità, sia per il training (il modello può essere esfiltrato) che per il serving (può girare on-premises) che per i prompt (a meno di sistemi artificiosi [1]); 2) non seguono le economie di scala dei social network (gli utenti non hanno motivo di andare dove ci sono altri utenti). Non si sono viste nemmeno applicazioni di piattaforme già esistenti che godano sostanziali benefici dall'uso degli LLM. Di conseguenza mi pare che la monetizzabilità non possa seguire il facile modello di business del surveillance capitalism in copia carbone, e questo renderebbe dubbio il vantaggio a finanziare indiscriminatamente. In generale con queste premesse mi pare difficile la costruzione di un mercato vero e proprio attorno agli LLM. Prevedibilmente la ricerca si concentrerà sulla creazione di /copyright traps/ (analogamente a quanto faceva la defunta industria della cartografia [3]), /canary-tokens/ e /watermarking/ [2] ma tutto questo avrà i suoi inconvenienti e una certa incertezza giuridica, specie quando fosse dubbio l'uso legittimo del materiale originario per costruire il modello. Alberto [1] <https://arxiv.org/pdf/2306.06297> [2] <https://arxiv.org/pdf/2412.03824> [3] <https://en.wikipedia.org/wiki/Agloe,_New_York> On 31/01/25 10:14, Stefano Quintarelli via nexa wrote:
ma direi nemmeno concorrenza sleale. solo violazione dei terms of service che pero' va capito se sono leciti da qualche parte ho letto che deepseek avrebbe usato escamotage per aggirare delle protezioni (rate limiting?) forse cercano di buttarla sulla violazione di TPM, ma (IANAL) AFAIK l'output di un LLM non è protetto da copyright a meno che non ci sia un sostanziale contributo umano. forse cercano che un giudice dica che c'e' ujn sostanziale contributo umano nell'output degli LLM e quindi sono tuttelati e quindi deepseek ha violato misure di protezione ? mi sembra un long shot piu' FUD che altro
On 30/01/25 22:31, GC F wrote:
Se il claim è solo distillazione, così a occhio non può essere violazione di segreto industriale ma solo concorrenza sleale (magari mi sbaglio). Giusto anche l'articolo che ha postato Marco di Lemley. Le lagnanze di OpenAI sono comunque poco sostenibili.
Giancarlo
On Thu, Jan 30, 2025 at 8:52 PM Stefano Quintarelli <stefano@quintarelli.it <mailto:stefano@quintarelli.it>> wrote:
non capisco la questione dataset riseptto alla distillazione puoi espandere, per piacere ?
On 30/01/25 20:53, GC F wrote: > Immagino si lamentino di violazione di segreti industriali (teoricamente > il dataset può essere oggetto di protezione da SI) e competizione > sleale, non di violazione dei diritti autoriali di cui invece si è > discusso molto finora. > > Giancarlo > > On Thu, Jan 30, 2025 at 7:14 AM J.C. DE MARTIN > <juancarlos.demartin@polito.it <mailto:juancarlos.demartin@polito.it> <mailto:juancarlos.demartin@polito.it <mailto:juancarlos.demartin@polito.it>>> > wrote: > > __ > *OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole > From Us* > > /OpenAI shocked that an AI company would train on someone else's > data without permission or compensation./ > > Jason Koebler > > Jan 29, 2025 at 9:43 AM > > The narrative that OpenAI, Microsoft, and freshly minted White House > “AI czar” David Sacks are now pushing to explain why DeepSeek was > able to create a large language model that outpaces OpenAI’s while > spending orders of magnitude less money and using older chips is > that DeepSeek used OpenAI’s data unfairly and without compensation. > Sound familiar? > > Both Bloomberg and the Financial Times are reporting that Microsoft > and OpenAI have been probing whether DeepSeek improperly trained the > R1 model that is taking the AI world by storm on the outputs of > OpenAI models. > > [...] > > continua qui: https://www.404media.co/openai-furious- deepseek-might- <https://www.404media.co/openai-furious-deepseek-might-> > have-stolen-all-the-data-openai-stole-from-us/ <https:// > www.404media.co/openai-furious-deepseek-might-have-stolen-all- the- <http://www.404media.co/openai-furious-deepseek-might-have- stolen-all-the-> > data-openai-stole-from-us/> >
-- You can reach me on Signal: @quinta.01 (no Whatsapp, no Telegram)
participants (6)
-
Alberto Cammozzo -
Enrico Nardelli -
GC F -
J.C. DE MARTIN -
Marco Ricolfi -
Stefano Quintarelli