Re: [nexa] LLM made-in-China (e reso disponibile)

Dec. 27, 2024


      i modelli cinesi (es Qwen2) vanno benissimo, solo non gli devi fare certe
domandine :-)
sarebbe interessante vedere se è facile bucarlo (jailbreak)
anche questo mi sembra (da qualche piccola prova) di ottima fattura, anche
per l'italiano
600 e rotti billion parameters non sono pochi per chi voglia scaricarlo e
farlo girare 'on premise', però a molti può convenire
paradosso: saranno proprio gli LLM (frutto della ricerca USA) a mettere in
crisi il monopolio della Silicon Valley?

G.


On Fri, 27 Dec 2024 at 17:41, Damiano Verzulli <damiano@verzulli.it> wrote:
...
Confesso di non riuscire a percepirne i dettagli tecnici (l'architettura
degli LLM non è la mia specialita').
Pero' la notizia mi pare comunque interessante:
"A Chinese lab has created what appears to be one of the most powerful
“open” AI models to date.
The model, DeepSeek V3 <https://huggingface.co/deepseek-ai/DeepSeek-V3>,
was developed by the AI firm DeepSeek and was released on Wednesday under a
permissive license that allows developers to download and modify it for
most applications, including commercial ones. [...]"
https://techcrunch.com/2024/12/26/deepseeks-new-ai-model-appears-to-be-one-o...
Aldila' degli aspetti tecnici (che pure mi interesserebbe
approfondire...), il piccolo screenshot che mette in evidenza "the
downside" mi ha fatto subito riflettere: con questo LLM cinese... il
downside si intuisce e si vede istantaneamente. Chissa' che non ve ne siano
altri (di "downside", in altri LLM, creati altrove), che non riusciamo a
vedere (almeno io...) con altrettanta semplicita'...
Un caro saluto,
DV
--
Damiano Verzulli
e-mail: damiano@verzulli.it
---
possible?ok:while(!possible){open_mindedness++}
---
"...I realized that free software would not generate the kind of
income that was needed. Maybe in USA or Europe, you may be able
to get a well paying job as a free software developer, but not
here [in Africa]..." -- Guido Sohne - 1973-2008
   http://ole.kenic.or.ke/pipermail/skunkworks/2008-April/005989.html

Re: [nexa] LLM made-in-China (e reso disponibile)

Guido Vetere