i modelli cinesi (es Qwen2) vanno benissimo, solo non gli devi fare certe domandine :-)
sarebbe interessante vedere se è facile bucarlo (jailbreak)
anche questo mi sembra (da qualche piccola prova) di ottima fattura, anche per l'italiano
600 e rotti billion parameters non sono pochi per chi voglia scaricarlo e farlo girare 'on premise', però a molti può convenire
paradosso: saranno proprio gli LLM (frutto della ricerca USA) a mettere in crisi il monopolio della Silicon Valley?

G.


On Fri, 27 Dec 2024 at 17:41, Damiano Verzulli <damiano@verzulli.it> wrote:

Confesso di non riuscire a percepirne i dettagli tecnici (l'architettura degli LLM non è la mia specialita').

Pero' la notizia mi pare comunque interessante:

"A Chinese lab has created what appears to be one of the most powerful “open” AI models to date.
The model, DeepSeek V3, was developed by the AI firm DeepSeek and was released on Wednesday under a permissive license that allows developers to download and modify it for most applications, including commercial ones. [...]"

https://techcrunch.com/2024/12/26/deepseeks-new-ai-model-appears-to-be-one-of-the-best-open-challengers-yet/

Aldila' degli aspetti tecnici (che pure mi interesserebbe approfondire...), il piccolo screenshot che mette in evidenza "the downside" mi ha fatto subito riflettere: con questo LLM cinese... il downside si intuisce e si vede istantaneamente. Chissa' che non ve ne siano altri (di "downside", in altri LLM, creati altrove), che non riusciamo a vedere (almeno io...) con altrettanta semplicita'...

Un caro saluto,
DV

-- 
Damiano Verzulli
e-mail: damiano@verzulli.it
---
possible?ok:while(!possible){open_mindedness++}
---
"...I realized that free software would not generate the kind of
income that was needed. Maybe in USA or Europe, you may be able
to get a well paying job as a free software developer, but not
here [in Africa]..." -- Guido Sohne - 1973-2008
   http://ole.kenic.or.ke/pipermail/skunkworks/2008-April/005989.html