i modelli cinesi (es Qwen2) vanno benissimo, solo non gli devi fare certe domandine :-) sarebbe interessante vedere se è facile bucarlo (jailbreak) anche questo mi sembra (da qualche piccola prova) di ottima fattura, anche per l'italiano 600 e rotti billion parameters non sono pochi per chi voglia scaricarlo e farlo girare 'on premise', però a molti può convenire paradosso: saranno proprio gli LLM (frutto della ricerca USA) a mettere in crisi il monopolio della Silicon Valley? G. On Fri, 27 Dec 2024 at 17:41, Damiano Verzulli <damiano@verzulli.it> wrote:
Confesso di non riuscire a percepirne i dettagli tecnici (l'architettura degli LLM non è la mia specialita').
Pero' la notizia mi pare comunque interessante:
"A Chinese lab has created what appears to be one of the most powerful “open” AI models to date. The model, DeepSeek V3 <https://huggingface.co/deepseek-ai/DeepSeek-V3>, was developed by the AI firm DeepSeek and was released on Wednesday under a permissive license that allows developers to download and modify it for most applications, including commercial ones. [...]"
https://techcrunch.com/2024/12/26/deepseeks-new-ai-model-appears-to-be-one-o...
Aldila' degli aspetti tecnici (che pure mi interesserebbe approfondire...), il piccolo screenshot che mette in evidenza "the downside" mi ha fatto subito riflettere: con questo LLM cinese... il downside si intuisce e si vede istantaneamente. Chissa' che non ve ne siano altri (di "downside", in altri LLM, creati altrove), che non riusciamo a vedere (almeno io...) con altrettanta semplicita'...
Un caro saluto, DV
-- Damiano Verzulli e-mail: damiano@verzulli.it --- possible?ok:while(!possible){open_mindedness++} --- "...I realized that free software would not generate the kind of income that was needed. Maybe in USA or Europe, you may be able to get a well paying job as a free software developer, but not here [in Africa]..." -- Guido Sohne - 1973-2008 http://ole.kenic.or.ke/pipermail/skunkworks/2008-April/005989.html