Re: [nexa] i language model alle prove INVALSI

July 30, 2024

      Certo Guido,

On Tue, 30 Jul 2024 12:00:05 Guido Vetere wrote:
...
quando i modelli multilingua di Meta, DeepMind e Mistral sui
benchmark italiani vanno al doppio di quelli 'autarchici', 
qualcosa dovrà pur dire
vuol semplicemente dire che Meta, DeepMind e Mistral hanno incluso
migliaia di quiz e test a risposta multipla nella base dati utilizzata
per programmare statisticamente i propri software.

La cosa ti sorprende?

E' da un po' che va avanti:
https://www.businessinsider.com/list-here-are-the-exams-chatgpt-has-passed-s...
https://www.ama-assn.org/practice-management/digital/chatgpt-passed-usmle-wh...
https://edition.cnn.com/2023/01/26/tech/chatgpt-passes-exams/index.html

Ora, per quanto restii a smettere di parlare di "intelligenza
artificiale" e stronzate simili, i ricercatori che hanno programmato i
"modelli" che tu chiami "autarchici" non hanno come obbiettivo primario
buttare fumo negli occhi agli sprovveduti che non sanno come funziona
un LLM ed è dunque prevedibile che non avranno ottimizzato
particolarmente simili "imitation games".

Giacomo

Re: [nexa] i language model alle prove INVALSI

Giacomo Tesio