Ciao Fabio
Il 13/02/2025 13:00, Fabio Alemagna ha
scritto:
Qui c'è un articolo dei ricercatori di
intelligenza artificiale della Apple che fanno vedere che gli LLM
non riesono a generalizzare fuori dalla distribuzione dei problemi
matematici su cui sono stati allenati
https://arxiv.org/pdf/2410.05229
Visto che DeepSeek si può scaricare e far
girare in locale non dovrebbe essere troppo lungo o complicato
rifare con DeepSeek gli stessi esperimenti citati in
quest'articolo...
Che sia ben chiaro che il senso della mia
osservazione non è "giocare a chi ce l'ha più lungo" (ovviamente
intendo il CV scientifico ... 😂 ) ma solo per ricordare a noi
tutti che stiamo parlando di ricerca scientifica che sta avvenendo
sotto i nostri occhi e sulla quale dovremmo, da ricercatori,
essere molto più critici e dubbiosi rispetto ai markettari che
devono vendere i loro prodotti.
Se gli LLM funzionano davvero il mercato
crescerà significativamente nei prossimi anni. Per adesso mi pare
che stia ancora arrancando o, per lo meno, non ha mantenuto le
promesse iperboliche fatte tra fine 2022 e inizio 2023.
Sicuramente gli LLM avranno un loro
spazio in determinati domìni, sostanzialmente quelli
caratterizzati da un "mondo chiuso" sui quali possono essere
generati sinteticamente dati affidabili da usare per incrementare
la scala di addestramento, ma ritengo che finché gli LLM
vengono usati da soli non saranno in grado di darci nessuna AGI
(Artificial General Intelligence).
Ricercatori internazionali molto più
quotati di me sostengono questa posizione che ritengo del tutto
corretta (ad esempio Francoise Chollet). Il motivo scientifico è
che l'approccio usato dagli LLM non costruisce rappresentazioni
simboliche sulle quali è in grado di ragionare. AlphaGo e
AlphaFold hanno integrato approccio statistico e approccio
simbolico. Se volete leggere le argomentazioni di Chollet le
trovate sinteticamente esposte in questo tweet
https://x.com/fchollet/status/1800577565717148143 e quelli che
seguono.
È assolutamente necessario investire in
ricerca, ma - appunto - una cosa sono ricerca e sviluppo, una cosa
ben diversa l'uso in produzione.
Ciao, Enrico