Pappagalli stocastici: Alberto Puliafito sulle precisazioni di Emily Bender in merito.

newer
Mythos 'Discovered' a CVE Already...

older
Illusions of Understanding from...

Fabio Alemagna

May 13, 2026

10:43 p.m.

Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/ _______________ 🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali. Ma andiamo con ordine. La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni. La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica. La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto. La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way". Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso. Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model. Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale. La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco. Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere. Link: 1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/ 2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 ) 3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... ) 4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E

Attachments:

attachment.html (text/html — 4.6 KB)

Show replies by date

Franco Marra

May 14, 2026

5:12 a.m.

Infatti noi del Laboratorio Popolare di Intelligenza Artificiale, corso per anziani tenuto per lo SPI-CGIL Lega 8 alla Casa del Quartiere di San Salvario, chiamiamo gli LLM 'Chiromanti Stocastiche' https://www.labpopia.it/come-si-usa/uso-consapevole#h.9igg9c1ilsvn Il giorno gio 14 mag 2026 alle ore 00:46 Fabio Alemagna via nexa < nexa@server-nexa.polito.it> ha scritto:

...

Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/

_______________

🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali.

Ma andiamo con ordine.

La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni.

La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica.

La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto.

La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way".

Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso.

Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model.

Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale.

La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco.

Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere.

Link:

1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/

2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 )

3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... )

4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E

Massimo Ghisalberti

5:25 a.m.

Come detto moltissime volte e dall'inizio (non qui ma chi mi conosce sa) le argomentazioni comuni sia a favore che contro non hanno fatto altro che portare acqua al mulino AI. Pappagalli stocastici era una falsità dall'inizio. Siccome però noi tutti siamo inclini alla fuffa ci è piaciuta la definizione come le tante altre pro o contro. Sono quelle definizioni che ci fanno sentire intelligenti e non esclusi dalla materia. -- massimo

Guido Vetere

6:08 a.m.

Tempo fa avevo proposto di chiamarli “corvi epistemici”: "A differenza del pappagallo, il corvo non ripete: osserva, intuisce, pianifica, ma con una ragione opaca al nostro sguardo. Nella celebre poesia che ne porta il nome, Edgar Allan Poe paragona il corvo a un “demone che sogna”. Esso dice una sola parola: nevermore — mai più. Anche i corvi epistemici oggi ci dicono che nulla sarà più come prima. Ma come per ogni profezia che si rispetti, il destino si gioca nella sua interpretazione.” Qui l’articolo: https://guidovetere.nova100.ilsole24ore.com/2025/07/17/corvi-epistemici/ Corvi epistemici - Cervelli nella vasca nova100.ilsole24ore.com

...

Il giorno 14 mag 2026, alle ore 07:25, Massimo Ghisalberti via nexa <nexa@server-nexa.polito.it> ha scritto:

Come detto moltissime volte e dall'inizio (non qui ma chi mi conosce sa) le argomentazioni comuni sia a favore che contro non hanno fatto altro che portare acqua al mulino AI. Pappagalli stocastici era una falsità dall'inizio. Siccome però noi tutti siamo inclini alla fuffa ci è piaciuta la definizione come le tante altre pro o contro. Sono quelle definizioni che ci fanno sentire intelligenti e non esclusi dalla materia.

-- massimo

Massimo Maria Ghisalberti

7:26 a.m.

Perdonate l'ardire, ma non sono riuscito a resistere ed è uscito l'imbecille che è in me: https://items.minimals.org/anzu/p/1778743300.998532 -- massimo Il giorno gio, 14/05/2026 alle 08.08 +0200, Guido Vetere via nexa ha scritto:

...

Tempo fa avevo proposto di chiamarli “corvi epistemici”: "A differenza del pappagallo, il corvo non ripete: osserva, intuisce, pianifica, ma con una ragione opaca al nostro sguardo. Nella celebre poesia che ne porta il nome, Edgar Allan Poe paragona il corvo a un “demone che sogna”. Esso dice una sola parola: nevermore — mai più. Anche i corvi epistemici oggi ci dicono che nulla sarà più come prima. Ma come per ogni profezia che si rispetti, il destino si gioca nella sua interpretazione.” Qui l’articolo: craiyon_161147_2_crows_friends_with_a_robot_in_the_desert__Edward_gorey.png Corvi epistemici - Cervelli nella vasca nova100.ilsole24ore.com

Stefano Borroni Barale

7:21 a.m.

Sarà che sono eretico, disertore, disfattista e... femminista, ma non riesco a non notare che, caso certamente fortuito (!!), l'idea dei Pappagalli Stocastici viene da una donna, Emily Bender, mentre le critiche sempre più insistenti, furibonde, con la bava alla bocca, scomposte... arrivano tutte da maschi. Forse un'idea del perché ce la dà l'ottimo Marco Paolini: Il sentimento delle mamme si chiamava: «Povera Longaron, povera Longaron, povera Longarone». Era un sentimento per fondamenta: fondamenta senza muri che venivano su in mezzo alla ghiaia del Piave che aveva riempito tutta la valle, e a noi bambini avevano spiegato che sotto quei sassi c’erano ancora i morti, perché non li avevano trovati tutti. E allora io avevo questo sentimento disciplinato a nome «Povera Longaron, povera Longaron, povera Longarone». Però io, bambino, non potevo fare a meno di avere anche un altro sentimento: quello dei papà, per la diga. Perché era rimasta su. E io, bambino, pensavo: «Ma insomma… la montagna è cascata, ma la diga ha tenuto! Il suo dovere l’ha fatto. Se fosse cascata la diga, sarebbe andata peggio, no?». E allora un po’ di consolazione ti resta dentro. Con questa consolazione qua si diventa grandi. Anche perché poi i maschi… Guardali, a una certa età dello sviluppo, noi maschi, tutti, davanti a una diga, tutti là: impiantati. Come davanti a una portaerei, là! Guardaci, noi maschi, a una certa età dello sviluppo, davanti a una portaerei… Sempre tutti là: impiantati! E non c’entra niente che poi da grande diventi anche pacifista, e magari fai l’obiettore di coscienza. Non c’entra niente. È che a un certo stadio dello sviluppo, se vedi la portaerei, qualcosa dentro lo senti… È che si intuisce che là dentro c’è qualcosa, no? E cosa c’è? C’è il segreto del progresso. È il sentimento dei papà. È da Ulisse che ce lo insegnano: «Vai, piccolo!». Spingersi avanti, imparare, oltre le colonne d’Ercole… «Guarda, guarda l’aereo che decolla…». Man mano che cresci te lo ficcano nel cervello: «Papà, mi porti all’aeroporto?». AVANZARE, CONQUISTARE Diamoci una calmata, noi maschietti, va. Che ci fa bene. E magari viviamo anche meglio. Stefano P.S.: Si, io fisico rispondo con la letteratura, perché questo dibattito da troppi giorni si è spostato su un territorio che con la scienza non ha più nulla a che fare, come notava Carlo qualche giorno fa. Il 14/05/26 00:43, Fabio Alemagna via nexa ha scritto:

...

Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/

_______________

🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali.

Ma andiamo con ordine.

La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni.

La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica.

La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto.

La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way".

Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso.

Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model.

Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale.

La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco.

Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere.

Link:

1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/

2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 )

3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... )

4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E

Enrico Nardelli

May 15, 2026

6:08 p.m.

Ritengo doveroso articolare una riflessione. Il post della Bender https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... dice: /in Bender and Koller 2020 ... we provide a definition of understanding as mapping from language to something outside of language, and show that systems built only with linguistic form have no purchase with which to encode (“learn”) such a mapping. / Ovvero: Definiamo comprensione come una corrispondenza tra linguaggio e qualcosa fuori il linguaggio. Un sistema addestrato solo sulle forme linguistiche non ha modo di codificare questa corrispondenza. Dopo di che dice: /Stochastic parrots was coined to refer to language models, i.e. systems trained only on linguistic form used to mimic the kinds of sequences of linguistic form that people use./ Ovvero: Il termine "pappagalli stocastici" si riferiva ai sistemi addestrati sulle forme linguistiche che imitano quelle che usano le persone. E poi dice ancora, e qui c'è l'espressione che si pensa scardini tutto: /It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020, albeit in an extremely thin way/. Ovvero: si può sostenere che un modello misto con testo e immagini, che mette in corrispondenza testi con immagini o viceversa, risponda alla nostra definizione di comprensione, anche se in un modo estremamente sottile. E poi continua: /When we look at the text in an image/text model, we make sense of it in a way that is rich and socially situated and we must not project that onto the model if we want to keep a clear-eyed view of how such models actually function (and in what circumstances we should be willing to use them)/. Ovvero: quando noi guardiamo il testo di un modello misto con testo e immagini, lo comprendiamo in modo ricco e socialmente situato, che non deve essere proiettato sul modello, se vogliamo mantenere una visione chiara su come il modello funziona effettivamente E infine: /Even if there is some thin kind of technical “understanding” in e.g. a text/image model, the fact that it’s using our language at all will send misleading signals about what is actually going on, so long as we relate to language as we always do (and I don’t see how we can avoid doing so)/. Ovvero: anche se c'è una esile forma di "comprensione" in senso tecnico in un modello misto con testo e immagini, il semplice fatto che usi il nostro linguaggio ci manda segnali fuorvianti su ciò che sta accadendo, finché noi ci relazioniamo al linguaggio come sempre facciamo (e non vedo come potremmo fare diversamente) Ecco, leggendo questi passi tutti insieme e non estraendo solo la frase "risponde alla nostra definizione di comprensione", si capisce che l'accoppiamento fra testo e immagine rientra da un punto di vista sintattico (/in an estremely thin way/ - direi per un capello) nella definizione tecnica di comprensione della Bender, ma non è la comprensione umana. Notate che dice che siamo NOI che lo comprendiamo (/we make a sense of it/) sulla base della nostra esperienza. Infatti, questo "qualcosa fuori il linguaggio" della definizione è l'intento comunicativo del parlante, che è basato sul mondo reale che parlante e ascoltatore condividono (/the communicative intent is grounded in the real world the speaker and listener inhabit together/). Se si legge con attenzione l'articolo di Bender & Koller del 2020 citato nel post della Bender (https://www.aclweb.org/anthology/2020.acl-main.463/ - cosa che vi invito a fare, è abbastanza accessibile) tutto questo è molto chiaro, così come la tesi principale di quell'articolo, che rimane interamente salda e non scalfita. /We argue that the language modeling task, because it only uses form as training data, cannot in principle lead to learning of meaning. ... We take (linguistic) meaning to be the relation between a linguistic form and communicative intent/. Certo, uno può leggere nel recente post della Bender quello che vuole, ma argomentare trionfanti che "è una retromarcia bella grossa" mi sembra esagerato. Questo non vuol ovviamente dire che progressi nella ricerca e nelle architetture dei sistemi di IA non potranno darci in futuro una qualche forma di comprensione, che con le attuali architetture non c'è. Ciao, Enrico Il 14/05/2026 00:43, Fabio Alemagna via nexa ha scritto:

...

Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/

_______________

🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali.

Ma andiamo con ordine.

La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni.

La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica.

La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto.

La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way".

Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso.

Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model.

Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale.

La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco.

Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere.

Link:

1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/

2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 )

3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... )

4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E --

-- EN https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ====================================================================================================== --

abregni

6:41 p.m.

Vorrei capire di cosa stiamo parlando... Io sono fermo a "La scorciatoia" di Cristianini: fallita l'AGI, hanno fatto gli LLM. Bene. PUNTO. Perché vogliamo filosofeggiarci sopra...? NOI -- nell'output di un LLM -- ci leggiamo un significato. E' UMANO (a me riesce arduo leggere senza trovarne uno: mi irrito), ...e ho persino gestito gruppi creativi, dove il linguaggio creava interessanti associazioni che NON erano -- almeno consapevolmente -- nella mente di chi parlava, ma le "leggeva" chi ascoltava. Questo cestina -- mi scuso con Giacomo -- il suo parzialissimo modello di comunicazione (e, ancor prima, di informazione: non di rado è come la bellezza: negli occhi di chi guarda, ...qui di chi legge), ed è forse l'unico vero valore degli LLM: **darci materiale**. Finiamola li. Non mi sogno neanche di "ipotizzare" che "insegnino" (già è difficile farlo bene per gli umani), MA fornire un quadro strutturato in modo ragionevole su qualche argomento, ...perché no? La filosofia -- checché se ne dica -- sforna solo opinioni (...e le manca pure il cestino dove buttarle quando hanno poco senso: continuiamo a raccontarcele *tutte*). Appena sento la parola "ontologia" in ambito informatico (e non in becero senso tecnico, che mi rimane comunque insopportabile), ...reagisco. Scusate, ma temo che lo sfogo sia dovuto. Il 2026-05-15 20:08 Enrico Nardelli via nexa ha scritto:

...

Ritengo doveroso articolare una riflessione.

Il post della Bender

https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... dice: in Bender and Koller 2020 ... we provide a definition of understanding as mapping from language to something outside of language, and show that systems built only with linguistic form have no purchase with which to encode (“learn”) such a mapping.

Ovvero: Definiamo comprensione come una corrispondenza tra linguaggio e qualcosa fuori il linguaggio. Un sistema addestrato solo sulle forme linguistiche non ha modo di codificare questa corrispondenza.

Dopo di che dice: _Stochastic parrots was coined to refer to language models, i.e. systems trained only on linguistic form used to mimic the kinds of sequences of linguistic form that people use._

Ovvero: Il termine "pappagalli stocastici" si riferiva ai sistemi addestrati sulle forme linguistiche che imitano quelle che usano le persone.

E poi dice ancora, e qui c'è l'espressione che si pensa scardini tutto: _It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020, albeit in an extremely thin way_.

Ovvero: si può sostenere che un modello misto con testo e immagini, che mette in corrispondenza testi con immagini o viceversa, risponda alla nostra definizione di comprensione, anche se in un modo estremamente sottile.

E poi continua: _When we look at the text in an image/text model, we make sense of it in a way that is rich and socially situated and we must not project that onto the model if we want to keep a clear-eyed view of how such models actually function (and in what circumstances we should be willing to use them)_.

Ovvero: quando noi guardiamo il testo di un modello misto con testo e immagini, lo comprendiamo in modo ricco e socialmente situato, che non deve essere proiettato sul modello, se vogliamo mantenere una visione chiara su come il modello funziona effettivamente

E infine: _Even if there is some thin kind of technical “understanding” in e.g. a text/image model, the fact that it’s using our language at all will send misleading signals about what is actually going on, so long as we relate to language as we always do (and I don’t see how we can avoid doing so)_.

Ovvero: anche se c'è una esile forma di "comprensione" in senso tecnico in un modello misto con testo e immagini, il semplice fatto che usi il nostro linguaggio ci manda segnali fuorvianti su ciò che sta accadendo, finché noi ci relazioniamo al linguaggio come sempre facciamo (e non vedo come potremmo fare diversamente)

Ecco, leggendo questi passi tutti insieme e non estraendo solo la frase "risponde alla nostra definizione di comprensione", si capisce che l'accoppiamento fra testo e immagine rientra da un punto di vista sintattico (_in an estremely thin way_ - direi per un capello) nella definizione tecnica di comprensione della Bender, ma non è la comprensione umana. Notate che dice che siamo NOI che lo comprendiamo (_we make a sense of it_) sulla base della nostra esperienza. Infatti, questo "qualcosa fuori il linguaggio" della definizione è l'intento comunicativo del parlante, che è basato sul mondo reale che parlante e ascoltatore condividono (_the communicative intent is grounded in the real world the speaker and listener inhabit together_).

Se si legge con attenzione l'articolo di Bender & Koller del 2020 citato nel post della Bender (https://www.aclweb.org/anthology/2020.acl-main.463/ - cosa che vi invito a fare, è abbastanza accessibile) tutto questo è molto chiaro, così come la tesi principale di quell'articolo, che rimane interamente salda e non scalfita. _We argue that the language modeling task, because it only uses form as training data, cannot in principle lead to learning of meaning. ... We take (linguistic) meaning to be the relation between a linguistic form and communicative intent_.

Certo, uno può leggere nel recente post della Bender quello che vuole, ma argomentare trionfanti che "è una retromarcia bella grossa" mi sembra esagerato.

Questo non vuol ovviamente dire che progressi nella ricerca e nelle architetture dei sistemi di IA non potranno darci in futuro una qualche forma di comprensione, che con le attuali architetture non c'è.

Ciao, Enrico

Il 14/05/2026 00:43, Fabio Alemagna via nexa ha scritto:

...
Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/

_______________

🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali.

Ma andiamo con ordine.

La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni.

La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica.

La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto.

La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way".

Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso.

Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model.

Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale.

La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco.

Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere.

Link:

1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/

2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 )

3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender,

https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q...

...
)

4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E

-- -- EN https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html

====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ======================================================================================================

--

Roberto Dolci

7:01 p.m.

Ciao Enrico Mi pare una definizione molto stretta: noi comprendiamo la musica, il movimento, gli odori, le sensazioni tattili, ben al di fuori di qualsiasi costrutto verbale linguistico. Il bimbo di 4 anni ha gia' assorbito una quantita' enorme di informazioni e s'e' ricreato bene quei modelli del mondo che ora Yann LeCun sta provando a rifare con la sua startup, e Gary Marcus predica da anni. Ciao Roberto ________________________________ From: Enrico Nardelli via nexa <nexa@server-nexa.polito.it> Sent: Friday, May 15, 2026 14:08 To: nexa@server-nexa.polito.it <nexa@server-nexa.polito.it> Subject: [nexa] Re: Pappagalli stocastici: Alberto Puliafito sulle precisazioni di Emily Bender in merito. Ritengo doveroso articolare una riflessione. Il post della Bender https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-questions-49c2e7d22d11<https://eu-west-1.protection.sophos.com?d=medium.com&u=aHR0cHM6Ly9tZWRpdW0uY29tL0BlbWlseW1lbm9uYmVuZGVyL3N0b2NoYXN0aWMtcGFycm90cy1mcmVxdWVudGx5LXVuYXNrZWQtcXVlc3Rpb25zLTQ5YzJlN2QyMmQxMQ==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=ZUc5R2JvcTBpcWJRKzErdm5jOUkvUlorQlpWMU1aT3pzejlBbit0Y2VnYz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> dice: in Bender and Koller 2020 ... we provide a definition of understanding as mapping from language to something outside of language, and show that systems built only with linguistic form have no purchase with which to encode (“learn”) such a mapping. Ovvero: Definiamo comprensione come una corrispondenza tra linguaggio e qualcosa fuori il linguaggio. Un sistema addestrato solo sulle forme linguistiche non ha modo di codificare questa corrispondenza. Dopo di che dice: Stochastic parrots was coined to refer to language models, i.e. systems trained only on linguistic form used to mimic the kinds of sequences of linguistic form that people use. Ovvero: Il termine "pappagalli stocastici" si riferiva ai sistemi addestrati sulle forme linguistiche che imitano quelle che usano le persone. E poi dice ancora, e qui c'è l'espressione che si pensa scardini tutto: It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020, albeit in an extremely thin way. Ovvero: si può sostenere che un modello misto con testo e immagini, che mette in corrispondenza testi con immagini o viceversa, risponda alla nostra definizione di comprensione, anche se in un modo estremamente sottile. E poi continua: When we look at the text in an image/text model, we make sense of it in a way that is rich and socially situated and we must not project that onto the model if we want to keep a clear-eyed view of how such models actually function (and in what circumstances we should be willing to use them). Ovvero: quando noi guardiamo il testo di un modello misto con testo e immagini, lo comprendiamo in modo ricco e socialmente situato, che non deve essere proiettato sul modello, se vogliamo mantenere una visione chiara su come il modello funziona effettivamente E infine: Even if there is some thin kind of technical “understanding” in e.g. a text/image model, the fact that it’s using our language at all will send misleading signals about what is actually going on, so long as we relate to language as we always do (and I don’t see how we can avoid doing so). Ovvero: anche se c'è una esile forma di "comprensione" in senso tecnico in un modello misto con testo e immagini, il semplice fatto che usi il nostro linguaggio ci manda segnali fuorvianti su ciò che sta accadendo, finché noi ci relazioniamo al linguaggio come sempre facciamo (e non vedo come potremmo fare diversamente) Ecco, leggendo questi passi tutti insieme e non estraendo solo la frase "risponde alla nostra definizione di comprensione", si capisce che l'accoppiamento fra testo e immagine rientra da un punto di vista sintattico (in an estremely thin way - direi per un capello) nella definizione tecnica di comprensione della Bender, ma non è la comprensione umana. Notate che dice che siamo NOI che lo comprendiamo (we make a sense of it) sulla base della nostra esperienza. Infatti, questo "qualcosa fuori il linguaggio" della definizione è l'intento comunicativo del parlante, che è basato sul mondo reale che parlante e ascoltatore condividono (the communicative intent is grounded in the real world the speaker and listener inhabit together). Se si legge con attenzione l'articolo di Bender & Koller del 2020 citato nel post della Bender (https://www.aclweb.org/anthology/2020.acl-main.463/<https://eu-west-1.protection.sophos.com?d=aclweb.org&u=aHR0cHM6Ly93d3cuYWNsd2ViLm9yZy9hbnRob2xvZ3kvMjAyMC5hY2wtbWFpbi40NjMv&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=bUpjakYzcGFFTXM3c1dBZUlzMkFzZDhoUkcvR3Z5c2hCQm9XeitaVXBDcz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> - cosa che vi invito a fare, è abbastanza accessibile) tutto questo è molto chiaro, così come la tesi principale di quell'articolo, che rimane interamente salda e non scalfita. We argue that the language modeling task, because it only uses form as training data, cannot in principle lead to learning of meaning. ... We take (linguistic) meaning to be the relation between a linguistic form and communicative intent. Certo, uno può leggere nel recente post della Bender quello che vuole, ma argomentare trionfanti che "è una retromarcia bella grossa" mi sembra esagerato. Questo non vuol ovviamente dire che progressi nella ricerca e nelle architetture dei sistemi di IA non potranno darci in futuro una qualche forma di comprensione, che con le attuali architetture non c'è. Ciao, Enrico Il 14/05/2026 00:43, Fabio Alemagna via nexa ha scritto: Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/<https://eu-west-1.protection.sophos.com?d=facebook.com&u=aHR0cHM6Ly93d3cuZmFjZWJvb2suY29tL3NoYXJlL3AvMThraXVkTlFxSy8=&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=NGdCYzl1aTRFNEt5aTY3UGFQQ0YySHNKWExWZ3FVYTRnL3NZZTM3Z01FTT0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> _______________ 🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali. Ma andiamo con ordine. La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni. La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica. La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto. La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way". Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso. Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model. Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale. La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco. Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere. Link: 1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/<https://eu-west-1.protection.sophos.com?d=aclanthology.org&u=aHR0cHM6Ly9hY2xhbnRob2xvZ3kub3JnLzIwMjAuYWNsLW1haW4uNDYzLw==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=T3I3Ymt2Vi9TRjdrc0VLazRObkt6MW1tekZiengwd1BtUXRoQTBtYzBEbz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> 2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922<https://eu-west-1.protection.sophos.com?d=acm.org&u=aHR0cHM6Ly9kbC5hY20ub3JnL2RvaS8xMC4xMTQ1LzM0NDIxODguMzQ0NTkyMg==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=emJZZy9OYjVQd2NwMi9yaXh4d3lFUVZkd3dUT1F2L1lib21xaTY3MHRhND0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> ) 3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-questions-49c2e7d22d11<https://eu-west-1.protection.sophos.com?d=medium.com&u=aHR0cHM6Ly9tZWRpdW0uY29tL0BlbWlseW1lbm9uYmVuZGVyL3N0b2NoYXN0aWMtcGFycm90cy1mcmVxdWVudGx5LXVuYXNrZWQtcXVlc3Rpb25zLTQ5YzJlN2QyMmQxMQ==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=ZUc5R2JvcTBpcWJRKzErdm5jOUkvUlorQlpWMU1aT3pzejlBbit0Y2VnYz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> ) 4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E<https://eu-west-1.protection.sophos.com?d=youtube.com&u=aHR0cHM6Ly93d3cueW91dHViZS5jb20vd2F0Y2g_dj1mNE9aN0IyaVBfRQ==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=dTNJZExMdlNQTlk2ZmxvVDczc3YvbWhOS0hFdnhxR0JlMWhXY3F5d3h5az0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> -- -- EN https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html<https://eu-west-1.protection.sophos.com?d=hoepli.it&u=aHR0cHM6Ly93d3cuaG9lcGxpLml0L2xpYnJvL2xhLXJpdm9sdXppb25lLWluZm9ybWF0aWNhLzk3ODg4OTYwNjk1MTYuaHRtbA==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=YkdPZC9KN1ZtZUNkV25XbDNpL0RaUzJKazV1VEZzaTVtU2RlTHBwYlJnOD0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> [cid:072daaf5-7a33-4e50-81b2-2df43773bf0f] ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/<https://eu-west-1.protection.sophos.com?d=blogspot.it&u=aHR0cHM6Ly9saW5rLWFuZC10aGluay5ibG9nc3BvdC5pdC8=&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=QnlmRjM3dTVVcDdnK2lHS0oxbFBOTzhXcngwNlUvYmszb09BRnVYeDBVRT0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont<https://eu-west-1.protection.sophos.com?d=garr.it&u=aHR0cHM6Ly9ibHVlLm1lZXQuZ2Fyci5pdC9iL2Vuci15N2YtdDBxLW9udA==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=K0dpdDB3ekRWV1FDclVpTXM5VmpZNkdWMjB6NDJ3K2ZPbjArcGJ5QzExRT0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> ====================================================================================================== --

Daniela Tafani

8:11 p.m.

New subject: R: Re: Pappagalli stocastici: Alberto Puliafito sulle precisazioni di Emily Bender in merito.

...

Da: Roberto Dolci via nexa <nexa@server-nexa.polito.it> Mi pare una definizione molto stretta: noi comprendiamo la musica, il movimento, gli odori, le sensazioni tattili, ben al di fuori di qualsiasi costrutto verbale linguistico.

Ma l'articolo in oggetto si occupava della comprensione del linguaggio, non della comprensione tout court. ________________________________ From: Enrico Nardelli via nexa <nexa@server-nexa.polito.it> Sent: Friday, May 15, 2026 14:08 To: nexa@server-nexa.polito.it <nexa@server-nexa.polito.it> Subject: [nexa] Re: Pappagalli stocastici: Alberto Puliafito sulle precisazioni di Emily Bender in merito. Ritengo doveroso articolare una riflessione. Il post della Bender https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... dice: in Bender and Koller 2020 ... sophospsmartbannerend Ritengo doveroso articolare una riflessione. Il post della Bender https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-questions-49c2e7d22d11<https://eu-west-1.protection.sophos.com?d=medium.com&u=aHR0cHM6Ly9tZWRpdW0uY29tL0BlbWlseW1lbm9uYmVuZGVyL3N0b2NoYXN0aWMtcGFycm90cy1mcmVxdWVudGx5LXVuYXNrZWQtcXVlc3Rpb25zLTQ5YzJlN2QyMmQxMQ==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=ZUc5R2JvcTBpcWJRKzErdm5jOUkvUlorQlpWMU1aT3pzejlBbit0Y2VnYz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> dice: in Bender and Koller 2020 ... we provide a definition of understanding as mapping from language to something outside of language, and show that systems built only with linguistic form have no purchase with which to encode (“learn”) such a mapping. Ovvero: Definiamo comprensione come una corrispondenza tra linguaggio e qualcosa fuori il linguaggio. Un sistema addestrato solo sulle forme linguistiche non ha modo di codificare questa corrispondenza. Dopo di che dice: Stochastic parrots was coined to refer to language models, i.e. systems trained only on linguistic form used to mimic the kinds of sequences of linguistic form that people use. Ovvero: Il termine "pappagalli stocastici" si riferiva ai sistemi addestrati sulle forme linguistiche che imitano quelle che usano le persone. E poi dice ancora, e qui c'è l'espressione che si pensa scardini tutto: It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020, albeit in an extremely thin way. Ovvero: si può sostenere che un modello misto con testo e immagini, che mette in corrispondenza testi con immagini o viceversa, risponda alla nostra definizione di comprensione, anche se in un modo estremamente sottile. E poi continua: When we look at the text in an image/text model, we make sense of it in a way that is rich and socially situated and we must not project that onto the model if we want to keep a clear-eyed view of how such models actually function (and in what circumstances we should be willing to use them). Ovvero: quando noi guardiamo il testo di un modello misto con testo e immagini, lo comprendiamo in modo ricco e socialmente situato, che non deve essere proiettato sul modello, se vogliamo mantenere una visione chiara su come il modello funziona effettivamente E infine: Even if there is some thin kind of technical “understanding” in e.g. a text/image model, the fact that it’s using our language at all will send misleading signals about what is actually going on, so long as we relate to language as we always do (and I don’t see how we can avoid doing so). Ovvero: anche se c'è una esile forma di "comprensione" in senso tecnico in un modello misto con testo e immagini, il semplice fatto che usi il nostro linguaggio ci manda segnali fuorvianti su ciò che sta accadendo, finché noi ci relazioniamo al linguaggio come sempre facciamo (e non vedo come potremmo fare diversamente) Ecco, leggendo questi passi tutti insieme e non estraendo solo la frase "risponde alla nostra definizione di comprensione", si capisce che l'accoppiamento fra testo e immagine rientra da un punto di vista sintattico (in an estremely thin way - direi per un capello) nella definizione tecnica di comprensione della Bender, ma non è la comprensione umana. Notate che dice che siamo NOI che lo comprendiamo (we make a sense of it) sulla base della nostra esperienza. Infatti, questo "qualcosa fuori il linguaggio" della definizione è l'intento comunicativo del parlante, che è basato sul mondo reale che parlante e ascoltatore condividono (the communicative intent is grounded in the real world the speaker and listener inhabit together). Se si legge con attenzione l'articolo di Bender & Koller del 2020 citato nel post della Bender (https://www.aclweb.org/anthology/2020.acl-main.463/<https://eu-west-1.protection.sophos.com?d=aclweb.org&u=aHR0cHM6Ly93d3cuYWNsd2ViLm9yZy9hbnRob2xvZ3kvMjAyMC5hY2wtbWFpbi40NjMv&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=bUpjakYzcGFFTXM3c1dBZUlzMkFzZDhoUkcvR3Z5c2hCQm9XeitaVXBDcz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> - cosa che vi invito a fare, è abbastanza accessibile) tutto questo è molto chiaro, così come la tesi principale di quell'articolo, che rimane interamente salda e non scalfita. We argue that the language modeling task, because it only uses form as training data, cannot in principle lead to learning of meaning. ... We take (linguistic) meaning to be the relation between a linguistic form and communicative intent. Certo, uno può leggere nel recente post della Bender quello che vuole, ma argomentare trionfanti che "è una retromarcia bella grossa" mi sembra esagerato. Questo non vuol ovviamente dire che progressi nella ricerca e nelle architetture dei sistemi di IA non potranno darci in futuro una qualche forma di comprensione, che con le attuali architetture non c'è. Ciao, Enrico Il 14/05/2026 00:43, Fabio Alemagna via nexa ha scritto: Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/<https://eu-west-1.protection.sophos.com?d=facebook.com&u=aHR0cHM6Ly93d3cuZmFjZWJvb2suY29tL3NoYXJlL3AvMThraXVkTlFxSy8=&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=NGdCYzl1aTRFNEt5aTY3UGFQQ0YySHNKWExWZ3FVYTRnL3NZZTM3Z01FTT0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> _______________ 🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali. Ma andiamo con ordine. La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni. La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica. La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto. La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way". Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso. Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model. Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale. La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco. Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere. Link: 1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/<https://eu-west-1.protection.sophos.com?d=aclanthology.org&u=aHR0cHM6Ly9hY2xhbnRob2xvZ3kub3JnLzIwMjAuYWNsLW1haW4uNDYzLw==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=T3I3Ymt2Vi9TRjdrc0VLazRObkt6MW1tekZiengwd1BtUXRoQTBtYzBEbz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> 2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922<https://eu-west-1.protection.sophos.com?d=acm.org&u=aHR0cHM6Ly9kbC5hY20ub3JnL2RvaS8xMC4xMTQ1LzM0NDIxODguMzQ0NTkyMg==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=emJZZy9OYjVQd2NwMi9yaXh4d3lFUVZkd3dUT1F2L1lib21xaTY3MHRhND0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> ) 3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-questions-49c2e7d22d11<https://eu-west-1.protection.sophos.com?d=medium.com&u=aHR0cHM6Ly9tZWRpdW0uY29tL0BlbWlseW1lbm9uYmVuZGVyL3N0b2NoYXN0aWMtcGFycm90cy1mcmVxdWVudGx5LXVuYXNrZWQtcXVlc3Rpb25zLTQ5YzJlN2QyMmQxMQ==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=ZUc5R2JvcTBpcWJRKzErdm5jOUkvUlorQlpWMU1aT3pzejlBbit0Y2VnYz0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> ) 4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E<https://eu-west-1.protection.sophos.com?d=youtube.com&u=aHR0cHM6Ly93d3cueW91dHViZS5jb20vd2F0Y2g_dj1mNE9aN0IyaVBfRQ==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=dTNJZExMdlNQTlk2ZmxvVDczc3YvbWhOS0hFdnhxR0JlMWhXY3F5d3h5az0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> -- -- EN https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html<https://eu-west-1.protection.sophos.com?d=hoepli.it&u=aHR0cHM6Ly93d3cuaG9lcGxpLml0L2xpYnJvL2xhLXJpdm9sdXppb25lLWluZm9ybWF0aWNhLzk3ODg4OTYwNjk1MTYuaHRtbA==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=YkdPZC9KN1ZtZUNkV25XbDNpL0RaUzJKazV1VEZzaTVtU2RlTHBwYlJnOD0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> [cid:072daaf5-7a33-4e50-81b2-2df43773bf0f] ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/<https://eu-west-1.protection.sophos.com?d=blogspot.it&u=aHR0cHM6Ly9saW5rLWFuZC10aGluay5ibG9nc3BvdC5pdC8=&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=QnlmRjM3dTVVcDdnK2lHS0oxbFBOTzhXcngwNlUvYmszb09BRnVYeDBVRT0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont<https://eu-west-1.protection.sophos.com?d=garr.it&u=aHR0cHM6Ly9ibHVlLm1lZXQuZ2Fyci5pdC9iL2Vuci15N2YtdDBxLW9udA==&i=NjUwODJhZTVlMDVkNmYyNDlkNTNjOTcy&t=K0dpdDB3ekRWV1FDclVpTXM5VmpZNkdWMjB6NDJ3K2ZPbjArcGJ5QzExRT0=&h=e806aacb77374526aacb7ad5418c5f78&s=AVNPUEhUT0NFTkNSWVBUSVZIDzAwy2k-XXZH0rKNiLigYOxy7SMx-hKRcpPSDBsvdy0OtlM8z7K-Dk9w-Tjog-M> ====================================================================================================== --

Enrico Nardelli

9:02 p.m.

Bonus track: Vi riporto più sotto la traduzione del paragrafo 4 dell'articolo di Bender di Bender & Koller del 2020 fatta da Claude (l'ho ricontrollata io e non dovrebbero esserci castronerie), perché la ritengo molto utile per capire bene la sostanza delle argomentazioni in gioco rispetto al problema di cosa vuol dire "comprendere come un essere umano". È facilmente comprensibile da chiunque, non è tecnica, non ha formule. Naturalmente, non è un teorema matematico, come il teorema di PItagora, ma è un argomento difficilmente contestabile se non dicendo ciò che viene ripetuto a proposito di questi sistemi, cioè che le loro rappresentazioni interne molto sofisticate e i loro output altamente complessi sono equivalenti a quelli degli esseri umani, e quindi questi sistemi comprendono e ragionano come gli essere umani. L'articolo di Bender & Koller del 2020, alla cui lettura vi invito nuovamente, contesta proprio questo uso di termini: /If the highlighted terms are meant to describe human-analogous understanding, comprehension, or recall of factual knowledge, then these are gross overclaims. If, instead, they are intended as technical terms, they should be explicitly defined./ E poi sottolinea: /we have highlighted both the extent to which there is evidence that large LMs can learn aspects of linguistic formal structure (e.g. agreement, dependency structure), and how their apparent ability to “reason” is sometimes a mirage built on leveraging artifacts in the training data (i.e. form, not meaning). Our contribution is an argument on theoretical grounds that a system exposed only to form in its training cannot in principle learn meaning/. Ecco quindi il paragrafo 4, intitolato "Il test del polpo". Buona lettura e buona riflessione. Enrico ------------------------------------------------------ Per illustrare le difficoltà nel tentare di apprendere il significato dalla sola forma, proponiamo uno scenario concreto. Immaginiamo che A e B, entrambi parlanti fluenti di inglese, si ritrovino naufraghi su due isole disabitate. Scoprono presto che i visitatori precedenti hanno lasciato dei telegrafi e che possono comunicare tra loro tramite un cavo sottomarino. A e B cominciano felicemente a scambiarsi messaggi. Nel frattempo, O, un polpo degli abissi dall'intelligenza sopraffina che non può visitare né osservare le due isole, scopre un modo per intercettare il cavo sottomarino e origliare le conversazioni tra A e B. O inizialmente non sa nulla di inglese, ma è molto bravo a rilevare schemi statistici. Col tempo, impara a prevedere con grande precisione come B risponderà a ciascun messaggio di A. O osserva anche che certe parole tendono a comparire in contesti simili, e forse impara a generalizzare i pattern lessicali ipotizzando che possano essere usate in modo intercambiabile. Ciononostante, O non ha mai osservato quegli oggetti nel mondo reale, e quindi non sarebbe in grado di identificare il referente di una parola se gli venisse presentata una serie di alternative (fisiche). A un certo punto, O comincia a sentirsi solo. Taglia il cavo sottomarino e si inserisce nella conversazione, fingendo di essere B e rispondendo ai messaggi di A. O riesce a spacciarsi per B senza insospettire A? Questo costituisce una forma debole del test di Turing (debole perché A non ha motivo di sospettare di star parlando con un non umano); la domanda interessante è se O fallisca il test perché non ha appreso la relazione di significato, avendo visto solo la forma degli enunciati di A e B. La misura in cui O riesce a ingannare A dipende dal compito — cioè da ciò di cui A vuole parlare. A e B hanno trascorso molto tempo a scambiarsi note banali sulla vita quotidiana per rendere più piacevoli le lunghe serate sull'isola. Sembra plausibile che O riesca a produrre nuove frasi del tipo di quelle che usava B; comportandosi essenzialmente come un chatbot. Questo perché gli enunciati in tali conversazioni hanno principalmente una funzione sociale e non devono essere radicati nei particolari della situazione fisica concreta degli interlocutori né in nulla di specifico del mondo reale. È sufficiente produrre testo internamente coerente. Ora immaginiamo che A abbia inventato un nuovo congegno, diciamo una catapulta per noci di cocco. Eccitata, invia a B le istruzioni dettagliate per costruirla e chiede delle sue esperienze e suggerimenti per migliorarla. Anche se O avesse un modo per costruire la catapulta sott'acqua, non sa a cosa si riferiscono parole come *corda* e *noce di cocco*, e quindi non può riprodurre fisicamente l'esperimento. Può solo ricorrere alle osservazioni precedenti su come B rispondeva a enunciati simili. Forse O riconosce gli enunciati sui manghi e i chiodi come "simili" perché quelle parole erano apparse in contesti analoghi a *noce di cocco* e *corda*. Così O decide di dire semplicemente "Bella idea, ottimo lavoro!", perché B lo diceva spesso quando A parlava di corde e chiodi. È del tutto concepibile che A accetti questa risposta come significativa — ma solo perché è A a fare tutto il lavoro nell'attribuire significato alla risposta di O. Non è perché O abbia capito il significato delle istruzioni di A, né tantomeno della propria risposta. Infine, A si trova in una situazione d'emergenza. Viene all'improvviso inseguita da un orso arrabbiato. Afferra un paio di bastoni e chiede freneticamente a B di trovare un modo per costruire un'arma con cui difendersi. Naturalmente, O non ha la minima idea di cosa A "intenda". Risolvere un compito del genere richiede la capacità di mappare con precisione le parole sulle entità del mondo reale (oltre che ragionamento e pensiero creativo). È a questo punto che O fallirebbe il test di Turing — se A non fosse già stata divorata dall'orso prima di accorgersi dell'inganno. Avendo a disposizione solo la forma come dati di addestramento, O non ha appreso il significato. Il linguaggio scambiato da A e B è una proiezione delle loro intenzioni comunicative, attraverso la relazione di significato, in forme linguistiche. Senza accesso a un mezzo per ipotizzare e verificare le intenzioni comunicative sottostanti, ricostruirle a partire dalle sole forme è un'impresa impossibile, e l'uso del linguaggio da parte di O finirà inevitabilmente per divergere da quello di un agente capace di radicare il linguaggio in intenzioni comunicative coerenti. L'esperimento mentale illustra anche il punto del §3 sul ruolo attivo degli ascoltatori nella comunicazione. Quando O inviava segnali ad A fingendo di essere B, sfruttava le regolarità statistiche della forma, ovvero la distribuzione delle forme linguistiche che aveva osservato. Qualunque cosa abbia imparato O è un riflesso delle intenzioni comunicative di A e B e della relazione di significato. Ma riprodurre questa distribuzione non è sufficiente per una comunicazione significativa. O ha ingannato A facendole credere di essere B solo perché A era un'ascoltatrice così attiva: poiché gli agenti che producono frasi in inglese di solito hanno intenzioni comunicative, A assume che anche O le abbia, e quindi attribuisce agli enunciati di O il significato convenzionale che l'inglese vi associa. Poiché assume che O sia B, usa quel significato convenzionale insieme alle sue altre ipotesi sullo stato mentale e gli obiettivi di B per attribuire un'intenzione comunicativa. Non è che gli enunciati di O abbiano senso, ma piuttosto che A riesce a dargli senso. ---------------------------------------------------- Il 15/05/2026 20:08, Enrico Nardelli via nexa ha scritto:

...

Ritengo doveroso articolare una riflessione.

Il post della Bender https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... dice: /in Bender and Koller 2020 ... we provide a definition of understanding as mapping from language to something outside of language, and show that systems built only with linguistic form have no purchase with which to encode (“learn”) such a mapping. / Ovvero: Definiamo comprensione come una corrispondenza tra linguaggio e qualcosa fuori il linguaggio. Un sistema addestrato solo sulle forme linguistiche non ha modo di codificare questa corrispondenza.

Dopo di che dice: /Stochastic parrots was coined to refer to language models, i.e. systems trained only on linguistic form used to mimic the kinds of sequences of linguistic form that people use./

Ovvero: Il termine "pappagalli stocastici" si riferiva ai sistemi addestrati sulle forme linguistiche che imitano quelle che usano le persone.

E poi dice ancora, e qui c'è l'espressione che si pensa scardini tutto: /It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020, albeit in an extremely thin way/.

Ovvero: si può sostenere che un modello misto con testo e immagini, che mette in corrispondenza testi con immagini o viceversa, risponda alla nostra definizione di comprensione, anche se in un modo estremamente sottile.

E poi continua: /When we look at the text in an image/text model, we make sense of it in a way that is rich and socially situated and we must not project that onto the model if we want to keep a clear-eyed view of how such models actually function (and in what circumstances we should be willing to use them)/.

Ovvero: quando noi guardiamo il testo di un modello misto con testo e immagini, lo comprendiamo in modo ricco e socialmente situato, che non deve essere proiettato sul modello, se vogliamo mantenere una visione chiara su come il modello funziona effettivamente

E infine: /Even if there is some thin kind of technical “understanding” in e.g. a text/image model, the fact that it’s using our language at all will send misleading signals about what is actually going on, so long as we relate to language as we always do (and I don’t see how we can avoid doing so)/.

Ovvero: anche se c'è una esile forma di "comprensione" in senso tecnico in un modello misto con testo e immagini, il semplice fatto che usi il nostro linguaggio ci manda segnali fuorvianti su ciò che sta accadendo, finché noi ci relazioniamo al linguaggio come sempre facciamo (e non vedo come potremmo fare diversamente)

Ecco, leggendo questi passi tutti insieme e non estraendo solo la frase "risponde alla nostra definizione di comprensione", si capisce che l'accoppiamento fra testo e immagine rientra da un punto di vista sintattico (/in an estremely thin way/ - direi per un capello) nella definizione tecnica di comprensione della Bender, ma non è la comprensione umana. Notate che dice che siamo NOI che lo comprendiamo (/we make a sense of it/) sulla base della nostra esperienza. Infatti, questo "qualcosa fuori il linguaggio" della definizione è l'intento comunicativo del parlante, che è basato sul mondo reale che parlante e ascoltatore condividono (/the communicative intent is grounded in the real world the speaker and listener inhabit together/).

Se si legge con attenzione l'articolo di Bender & Koller del 2020 citato nel post della Bender (https://www.aclweb.org/anthology/2020.acl-main.463/ - cosa che vi invito a fare, è abbastanza accessibile) tutto questo è molto chiaro, così come la tesi principale di quell'articolo, che rimane interamente salda e non scalfita. /We argue that the language modeling task, because it only uses form as training data, cannot in principle lead to learning of meaning. ... We take (linguistic) meaning to be the relation between a linguistic form and communicative intent/.

Certo, uno può leggere nel recente post della Bender quello che vuole, ma argomentare trionfanti che "è una retromarcia bella grossa" mi sembra esagerato.

Questo non vuol ovviamente dire che progressi nella ricerca e nelle architetture dei sistemi di IA non potranno darci in futuro una qualche forma di comprensione, che con le attuali architetture non c'è.

Ciao, Enrico

Il 14/05/2026 00:43, Fabio Alemagna via nexa ha scritto:

...
Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/

_______________

🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali.

Ma andiamo con ordine.

La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni.

La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica.

La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto.

La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way".

Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso.

Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model.

Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale.

La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco.

Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere.

Link:

1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/

2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 )

3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... )

4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E --

-- EN

https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ======================================================================================================

--

-- -- EN https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ====================================================================================================== --

Guido Vetere

May 16, 2026

4:29 a.m.

Il significato non emerge dalla forma ma dal rapporto della parola con la realtà. Dal lato del locutore, questo rapporto fonda l'intenzione comunicativa; dal lato del ricevente, fonda l'interpretazione. La comprensione avviene quando entrambi convengono sugli stessi oggetti di una realtà che è uguale per tutti. Quando si parla di significato, la realtà è necessaria, dice Emily Bender. Tant'è che, surrogata in immagini associate alle parole, questa può, benché in minima misura, giustificare l'affermazione che un automa possa significare, uscendo dalla voliera dei pappagalli stocastici. Questa è la classica visione realista del linguaggio (Aristotele, Agostino, Tommaso) a cui si è sempre opposto uno scetticismo con radici altrettanto antiche. Nel Novecento, il rifiuto del realismo referenziale percorre la nozione di arbitrarietà del segno nello strutturalismo, i giochi linguistici dalle regole inscrutabili di Wittgenstein e Kripke, la traduzione radicale di Quine, fino all'ermeneutica del pensiero debole. Vale la pena notare, per chi lavora con la semantica formale della logica, che il realismo referenziale può facilmente essere accolto come metafisica implicita dell'informatica: chi lo difende senza tematizzarlo sta, spesso senza saperlo, facendo filosofia tomistica. D’altra parte all’origine delle tecnologie linguistiche troviamo Padre Busa, non dimentichiamolo. Nessuno tra realisti e scettici può vantare risultati sperimentali decisivi, né prevalere per via dell'h-index, versione miserabilmente moderna dell'auctoritas. Bisogna quindi prendere sul serio la domanda con tutto il suo carico di apertura. Tenere aperta la domanda non è "fuffa filosofica” (cit.): è pretendere rigore dove c'è facile dogmatismo. Se qualcosa si può rimproverare alla Bender, che ha tutto il diritto di propendere per il realismo, è l'ablazione del dubbio, è non domandarsi quale sia il fondamento di realtà della parola ‘verità’. Io osservo che il fatto che gli automi siano locutori così potenti pur senza paure, desideri e intenzioni, lungi dall’essere il silver bullet dello scetticismo, è tuttavia un indizio da non trascurare. Depone a favore, insomma: qualche domanda il realista se la dovrebbe pur fare. Visto che il tema – giustamente – appassiona, vi informo che è uscita una nuova edizione di ‘Intelligenze aliene’ per i tipi di Sossella; l’abbiamo intitolata ‘Incontri ravvicinati’ per parlare degli sviluppi e dei dibattiti più recenti. Il volume è arricchito da una postfazione di Luca De Biase. [https://www.ibs.it/incontri-ravvicinati-intelligenze-aliene-nuova-libro-guid...]. Buona giornata, Guido

...

Il giorno 15 mag 2026, alle ore 23:02, Enrico Nardelli via nexa <nexa@server-nexa.polito.it> ha scritto:

Bonus track:

Vi riporto più sotto la traduzione del paragrafo 4 dell'articolo di Bender di Bender & Koller del 2020 fatta da Claude (l'ho ricontrollata io e non dovrebbero esserci castronerie), perché la ritengo molto utile per capire bene la sostanza delle argomentazioni in gioco rispetto al problema di cosa vuol dire "comprendere come un essere umano".

È facilmente comprensibile da chiunque, non è tecnica, non ha formule.

Naturalmente, non è un teorema matematico, come il teorema di PItagora, ma è un argomento difficilmente contestabile se non dicendo ciò che viene ripetuto a proposito di questi sistemi, cioè che le loro rappresentazioni interne molto sofisticate e i loro output altamente complessi sono equivalenti a quelli degli esseri umani, e quindi questi sistemi comprendono e ragionano come gli essere umani.

L'articolo di Bender & Koller del 2020, alla cui lettura vi invito nuovamente, contesta proprio questo uso di termini: If the highlighted terms are meant to describe human-analogous understanding, comprehension, or recall of factual knowledge, then these are gross overclaims. If, instead, they are intended as technical terms, they should be explicitly defined. E poi sottolinea: we have highlighted both the extent to which there is evidence that large LMs can learn aspects of linguistic formal structure (e.g. agreement, dependency structure), and how their apparent ability to “reason” is sometimes a mirage built on leveraging artifacts in the training data (i.e. form, not meaning). Our contribution is an argument on theoretical grounds that a system exposed only to form in its training cannot in principle learn meaning.

Ecco quindi il paragrafo 4, intitolato "Il test del polpo".

Buona lettura e buona riflessione.

Enrico

------------------------------------------------------ Per illustrare le difficoltà nel tentare di apprendere il significato dalla sola forma, proponiamo uno scenario concreto. Immaginiamo che A e B, entrambi parlanti fluenti di inglese, si ritrovino naufraghi su due isole disabitate. Scoprono presto che i visitatori precedenti hanno lasciato dei telegrafi e che possono comunicare tra loro tramite un cavo sottomarino. A e B cominciano felicemente a scambiarsi messaggi.

Nel frattempo, O, un polpo degli abissi dall'intelligenza sopraffina che non può visitare né osservare le due isole, scopre un modo per intercettare il cavo sottomarino e origliare le conversazioni tra A e B. O inizialmente non sa nulla di inglese, ma è molto bravo a rilevare schemi statistici. Col tempo, impara a prevedere con grande precisione come B risponderà a ciascun messaggio di A. O osserva anche che certe parole tendono a comparire in contesti simili, e forse impara a generalizzare i pattern lessicali ipotizzando che possano essere usate in modo intercambiabile. Ciononostante, O non ha mai osservato quegli oggetti nel mondo reale, e quindi non sarebbe in grado di identificare il referente di una parola se gli venisse presentata una serie di alternative (fisiche).

A un certo punto, O comincia a sentirsi solo. Taglia il cavo sottomarino e si inserisce nella conversazione, fingendo di essere B e rispondendo ai messaggi di A. O riesce a spacciarsi per B senza insospettire A? Questo costituisce una forma debole del test di Turing (debole perché A non ha motivo di sospettare di star parlando con un non umano); la domanda interessante è se O fallisca il test perché non ha appreso la relazione di significato, avendo visto solo la forma degli enunciati di A e B.

La misura in cui O riesce a ingannare A dipende dal compito — cioè da ciò di cui A vuole parlare. A e B hanno trascorso molto tempo a scambiarsi note banali sulla vita quotidiana per rendere più piacevoli le lunghe serate sull'isola. Sembra plausibile che O riesca a produrre nuove frasi del tipo di quelle che usava B; comportandosi essenzialmente come un chatbot. Questo perché gli enunciati in tali conversazioni hanno principalmente una funzione sociale e non devono essere radicati nei particolari della situazione fisica concreta degli interlocutori né in nulla di specifico del mondo reale. È sufficiente produrre testo internamente coerente.

Ora immaginiamo che A abbia inventato un nuovo congegno, diciamo una catapulta per noci di cocco. Eccitata, invia a B le istruzioni dettagliate per costruirla e chiede delle sue esperienze e suggerimenti per migliorarla. Anche se O avesse un modo per costruire la catapulta sott'acqua, non sa a cosa si riferiscono parole come *corda* e *noce di cocco*, e quindi non può riprodurre fisicamente l'esperimento. Può solo ricorrere alle osservazioni precedenti su come B rispondeva a enunciati simili. Forse O riconosce gli enunciati sui manghi e i chiodi come "simili" perché quelle parole erano apparse in contesti analoghi a *noce di cocco* e *corda*. Così O decide di dire semplicemente "Bella idea, ottimo lavoro!", perché B lo diceva spesso quando A parlava di corde e chiodi. È del tutto concepibile che A accetti questa risposta come significativa — ma solo perché è A a fare tutto il lavoro nell'attribuire significato alla risposta di O. Non è perché O abbia capito il significato delle istruzioni di A, né tantomeno della propria risposta.

Infine, A si trova in una situazione d'emergenza. Viene all'improvviso inseguita da un orso arrabbiato. Afferra un paio di bastoni e chiede freneticamente a B di trovare un modo per costruire un'arma con cui difendersi. Naturalmente, O non ha la minima idea di cosa A "intenda". Risolvere un compito del genere richiede la capacità di mappare con precisione le parole sulle entità del mondo reale (oltre che ragionamento e pensiero creativo). È a questo punto che O fallirebbe il test di Turing — se A non fosse già stata divorata dall'orso prima di accorgersi dell'inganno.

Avendo a disposizione solo la forma come dati di addestramento, O non ha appreso il significato. Il linguaggio scambiato da A e B è una proiezione delle loro intenzioni comunicative, attraverso la relazione di significato, in forme linguistiche. Senza accesso a un mezzo per ipotizzare e verificare le intenzioni comunicative sottostanti, ricostruirle a partire dalle sole forme è un'impresa impossibile, e l'uso del linguaggio da parte di O finirà inevitabilmente per divergere da quello di un agente capace di radicare il linguaggio in intenzioni comunicative coerenti.

L'esperimento mentale illustra anche il punto del §3 sul ruolo attivo degli ascoltatori nella comunicazione. Quando O inviava segnali ad A fingendo di essere B, sfruttava le regolarità statistiche della forma, ovvero la distribuzione delle forme linguistiche che aveva osservato. Qualunque cosa abbia imparato O è un riflesso delle intenzioni comunicative di A e B e della relazione di significato. Ma riprodurre questa distribuzione non è sufficiente per una comunicazione significativa. O ha ingannato A facendole credere di essere B solo perché A era un'ascoltatrice così attiva: poiché gli agenti che producono frasi in inglese di solito hanno intenzioni comunicative, A assume che anche O le abbia, e quindi attribuisce agli enunciati di O il significato convenzionale che l'inglese vi associa. Poiché assume che O sia B, usa quel significato convenzionale insieme alle sue altre ipotesi sullo stato mentale e gli obiettivi di B per attribuire un'intenzione comunicativa. Non è che gli enunciati di O abbiano senso, ma piuttosto che A riesce a dargli senso. ----------------------------------------------------

Il 15/05/2026 20:08, Enrico Nardelli via nexa ha scritto:

...
Ritengo doveroso articolare una riflessione.

Il post della Bender https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... dice: in Bender and Koller 2020 ... we provide a definition of understanding as mapping from language to something outside of language, and show that systems built only with linguistic form have no purchase with which to encode (“learn”) such a mapping.

Ovvero: Definiamo comprensione come una corrispondenza tra linguaggio e qualcosa fuori il linguaggio. Un sistema addestrato solo sulle forme linguistiche non ha modo di codificare questa corrispondenza.

Dopo di che dice: Stochastic parrots was coined to refer to language models, i.e. systems trained only on linguistic form used to mimic the kinds of sequences of linguistic form that people use.

Ovvero: Il termine "pappagalli stocastici" si riferiva ai sistemi addestrati sulle forme linguistiche che imitano quelle che usano le persone.

E poi dice ancora, e qui c'è l'espressione che si pensa scardini tutto: It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020, albeit in an extremely thin way.

Ovvero: si può sostenere che un modello misto con testo e immagini, che mette in corrispondenza testi con immagini o viceversa, risponda alla nostra definizione di comprensione, anche se in un modo estremamente sottile.

E poi continua: When we look at the text in an image/text model, we make sense of it in a way that is rich and socially situated and we must not project that onto the model if we want to keep a clear-eyed view of how such models actually function (and in what circumstances we should be willing to use them).

Ovvero: quando noi guardiamo il testo di un modello misto con testo e immagini, lo comprendiamo in modo ricco e socialmente situato, che non deve essere proiettato sul modello, se vogliamo mantenere una visione chiara su come il modello funziona effettivamente

E infine: Even if there is some thin kind of technical “understanding” in e.g. a text/image model, the fact that it’s using our language at all will send misleading signals about what is actually going on, so long as we relate to language as we always do (and I don’t see how we can avoid doing so).

Ovvero: anche se c'è una esile forma di "comprensione" in senso tecnico in un modello misto con testo e immagini, il semplice fatto che usi il nostro linguaggio ci manda segnali fuorvianti su ciò che sta accadendo, finché noi ci relazioniamo al linguaggio come sempre facciamo (e non vedo come potremmo fare diversamente)

Ecco, leggendo questi passi tutti insieme e non estraendo solo la frase "risponde alla nostra definizione di comprensione", si capisce che l'accoppiamento fra testo e immagine rientra da un punto di vista sintattico (in an estremely thin way - direi per un capello) nella definizione tecnica di comprensione della Bender, ma non è la comprensione umana. Notate che dice che siamo NOI che lo comprendiamo (we make a sense of it) sulla base della nostra esperienza. Infatti, questo "qualcosa fuori il linguaggio" della definizione è l'intento comunicativo del parlante, che è basato sul mondo reale che parlante e ascoltatore condividono (the communicative intent is grounded in the real world the speaker and listener inhabit together).

Se si legge con attenzione l'articolo di Bender & Koller del 2020 citato nel post della Bender (https://www.aclweb.org/anthology/2020.acl-main.463/ - cosa che vi invito a fare, è abbastanza accessibile) tutto questo è molto chiaro, così come la tesi principale di quell'articolo, che rimane interamente salda e non scalfita. We argue that the language modeling task, because it only uses form as training data, cannot in principle lead to learning of meaning. ... We take (linguistic) meaning to be the relation between a linguistic form and communicative intent.

Certo, uno può leggere nel recente post della Bender quello che vuole, ma argomentare trionfanti che "è una retromarcia bella grossa" mi sembra esagerato.

Questo non vuol ovviamente dire che progressi nella ricerca e nelle architetture dei sistemi di IA non potranno darci in futuro una qualche forma di comprensione, che con le attuali architetture non c'è.

Ciao, Enrico

Il 14/05/2026 00:43, Fabio Alemagna via nexa ha scritto:

...
Riporto qui un post di Alberto Puliafito, pubblicato su Facebook:: https://www.facebook.com/share/p/18kiudNQqK/

_______________

🦜🤖 Ci sono molte cose interessanti nelle precisazioni di Emily Bender sui pappagalli stocastici. Queste precisazioni, finalmente, potrebbero aiutarci a depurare il dibattito e a concentrarci sulla parte del lavoro di Bender che è davvero importante: lo studio e la critica dei rapporti di potere dentro l'industria delle intelligenze artificiali.

Ma andiamo con ordine.

La prima cosa interessante è il fatto stesso che ci sia stato il bisogno, cinque anni dopo la pubblicazione di "On the Dangers of Stochastic Parrots", di fare delle precisazioni.

La seconda è il chiarimento sul fatto che "pappagalli stocastici" è solo una metafora e non un'ipotesi empirica.

La terza è il fatto che secondo Bender "pappagalli stocastici" non dovrebbe essere usato come "insulto" nei confronti della tecnologia. Suo malgrado, però, è quel che è stato fatto.

La quarta e più importante, per me, è questo passaggio qui sulla comprensione: "It is true that image/text models, for example, that can be used to map from linguistic strings to images or vice versa, can be argued to meet the definition of understanding in Bender & Koller 2020 — albeit in an extremely thin way".

Si può provare a sostenere che questa non sia una retromarcia. Ma è una retromarcia bella grossa, per quanto manovrata con delicatezza e ottima arte retorica. Nel 2020, nel 2021 e fino al 2024 almeno, Bender affermava che non si potesse parlare di "understanding" da parte dei modelli secondo la sua stessa definizione. Adesso, invece, c'è uno spiraglio. E uno spiraglio è diverso da "non c'è understanding". Molto diverso.

Da qui in avanti mi aspetto una serie di lente ma inesorabili operazioni di riposizionamento da parte di molte persone che hanno usato – impropriamente, come dice oggi Bender stessa, finalmente – la metafora dei pappagalli stocastici per sminuire i large language model.

Ovviamente gli errori e i danni fatti dai detrattori e dai minimizzatori non verrano mai riconosciuti come tali, ma questo è comunque un punto di non ritorno sia per i critici a priori di queste tecnologie sia per chi ha usato i pappagalli per costruirsi un posizionamento personale.

La metafora – non ipotesi empirica – dei pappagalli stocastici, per quanto affascinante, era già riduttiva quando è stata proposta. In questi cinque anni lo è diventata sempre di più ma nel frattempo è diventata addirittura identitaria, ingombrando il dibattito e portandolo completamente fuori fuoco.

Adesso che quella metafora perde i pezzi, resta, appunto, la parte del lavoro di Bender che era la più utile fin dall’inizio: la critica al potere.

Link:

1) Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data (Emily M. Bender, Alexander Koller, 2020) https://aclanthology.org/2020.acl-main.463/

2) On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜 (Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell, 2021 https://dl.acm.org/doi/10.1145/3442188.3445922 )

3) Stochastic Parrots 🦜: Frequently Unasked Questions (Emily M. Bender, https://medium.com/@emilymenonbender/stochastic-parrots-frequently-unasked-q... )

4) Video, Chatbot Critics: Chatbots as Stochastic Parrots, Emily M. Bender https://www.youtube.com/watch?v=f4OZ7B2iP_E -- -- EN

https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html <7htcC5QnkGAvFO5p.png> ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www <https://www/> . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ====================================================================================================== -- -- -- EN

https://www.hoepli.it/libro/la-rivoluzione-informatica/9788896069516.html <EgEalX2uwfG0a2pa.png> ====================================================== Prof. Enrico Nardelli Presidente di "Informatics Europe" Direttore del Laboratorio Nazionale "Informatica e Scuola" del CINI Dipartimento di Matematica - Università di Roma "Tor Vergata" Via della Ricerca Scientifica snc - 00133 Roma home page: https://www <https://www/> . mat . uniroma2 . it/~nardelli blog: https://link-and-think.blogspot.it/ tel: +39 06 7259.4204 fax: +39 06 7259.4699 mobile: +39 335 590.2331 e-mail: nardelli@mat . uniroma2 . it online meeting: https://blue.meet.garr.it/b/enr-y7f-t0q-ont ====================================================================================================== --

Age (days ago)

Last active (days ago)

List overview

Download

11 comments

10 participants

participants (10)

abregni
Daniela Tafani
Enrico Nardelli
Fabio Alemagna
Franco Marra
Guido Vetere
Massimo Ghisalberti
Massimo Maria Ghisalberti
Roberto Dolci
Stefano Borroni Barale

Pappagalli stocastici: Alberto Puliafito sulle precisazioni di Emily Bender in merito.

tags

participants (10)