Il giorno mer 19 lug 2023 alle ore 12:51 Guido Vetere <vetere.guido@gmail.com> ha scritto:
per quel poco che ho studiato la questione del cross-lingual transfer learning, la cosa riguarda il trasferimento da lingue con molte risorse (leggi: inglese) a lingue con scarse risorse c'è tutta una questione di relativismo culturale nella quale ora non è il caso di addentrarsi, ma in tutti i casi vale il discorso del downsizing: è difficile - per dire - che sia necessario trasferire qualcosa di urdu in italiano, quindi basterebbero coppie inglese-x
Se la produzione letteraria in un dato linguaggio è scarsa, viene da sé che il contributo ai parametri del modello sarà anch'esso "scarso". Non vedo dunque il problema.
per il resto: certo che tutti hanno il diritto di farsi un language model, il tema è quello del sostegno a questo tipo di sviluppi in ottica 'sociale'
Non parlavo del diritto a farsi il proprio LLM, ma della possibilità di utiilizzare un LLM nella propria lingua. In altre parole, ChatGPT è accessibile a una vastissima platea mondiale proprio in funzione del numero della grossa quantità di lingue che parla. E comunque, non sottovaluterei la rilevanza dell'Urdu.