alcuni modelli linguistici pre-trainati (es. BERT-like), di provenienza generalmente accademica, sono già attualmente su piattaforme come huggingface.co, potete benissimo scaricarle

con alcune si lavora ragionevolmente bene, perfino in italiano, con poco addestramento (few-shot) per compiti generativi specialistici, tipo formare una query sql da una frase interrogativa (cosa per la quale generazioni di informatici hanno versato lacrime e sangue)

quello che non si può fare è 'modificarli' nel senso della tradizione open source, si possono solo 'sintonizzare' (tuning)

si può certamente anche produrre language models ex novo, se si hanno abbastanza dati e risorse, il problema è che ce ne vogliono davvero tante

continuo a credere che se usati in processi di generazione stocastica non si possa evitare che anche dal modello più 'puro' esca qualche enormità

dunque chiedo: dobbiamo bandire l'intera pratica dei LLM oppure possiamo trovare una quadra?

non fatemi stare in ansia .. :-)

On Mon, 10 Apr 2023 at 23:55, 380° <g380@biscuolo.net> wrote:

Giacomo Tesio <giacomo@tesio.it> writes:

[...]

> On Mon, 3 Apr 2023 20:18:55 +0200 Guido Vetere wrote:
>
>> Ma se passasse questa linea dovremmo spegnere tutti i generatori
>> basati (solo) su LLM: anche se addestrati sui dati più puri del
>> mondo, la probabilità che generino 'utterances' censurabili non
>> sarebbe mai nulla.
>
> Beh non è detto: è sufficiente che ciascuno usi i LLM che realizza.

No: che ciascuno possa (ri)utilizzare, studiare, modificare e
redistribuire copie modificate degli LLM realizzati da altri,
/liberamente/

[...]

...sì, è un discorso già sentito, negli anni '80 :-)

Saluti, 380°

--
380° (Giovanni Biscuolo public alter ego)

«Noi, incompetenti come siamo,
non abbiamo alcun titolo per suggerire alcunché»

Disinformation flourishes because many people care deeply about injustice
but very few check the facts. Ask me about <https://stallmansupport.org>.
_______________________________________________
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa