Tutto questo non ci aiuta nel dibattito sul decidere se un LLM sia o
meno un opera derivata dei suoi training input.
A me personalmente piacerebbe capire *perché*, prima di pensare a *se*, un LLM dovrebbe essere un'opera derivata dal dataset di addestramento. Ovvero, avendo come obiettivo la diffusione della conoscenza, è collettivamente positivo per la società pensare che opere di creatività debbano essere coperte da diritti esclusivi nuovi (o estensione di quelli vecchi --diritto d'autore, marchi, ecc) prima di poter essere trasformate in token e passati in pasto all'addestramento automatico?