On Tue, Feb 27, 2024, 14:11 Stefano Zacchiroli <zack@upsilon.cc> wrote:
Ma ci sono anche esempi virtuosi, come Starcoder o Eleuther (LLM per il
codice), i cui training dataset (assieme a tutto il resto) sono
interamente disponibili e libri.
Non tutti i dataset di Eleuther AI sono ridistribuibili. Anzi, The Pile รจ purtroppo stato rimosso dalla circolazione, se non ricordo male.