Feb. 27, 2024
4:27 p.m.
On Tue, Feb 27, 2024, 14:11 Stefano Zacchiroli <zack@upsilon.cc> wrote:
Ma ci sono anche esempi virtuosi, come Starcoder o Eleuther (LLM per il codice), i cui training dataset (assieme a tutto il resto) sono interamente disponibili e libri.
Non tutti i dataset di Eleuther AI sono ridistribuibili. Anzi, The Pile è purtroppo stato rimosso dalla circolazione, se non ricordo male.