Giacomo Tesio <giacomo@tesio.it> writes: [...]
https://copilot.github.com/diagram.png
In sintesi:
1. il tuo editor manda a GitHub/Microsoft il tuo file sorgente 2. GitHub/Microsoft lo salva 3. lo passa ad OpenAI che produce dei suggerimenti 4. te li invia e tu li correggi nel tuo editor
No: Copilot (ancora in "tech preview", è la frase markettara per dire "pre-alha": usatelo a vostro rischio l'importante è che ci forniate il VOSTRO codice e la telemetria) esiste come estensione solo per MS Visual Studio Code --8<---------------cut here---------------start------------->8--- GitHub Copilot is available today as a Visual Studio Code extension. It works wherever Visual Studio Code works — on your machine or in the cloud on GitHub Codespaces. --8<---------------cut here---------------end--------------->8---
5. il tuo editor manda a GitHub/Microsoft informazioni telemetriche
Le informazioni inviate e come sono utilizzate è descritto qui: https://docs.github.com/en/github/copilot/about-github-copilot-telemetry Non so se coloro che usano MS Visual Studio Code (anche senza Copilot) se ne rendono conto, io conosco DUE persone alle quali ho dovuto spiegare io che la telemetria di quel COSO è parecchio invasiva. Tip: per chi proprio non può fare a meno di quel robo almeno valuti https://vscodium.com/ ...se non proprio di usare un ALTRO editor/IDE per programmare.
6. GitHub/Microsoft migliora il modello attraverso il feedback.
In pratica, spionaggio industriale automatizzato e lavoro altamente qualificato di classificazione dei dataset non pagato INSIEME! :-D
è la prima cosa che ho pensato senza manco vedere il diagramma di flusso (o in questo caso si chiama "diagramma del fesso"?!?): non solo telemetria A MANETTA senza il minimo pudore, ma pure analisi (e ovviamente acquisizione pro bono loro... in FAIR USE) del codice che si sta scrivendo, pure se è PRIVATO. è il completamento perfetto del mirabolante strumento di Google [1] che custodisce le chiavi private usate per la firma dei pacchetti distribuiti su Google Play, direi!
Si pone però un problema interessantissimo: il modello di OpenAI è stato alimentato con il codice presente su GitHub.
Questo include una valanga di software sotto copyleft AGPLv3.
Dunque il modello di OpenAI è un opera derivata "algoritmicamente" anche da quel codice sotto copyleft (insieme a tanto altro).
Come tale, DEVE essere reso accessibile agli utenti.
Mavà, com'è quel detto: "quello che è mio è mio e quello che è tuo è... MIO"? :-O [...]
``` Training machine learning models on publicly available data is considered fair use across the machine learning community. The models gain insight and accuracy from the public collective intelligence. But this is a new space, and we are keen to engage in a discussion with developers on these topics and lead the industry in setting appropriate standards for training AI models. ```
La mitica copertina del 8 Aprile 1991 di Cuore [2] è adatta anche a questo caso, direi... anche a distanza di vent'anni: un sempreverde!
Fair use del codice per la comunità del machine learning. Un po' come il fair use delle galline nella comunità delle volpi!
sono davvero tempi MOLTO curiosi, asinstoticamente tendenti al distopico andante Saluti, 380° [1] https://server-nexa.polito.it/pipermail/nexa/2021-June/021837.html [2] https://www.flickr.com/photos/saverioluzzi/6335177675/ -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.