Re: [nexa] AI based GitHub copilot

July 2, 2021

      Giacomo Tesio <giacomo@tesio.it> writes:

[...]
...
https://copilot.github.com/diagram.png
In sintesi:
1. il tuo editor manda a GitHub/Microsoft il tuo file sorgente
2. GitHub/Microsoft lo salva
3. lo passa ad OpenAI che produce dei suggerimenti
4. te li invia e tu li correggi nel tuo editor
No: Copilot (ancora in "tech preview", è la frase markettara per dire
"pre-alha": usatelo a vostro rischio l'importante è che ci forniate il
VOSTRO codice e la telemetria) esiste come estensione solo per MS Visual
Studio Code

--8<---------------cut here---------------start------------->8---

GitHub Copilot is available today as a Visual Studio Code extension. It
works wherever Visual Studio Code works — on your machine or in the
cloud on GitHub Codespaces.

--8<---------------cut here---------------end--------------->8---
...
5. il tuo editor manda a GitHub/Microsoft informazioni telemetriche
Le informazioni inviate e come sono utilizzate è descritto qui:
https://docs.github.com/en/github/copilot/about-github-copilot-telemetry

Non so se coloro che usano MS Visual Studio Code (anche senza Copilot)
se ne rendono conto, io conosco DUE persone alle quali ho dovuto
spiegare io che la telemetria di quel COSO è parecchio invasiva.

Tip: per chi proprio non può fare a meno di quel robo almeno valuti 
https://vscodium.com/

...se non proprio di usare un ALTRO editor/IDE per programmare.
...
6. GitHub/Microsoft migliora il modello attraverso il feedback.
In pratica, spionaggio industriale automatizzato e lavoro altamente
qualificato di classificazione dei dataset non pagato INSIEME! :-D
è la prima cosa che ho pensato senza manco vedere il diagramma di flusso
(o in questo caso si chiama "diagramma del fesso"?!?): non solo
telemetria A MANETTA senza il minimo pudore, ma pure analisi (e
ovviamente acquisizione pro bono loro... in FAIR USE) del codice che si
sta scrivendo, pure se è PRIVATO.

è il completamento perfetto del mirabolante strumento di Google [1] che
custodisce le chiavi private usate per la firma dei pacchetti
distribuiti su Google Play, direi!
...
Si pone però un problema interessantissimo: il modello di OpenAI è
stato alimentato con il codice presente su GitHub.
Questo include una valanga di software sotto copyleft AGPLv3.
Dunque il modello di OpenAI è un opera derivata "algoritmicamente"
anche da quel codice sotto copyleft (insieme a tanto altro).
Come tale, DEVE essere reso accessibile agli utenti.
Mavà, com'è quel detto: "quello che è mio è mio e quello che è tuo
è... MIO"? :-O

[...]
...
```
Training machine learning models on publicly available data is
considered fair use across the machine learning community. The models
gain insight and accuracy from the public collective intelligence. But
this is a new space, and we are keen to engage in a discussion with
developers on these topics and lead the industry in setting appropriate
standards for training AI models.
```
La mitica copertina del 8 Aprile 1991 di Cuore [2] è adatta anche a
questo caso, direi... anche a distanza di vent'anni: un sempreverde!
...
Fair use del codice per la comunità del machine learning.
Un po' come il fair use delle galline nella comunità delle volpi!
sono davvero tempi MOLTO curiosi, asinstoticamente tendenti al distopico
andante

Saluti, 380°

[1] https://server-nexa.polito.it/pipermail/nexa/2021-June/021837.html

[2] https://www.flickr.com/photos/saverioluzzi/6335177675/

-- 
380° (Giovanni Biscuolo public alter ego)

«Noi, incompetenti come siamo,
 non abbiamo alcun titolo per suggerire alcunché»

Disinformation flourishes because many people care deeply about injustice
but very few check the facts.  Ask me about <https://stallmansupport.org>.