Re: [nexa] Is coding style personal data?

Aug. 20, 2018

      In effetti anche i riferimenti dell'articolo sono molto interessanti.

Ho seguito alcuni dei riferimenti per trovare il paper in cui si indicano
le caratteristiche del codice utilizzate per identificare i programmatori.

https://www.usenix.org/system/files/conference/usenixsecurity15/sec15-paper-...

Va sicuramente notato che in certi linguaggi il layout è determinato
piuttosto rigidamente (e.g. Haskell, Python e in un certo senso anche Go)
anche se non sempre vincolati a livello di compilatore/interprete.

D'altro canto è ragionevole pensare che un linguaggio più complesso (i
paper si basano su C++) determini un maggior numero di possibili stili come
combinazione delle feature rindondanti.
In questa ottica sarebbe molto interessante vedere lo stesso studio
applicato ad un linguaggio semplice ed elegante come Oberon-07, che il
Professor Wirth continua a perfezionare *rimuovendo* features.

Detto questo, non so se si possa utilizzare queste tecniche come prova
perché uno stile può essere facilmente  imitato da un programmatore
esperto: è  una cosa che facciamo di continuo (con vari gradi di successo)
quando studiamo ed estendiamo un software esistente o quando correggiamo un
problema ed intendiamo condividere la modifica con gli autori originali.

Giacomo

Il Ven 17 Ago 2018 08:20 Diego Giorio <dgiorio@hotmail.com> ha scritto:
...
Molto interessante, grazie per la segnalazione.
In realtà il discorso dello stile, che rende identificabile una persona, è
molto più ampio: uno stile pittorico, un modo di scrivere, un approccio
personale al disegno possono rendere identificabile una persona tanto
quanto lo stile di programmazione.
Buon agosto a tutti
D.
------------------------------
*From:* nexa <nexa-bounces@server-nexa.polito.it> on behalf of Giovanni
Battista Gallus <g.gallus@gmail.com>
*Sent:* Thursday, August 16, 2018 6:28 AM
*To:* nexa@server-nexa.polito.it
*Subject:* [nexa] Is coding style personal data?
Identifying Programmers by their Coding Style
*[2018.08.13]*
<https://www.schneier.com/blog/archives/2018/08/identifying_pro.html>
 Fascinating research
<https://www.wired.com/story/machine-learning-identify-anonymous-code/> de-anonymizing
code -- from either source code or compiled code:
Rachel Greenstadt, an associate professor of computer science at Drexel
University, and Aylin Caliskan, Greenstadt's former PhD student and now an
assistant professor at George Washington University, have found that code,
like other forms of stylistic expression, are not anonymous. At the DefCon
hacking conference Friday, the pair will present a number of studies
they've conducted using machine learning techniques to de-anonymize the
authors of code samples. Their work could be useful in a plagiarism
dispute, for instance, but it also has privacy implications, especially for
the thousands of developers who contribute open source code to the world.
Una prospettiva molto interessante, segnalata sull'ultimo Cryptogram (
https://www.schneier.com/crypto-gram/archives/2018/0815.html#cg29).
Buone riflessioni agostane.
G.Battista Gallus
_______________________________________________
nexa mailing list
nexa@server-nexa.polito.it
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Re: [nexa] Is coding style personal data?

Giacomo Tesio