In effetti anche i riferimenti dell'articolo sono molto interessanti. Ho seguito alcuni dei riferimenti per trovare il paper in cui si indicano le caratteristiche del codice utilizzate per identificare i programmatori. https://www.usenix.org/system/files/conference/usenixsecurity15/sec15-paper-... Va sicuramente notato che in certi linguaggi il layout è determinato piuttosto rigidamente (e.g. Haskell, Python e in un certo senso anche Go) anche se non sempre vincolati a livello di compilatore/interprete. D'altro canto è ragionevole pensare che un linguaggio più complesso (i paper si basano su C++) determini un maggior numero di possibili stili come combinazione delle feature rindondanti. In questa ottica sarebbe molto interessante vedere lo stesso studio applicato ad un linguaggio semplice ed elegante come Oberon-07, che il Professor Wirth continua a perfezionare *rimuovendo* features. Detto questo, non so se si possa utilizzare queste tecniche come prova perché uno stile può essere facilmente imitato da un programmatore esperto: è una cosa che facciamo di continuo (con vari gradi di successo) quando studiamo ed estendiamo un software esistente o quando correggiamo un problema ed intendiamo condividere la modifica con gli autori originali. Giacomo Il Ven 17 Ago 2018 08:20 Diego Giorio <dgiorio@hotmail.com> ha scritto:
Molto interessante, grazie per la segnalazione.
In realtà il discorso dello stile, che rende identificabile una persona, è molto più ampio: uno stile pittorico, un modo di scrivere, un approccio personale al disegno possono rendere identificabile una persona tanto quanto lo stile di programmazione.
Buon agosto a tutti
D.
------------------------------ *From:* nexa <nexa-bounces@server-nexa.polito.it> on behalf of Giovanni Battista Gallus <g.gallus@gmail.com> *Sent:* Thursday, August 16, 2018 6:28 AM *To:* nexa@server-nexa.polito.it *Subject:* [nexa] Is coding style personal data?
Identifying Programmers by their Coding Style
*[2018.08.13]* <https://www.schneier.com/blog/archives/2018/08/identifying_pro.html> Fascinating research <https://www.wired.com/story/machine-learning-identify-anonymous-code/> de-anonymizing code -- from either source code or compiled code:
Rachel Greenstadt, an associate professor of computer science at Drexel University, and Aylin Caliskan, Greenstadt's former PhD student and now an assistant professor at George Washington University, have found that code, like other forms of stylistic expression, are not anonymous. At the DefCon hacking conference Friday, the pair will present a number of studies they've conducted using machine learning techniques to de-anonymize the authors of code samples. Their work could be useful in a plagiarism dispute, for instance, but it also has privacy implications, especially for the thousands of developers who contribute open source code to the world.
Una prospettiva molto interessante, segnalata sull'ultimo Cryptogram ( https://www.schneier.com/crypto-gram/archives/2018/0815.html#cg29).
Buone riflessioni agostane.
G.Battista Gallus
_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa