Caro Giacomo, Giacomo Tesio <giacomo@tesio.it> writes: [...]
La stessa definizione di ‘text and data mining’ prevista dall'articolo 2 della direttiva (EU) 2019/790, riporta lo scopo che caratterizza queste tecniche, ovvero la produzione di informazione sui dati:
‘text and data mining’ means any automated analytical technique aimed at analysing text and data in digital form in order to generate information which includes but is not limited to patterns, trends and correlations;
https://eur-lex.europa.eu/legal-content/EN/TXT/HTML/?uri=CELEX:32019L0790#d1...
Non capisco perché la parte "text mining" che del processo di c.d. "machine learning" non rientri tranquillamente nella definizione di "text and data mining" riportata sopra.
Il processo di programmazione statistica di un LLM o di qualsiasi altra "IA generativa" non comporta in alcun modo l'estrazione di conoscenza "human-understandable" sui testi e più in generale sui dati usati come sorgente.
e perché il ‘text and data mining’ definito sopra comporta l'estrazione di conoscenza "human-understandable" sui testi analizzati? il fatto che la definizione dica "includes but is not limited to patterns..." non è secondario
Ad esempio, i pesi che costituiscono GPT-4, non sono interpretabili dall'uomo e non rivelano alcunché su alcuna qualità dei testi utilizzati per programmarlo.
Dunque di nuovo non mi è chiaro cosa centrino le limitazioni previste agli articoli 3 e 4 della direttiva suddetta, visto che le IA generative NON sono riconducibili in alcun modo al data mining.
quindi il processo di "machine learning" a cosa sarebbe ricondicibile, secondo te? [...]
Tuttavia NON è ciò che avviene durante la programmazione statistica di un "AI generativa" che è semplicemente un'opera derivata dei dati sorgente
Il software (programmato statisticamente) è un'opera derivata dei testi (dati?) utilizzati per il "machine learning": ho capito bene? Per essere considerata opera derivata, è mio modestissimo parere che tale opera debba essere espressa in una forma (linguaggio) comprensibile agli umani, ma non mi pare proprio che il software programmato statisticamente (che è del tutto analogo al software binario) rientri in questa categoria.
non troppo dissimile da un jpeg o da uno zip danneggiato ma ancora utilizzabile.
...oppure ho capito male e tu non ti stai riferendo al software (binario) come opera derivata ma all'output dei sistem "AI generativi"? Ciao, 380° -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.