Cosa succederà all'archivio digitale La Stampa?

newer
'If you switch off, people think...

older
Facial Recognition at US Airports...

Elena Marangoni

Dec. 1, 2020

8:56 a.m.

Buongiorno, segnalo la preoccupante situazione dell'Archivio de La Stampa che dal 15 dicembre diventerà inaccessibile a causa della dismissione di Flash Player (ma non solo), ben descritta da Mario Tedeschini-Lalli: https://tedeschini.medium.com/tecnologia-digitale-obsoleta-un-secolo-e-mezzo... E' un caso paradigmatico in cui si intrecciano il problema dell'obsolescenza delle tecnologie informatiche (io sono mooolto preoccupata dalla dismissione di Flash tra pochi giorni, sono l'unica?), il tema della memoria digitale, le traversie editoriali della stampa quotidiana e il ruolo degli enti pubblici. Ottime alleanze pubblico-privato soffrono spesso di scarsa tenuta nel tempo e dopo alcuni anni gli attori coinvolti mutano assetto (tanto nel pubblico quanto nel privato), si sfilano, oneri e competenze non sono più chiare e piattaforme anche preziose e utilissime vengono abbandonate. Cosa si può fare? L'unico gesto che ci resta è la firma della petizione su Change.org linkata in calce all'articolo? Forse dovrebbero sortirne qualche azione e insegnamento sulla resistenza nel tempo dei progetti digitali, saluti Elena Marangoni --- Servizi bibliografici digitali Università degli Studi di Torino

Attachments:

attachment.html (text/html — 2.8 KB)

Show replies by date

Andrea Pellegrini

December 2020

9:35 a.m.

Buongiorno, È di qualche giorno fa l’annuncio dell’Internet Archive in cui viene presentata una futura funzione di supporto delle animazioni Flash. Sarà effettuato tramite la libreria Ruffle (in WebAssembly). Da una lettura superficiale non mi sembra che possa “raccogliere” automaticamente le pagine flash, ma è necessario che il proprietario le carichi nell’archivio. Non so se possa essere una potenziale soluzione transitoria per mantenere pubblico un archivio di grande importanza non solo per il territorio piemontese. http://blog.archive.org/2020/11/19/flash-animations-live-forever-at-the-inte... <http://blog.archive.org/2020/11/19/flash-animations-live-forever-at-the-inte...> https://blog.archive.org/2020/11/22/flash-back-further-thoughts-on-flash-at-... <https://blog.archive.org/2020/11/22/flash-back-further-thoughts-on-flash-at-...> Ciao Ciao Andrea Pellegrini 346 705 0039 <tel:+393467050039> Via Superga, 5 Pino Torinese (TO) Italy pelle@andreapellegrini.net <mailto:pelle@andreapellegrini.net> andreapellegrini.net <https://andreapellegrini.net/>

...

On 1 Dec 2020, at 09:56, Elena Marangoni <elena.marangoni@unito.it> wrote:

Buongiorno, segnalo la preoccupante situazione dell'Archivio de La Stampa che dal 15 dicembre diventerà inaccessibile a causa della dismissione di Flash Player (ma non solo), ben descritta da Mario Tedeschini-Lalli: https://tedeschini.medium.com/tecnologia-digitale-obsoleta-un-secolo-e-mezzo... <https://tedeschini.medium.com/tecnologia-digitale-obsoleta-un-secolo-e-mezzo...>

E' un caso paradigmatico in cui si intrecciano il problema dell'obsolescenza delle tecnologie informatiche (io sono mooolto preoccupata dalla dismissione di Flash tra pochi giorni, sono l'unica?), il tema della memoria digitale, le traversie editoriali della stampa quotidiana e il ruolo degli enti pubblici. Ottime alleanze pubblico-privato soffrono spesso di scarsa tenuta nel tempo e dopo alcuni anni gli attori coinvolti mutano assetto (tanto nel pubblico quanto nel privato), si sfilano, oneri e competenze non sono più chiare e piattaforme anche preziose e utilissime vengono abbandonate. Cosa si può fare? L'unico gesto che ci resta è la firma della petizione su Change.org linkata in calce all'articolo? Forse dovrebbero sortirne qualche azione e insegnamento sulla resistenza nel tempo dei progetti digitali,

saluti Elena Marangoni --- Servizi bibliografici digitali Università degli Studi di Torino

_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Giovanni Biscuolo

12:47 p.m.

Buongiorno, non ho capito il copyright dell'archivio: nel footer del sito http://www.archiviolastampa.it/ c'è un logo che richiama le "Creative Commons" ma il relativo link punta a: https://www.lastampa.it/archivio-storico/#lastampa_note_legali --8<---------------cut here---------------start------------->8--- Ops! Pagina non trovata Sembra che quello che stai cercando sia stato spostato o non è mai esistito. Controlla l'indirizzo inserito o in alternativa vai alla Homepage --8<---------------cut here---------------end--------------->8--- Possiamo sperare che si tratti di CC-BY-SA? :-D Elena Marangoni <elena.marangoni@unito.it> writes:

...

Buongiorno, segnalo la preoccupante situazione dell'Archivio de La Stampa che dal 15 dicembre diventerà inaccessibile a causa della dismissione di Flash Player (ma non solo), ben descritta da Mario Tedeschini-Lalli: https://tedeschini.medium.com/tecnologia-digitale-obsoleta-un-secolo-e-mezzo...

che dice, sostanzialmente, che l'archivio è _nato_morto_ perché scegliere Flash nel 2010 è stato un errore imperdonabile (per me è _sempre_ stato inaccessibile e anti-etico... e non è stato Steve Jobs a convincermi :-O): --8<---------------cut here---------------start------------->8--- Del comitato facevano parte, oltre all’editrice La Stampa (che portava in dote la collezione del giornale), la Regione Piemonte, la Compagnia di San Paolo e la Fondazione CRT. L’archivio andò online alla fine di ottobre 2010 (erano passati già sei mesi dalla pubblicazione del celebre intervento con il quale Steve Jobs demoliva Flash), e alla fine di quello stesso anno il Comitato si sciolse, “avendo esaurito il suo scopo”. Nel 2012, la “nuda proprietà” dell’archivio fu passata alla Regione Piemonte, mentre alla Fondazione del Libro, la musica e la cultura, fu affidata la sua gestione per trent’anni — ma la Fondazione, che all’epoca organizzava il Salone del libro, fallì anch’essa solo cinque anni dopo. [I vari passaggi sono dettagliati in un documento della Regione Piemonte] Da allora l’archivio ha continuato a funzionare in una specie di limbo. Il materiale continua a essere ospitato sui server del CSI Piemonte, un’azienda informatica di emanazione regionale. La società esterna cui il Comitato aveva affidato la realizzazione dell’Archivio è scomparsa anch’essa. La Stampa si è nel frattempo fusa con il Secolo XIX di Genova e poi con il Gruppo editoriale l’Espresso, formando il Gruppo GEDI. Chi debba o possa occuparsi del futuro dell’Archivio storico non è chiaro. L’unica che abbia certamente una titolarità è la Regione Piemonte, che dell’Archivio è proprietaria e che si è alla fine mobilitata. All’inizio di dicembre 2020 — informano due diverse fonti e conferma la Regione — sono previsti incontri con tutti gli organismi inizialmente interessati alla creazione dell’Archivio: l’editore, le fondazioni bancarie e la Regione. Ma la soluzione non potà essere trovata e applicata nel giro di poche settimane e infatti il sito sarà probabilmente oscurato già il 15 dicembre, apprendiamo dalla Regione. --8<---------------cut here---------------end--------------->8---

...

E' un caso paradigmatico in cui si intrecciano il problema dell'obsolescenza delle tecnologie informatiche (io sono mooolto preoccupata dalla dismissione di Flash tra pochi giorni, sono l'unica?),

La dismissione di Flash è un evento annunciato da diversi anni, chi nel frattempo non ha predisposto un piano di migrazione e aggiornato i propri formati in qualcosa di interoperabile ha fatto un cattivo servizio a sè e alla comunità. Nel caso specifico credo che sia chiaro che di risolvere il problema per tempo non c'è stato nessun interesse, di conseguenza nessuna risorsa. Nel caso specifico, sono convinto che l'archivio vero e proprio NON sia memorizzato "in Flash" e che si tratti "solo" di rifare il frontend per l'accesso ai contenuti, tecnicamente fattibilissimo avendo le adeguate risorse. Ma potrebbero anche solo limitarsi a pubblicare il materiale scansionato "raw": in che formato sarà?!? In generale, nel 2020, mi pare che il tema dei formati dei documenti digitali (con *tutta* la catena di software necessaria a renderli accessibili) sia ancora ampiamente sottovalutato. [...]

...

Cosa si può fare?

Pubblicare gli archivi storici in formato digitalizzato (djvu sarebbe l'ideale) con licenza CC-BY-SA e consentire a chiunque di costruirci sopra interfacce di consultazione, indicizzazione, (ri)scansione OCR, conversione in articoli Semantic MediaWiki, ecc. per facilitarne la fruizione, lo studio e la correlazione? Così sarebbe davvero un bene comune. Wikimedia Italia sarebbe un partner perfetto per un progetto del genere :-D [...] Grazie, Giovanni. -- Giovanni Biscuolo

Massimo Canducci

1:52 p.m.

Anni fa, quando si scelse quel tipo di tecnologia, avevo espresso le mie preoccupazioni rispetto all'utilizzo di tecnologia proprietaria per la realizzazione di uno strumento divulgativo e culturale di questo tipo. L'unica cosa da fare è la realizzazione di una piattaforma nuova, totalmente basata su tecnologie aperte e standard, sperando che il lavoro di porting dei contenuti non rappresenti un lavoro immenso ed inavvicinabile. Per fare questo però ci vuole la disponibilità da parte del titolare dei diritti per mettere a disposizione tutto l'archivio, in modo da fare un'analisi puntuale su come operare. In seconda battuta serve del budget oppure la disponibilità di un'azienda (o un consorzio benefico costituito ad hoc) che abbia voglia e risorse per una realizzazione pro-bono. Ho già espresso la mia disponibilità per fare una prima analisi per individuare budget o aziende interessate, resto in attesa. Un saluto a tutti Max Il 01/12/20 09:56, Elena Marangoni ha scritto:

...

Buongiorno, segnalo la preoccupante situazione dell'Archivio de La Stampa che dal 15 dicembre diventerà inaccessibile a causa della dismissione di Flash Player (ma non solo), ben descritta da Mario Tedeschini-Lalli: https://tedeschini.medium.com/tecnologia-digitale-obsoleta-un-secolo-e-mezzo... <https://tedeschini.medium.com/tecnologia-digitale-obsoleta-un-secolo-e-mezzo...>

E' un caso paradigmatico in cui si intrecciano il problema dell'obsolescenza delle tecnologie informatiche (io sono mooolto preoccupata dalla dismissione di Flash tra pochi giorni, sono l'unica?), il tema della memoria digitale, le traversie editoriali della stampa quotidiana e il ruolo degli enti pubblici. Ottime alleanze pubblico-privato soffrono spesso di scarsa tenuta nel tempo e dopo alcuni anni gli attori coinvolti mutano assetto (tanto nel pubblico quanto nel privato), si sfilano, oneri e competenze non sono più chiare e piattaforme anche preziose e utilissime vengono abbandonate. Cosa si può fare? L'unico gesto che ci resta è la firma della petizione su Change.org linkata in calce all'articolo? Forse dovrebbero sortirne qualche azione e insegnamento sulla resistenza nel tempo dei progetti digitali,

saluti Elena Marangoni --- Servizi bibliografici digitali Università degli Studi di Torino

_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Giovanni Biscuolo

4:29 p.m.

Buonasera Massimo, perdoni se ne approfitto per una domanda diretta: Massimo Canducci <massimo@canducci.eu> writes: [...]

...

Per fare questo però ci vuole la disponibilità da parte del titolare dei diritti per mettere a disposizione tutto l'archivio,

Come ho avidenziato nella mia email di questa mattina in questo thread, nel footer dell'archivio http://www.archiviolastampa.it/ c'è un logo creative commens che recita "Some rights reserved" ma il link punta a una pagina inseistente: https://www.lastampa.it/archivio-storico/#lastampa_note_legali Siccome mi pare abbia informazioni di prima mano, con che licenza sono pubblicati i contenuti dell'archivio? (posto che la parte più antica dell'archivio oggi è già in dominio pubblico) [...] Grazie, Giovanni. -- Giovanni Biscuolo

Giacomo Tesio

5:48 p.m.

On Tue, 01 Dec 2020 17:29:48 +0100 Giovanni Biscuolo <giovanni@biscuolo.net> wrote:

...

https://www.lastampa.it/archivio-storico/#lastampa_note_legali

Siccome mi pare abbia informazioni di prima mano, con che licenza sono pubblicati i contenuti dell'archivio? (posto che la parte più antica dell'archivio oggi è già in dominio pubblico)

Si direbbe fosse rilasciato con un CC-BY-NC-ND 2.5 http://web.archive.org/web/20110205230348/https://www.lastampa.it/archivio-s... In allegato ho buttato giù un piccolo script python che scarica una copia locale dell'archivio, nella cartella "archive". In ogni directory vengono salvate le immagini delle pagine, il testo (si direbbe prodotto da un pessimo OCR) ed un data.json che contiene le informazioni sul numero, incluso, per ogni pagina, le coordinate della mappa HTML (chi si ricorda cos'è :-D) di ogni articolo. In venti minuti non sono riuscito a fare di più, ma a partire da questi JSON non dovrebbe essere difficile mettere su un sito di consultazione (magari statico, senza Flash, Java, JavaScript o PHP di sorta... KISS!!) Giacomo PS: lo script richiede python3 ed il modulo requests

Alberto Cammozzo

6:42 p.m.

Grazie Giacomo, senza che mi metta a stressare i server de La Stampa, puoi dirci che consistenza ha l'archivio? Collaboro con un progetto in Unipd (<https://tipsproject.eu/tips>) che raccoglie i testi degli articoli di quotidiani online sui quali facciamo analisi. Forse potremmo offrirci di raccogliere l'archivio e mettere in piedi un servizio anche per il pubblico, ma dipende dallo sforzo richiesto. Ciao, Alberto On 01/12/2020 18:48, Giacomo Tesio wrote:

...

On Tue, 01 Dec 2020 17:29:48 +0100 Giovanni Biscuolo <giovanni@biscuolo.net> wrote:

...
https://www.lastampa.it/archivio-storico/#lastampa_note_legali

Siccome mi pare abbia informazioni di prima mano, con che licenza sono pubblicati i contenuti dell'archivio? (posto che la parte più antica dell'archivio oggi è già in dominio pubblico) Si direbbe fosse rilasciato con un CC-BY-NC-ND 2.5

http://web.archive.org/web/20110205230348/https://www.lastampa.it/archivio-s...

In allegato ho buttato giù un piccolo script python che scarica una copia locale dell'archivio, nella cartella "archive".

In ogni directory vengono salvate le immagini delle pagine, il testo (si direbbe prodotto da un pessimo OCR) ed un data.json che contiene le informazioni sul numero, incluso, per ogni pagina, le coordinate della mappa HTML (chi si ricorda cos'è :-D) di ogni articolo.

In venti minuti non sono riuscito a fare di più, ma a partire da questi JSON non dovrebbe essere difficile mettere su un sito di consultazione (magari statico, senza Flash, Java, JavaScript o PHP di sorta... KISS!!)

Giacomo PS: lo script richiede python3 ed il modulo requests

_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Giacomo Tesio

9:11 p.m.

Ciao Alberto, On December 1, 2020 6:42:50 PM UTC, Alberto Cammozzo via nexa <nexa@server-nexa.polito.it> wrote:

...

senza che mi metta a stressare i server de La Stampa, puoi dirci che consistenza ha l'archivio?

non posso darti un numero preciso perché lo scaricamento è ancora in corso. Ho però dovuto aggiungere un `time.sleep(3)` al termine della funzione `download` perché dopo i primi 100 numeri circa il server mi aveva bloccato la connessione. Se ti dovesse succedere, per far ripartire il download da dove è stato interrotto è sufficiente sostituire il valore della variabile `issueID` con il nome dell'ultima directory creata in archive/ e rimuoverla prima di lanciare lo script, in modo che venga riscaricata completamente. Lo so... è una seccatura... ma non ho proprio tempo per rifinirlo... I primi numeri, dal 1867 e fino dove sono arrivato, consistono di 4 pagine ed ogni pagina (jpeg + txt) occupa circa mezzo mega. Tuttavia considerando che si parla di un quotidiano, abbiamo circa 50500 numeri, ma dal dopo guerra le pagine iniziano a salire a 10 e dalla fine degli anni 70 si sale ad oltre le 30 pagine. Facendo una proiezione molto grossolana: a 12 pagine in media al giorno, per mezzo mega a pagina, dovremmo stare intorno ai 300 giga. Giacomo

Giovanni Biscuolo

3:42 p.m.

Ciao, Giacomo Tesio <giacomo@tesio.it> writes: [...]

...

Tuttavia considerando che si parla di un quotidiano, abbiamo circa 50500 numeri, ma dal dopo guerra le pagine iniziano a salire a 10 e dalla fine degli anni 70 si sale ad oltre le 30 pagine.

Facendo una proiezione molto grossolana: a 12 pagine in media al giorno, per mezzo mega a pagina, dovremmo stare intorno ai 300 giga.

Occhio che le FAQ dell'archivio dicono che in tutto sono 100TB: http://www.archiviolastampa.it/component/option,com_lastampa/task,faq/Itemid... --8<---------------cut here---------------start------------->8--- Alcuni dati numerici Le Collezioni La Stampa sono suddivise su due testate principali, La Stampa che nel periodo 1867-2005 ha avuto 47.243 edizioni giornaliere e Stampa Sera che dal 1931 al 1992 ha avuto 18.314 edizioni. Il giornale ha cambiato spesso impaginazione e anche nome: in origine nasce come Gazzetta Piemontese, con 4 pagine giornaliere su 4 colonne, per poi aumentare il numero di pagine e passare a 5, poi a 6 e successivamente a 7 colonne fino a 9 colonne. L'intero progetto completo di tutte le immagini in alta e bassa risoluzione, testi e metadati occupa uno spazio disco di circa 100 Terabite. --8<---------------cut here---------------end--------------->8--- [...] Ciao, Giovanni -- Giovanni Biscuolo

Andrea Trentini

7:51 p.m.

New subject: {Filename?} Re: Cosa succederà all'archivio digitale La Stampa?

Quoting Giacomo Tesio (2020-12-01 18:48:10)

...

Attenzione: Questo messaggio presenta un o piu' allegati rimossi in automatico Attenzione: (download.py). Attenzione: Per ulteriori informazioni, consultate l'allegato "unimi-Attachment-Warning.txt".

script python segato... -- |_|o|_| Andrea Trentini - http://atrent.it |_|_|o| Dipartimento di Informatica |o|o|o| Università degli Studi di Milano

Giacomo Tesio

9:25 p.m.

New subject: {Filename?} Re: Cosa succederà all'archivio digitale La Stampa?

On December 1, 2020 7:51:21 PM UTC, Andrea Trentini <andrea.trentini@unimi.it> wrote:

...

Quoting Giacomo Tesio (2020-12-01 18:48:10)

...
Attenzione: Questo messaggio presenta un o piu' allegati rimossi in automatico Attenzione: (download.py). Attenzione: Per ulteriori informazioni, consultate l'allegato "unimi-Attachment-Warning.txt".

script python segato...

Lo trovi sugli archivi Nexa https://server-nexa.polito.it/pipermail/nexa/attachments/20201201/a9d799bf/a... Ma vedi gli appunti che ho scritto per Alberto: https://server-nexa.polito.it/pipermail/nexa/2020-December/019379.html Giacomo

Andrea Trentini

1:43 p.m.

New subject: {Filename?} Re: Cosa succederà all'archivio digitale La Stampa?

On 01/12/2020 22:25, Giacomo Tesio wrote:

...

Lo trovi sugli archivi Nexa> https://server-nexa.polito.it/pipermail/nexa/attachments/20201201/a9d799bf/a...

sisi lo so, grazie, era per dire che è sempre un po' un problema allegare un eseguibile... :( -- |_|o|_| Andrea Trentini - http://atrent.it |_|_|o| Dipartimento di Informatica |o|o|o| Università degli Studi di Milano

Giovanni Biscuolo

4 p.m.

Ciao Giacomo, Giacomo Tesio <giacomo@tesio.it> writes:

...

On Tue, 01 Dec 2020 17:29:48 +0100 Giovanni Biscuolo <giovanni@biscuolo.net> wrote:

...
https://www.lastampa.it/archivio-storico/#lastampa_note_legali

Siccome mi pare abbia informazioni di prima mano, con che licenza sono pubblicati i contenuti dell'archivio? (posto che la parte più antica dell'archivio oggi è già in dominio pubblico)

Aggià: Wayback Machine! Grazie!

...

Si direbbe fosse rilasciato con un CC-BY-NC-ND 2.5

a parte la tristezza infinita dell'acronimo NC dentro le licenze CC _non_libere_...

...

http://web.archive.org/web/20110205230348/https://www.lastampa.it/archivio-s...

...si direbbe di no, la licenza è INCASINATA (inutilmente), ho eliminato l'ovvio: --8<---------------cut here---------------start------------->8--- Le singole pagine di ciascun numero (ma non il numero considerato nella sua interezza) dei quotidiani "La Stampa" e "Stampa Sera" e delle altre pubblicazioni dell'Editrice La Stampa S.p.A. presenti all'interno dell'Archivio Storico sono rilasciate in licenza Creative Commons: "Attribuzione - Non commerciale - Non opere derivate 2.5" clicca qui per conoscere i termini della licenza. [...] La licenza Creative Commons non ha ad oggetto i singoli articoli, individualmente considerati, pubblicati sul quotidiano "La Stampa" e "Stampa Sera" e sulle altre pubblicazioni dell'Editrice La Stampa S.p.A. presenti all'interno dell'Archivio Storico, la cui riproduzione è pertanto vietata. [...] La licenza Creative Commons non ha ad oggetto la banca dati dell'Archivio Storico: è conseguentemente vietata l'estrazione e il reimpiego della totalità o di una parte sostanziale del contenuto di tale banca dati. Restano impregiudicati i diritti sulla banca dati riconosciuti dalla legge sul diritto d'autore (Legge 22 aprile 1941 n. 633 e successive modifiche), nei casi ed entri i limiti previsti dalla legge medesima. --8<---------------cut here---------------end--------------->8--- Quindi: le singole pagine sono CC-BY-NC-ND ma non i singoli articoli? Mumble mulble :-O Il diritto sui generis sulla banca dati non è in CC-BY-NC-ND quindi i metadati vanno riscritti tutti da zero nel caso qualcuno volesse creare uno o più indici? Organizziamo un concorso per decifrare i termini di licenza dei contenuti dell'archivio del quotidiano? :-D [...] Saluti, Giovanni. P.S.: lo script che hai messo a disposizione e le conseguenti possibili rielaborazioni dei contenuti digitali così ottenuti dimostrano, se ce ne fosse ancora bisogno, che il problema NON è la mancanza di software adeguato o di competenze per saperlo usare: dipende TUTTO dagli *ostacoli* legali e dalla drammatica carenza di risorse da investire per fare le cose per bene. P.P.S.: per favore non lavorate gratis per risolvere questo problema. -- Giovanni Biscuolo

Giacomo Tesio

5:29 p.m.

On Wed, 02 Dec 2020 17:00:37 +0100 Giovanni Biscuolo <giovanni@biscuolo.net> wrote:

...

P.P.S.: per favore non lavorate gratis per risolvere questo problema.

Conosci un modo per farci pagare l'obiezione di coscienza? :-o Giacomo

Elena Marangoni

8:39 a.m.

New subject: [nexa] Cosa succederà all'archivio digitale La Stampa?

Buongiorno, sono molto d'accordo sul fatto che "il problema NON è la mancanza di software adeguato o di competenze per saperlo usare: dipende TUTTO dagli *ostacoli* legali e dalla drammatica carenza di risorse da investire per fare le cose per bene", sarebbe bello se il detentore dei diritti, posto che non intende farsi carico dell'archivio, donasse tutto con una licenza CC (vera, senza tante N...) e rendesse possibile un vero progetto di valorizzazione, ad es. su Internet Archive saluti elena --- Elena Marangoni Servizi bibliografici digitali Università degli Studi di Torino Direzione Ricerca e Terza Missione via Bava, 31 - 10124 Torino Tel. +39 0116703918www.sba.unito.it Il giorno mer 2 dic 2020 alle ore 17:00 Giovanni Biscuolo < giovanni@biscuolo.net> ha scritto:

...

Ciao Giacomo,

Giacomo Tesio <giacomo@tesio.it> writes:

...
On Tue, 01 Dec 2020 17:29:48 +0100 Giovanni Biscuolo <giovanni@biscuolo.net> wrote:

...
https://www.lastampa.it/archivio-storico/#lastampa_note_legali

Siccome mi pare abbia informazioni di prima mano, con che licenza sono pubblicati i contenuti dell'archivio? (posto che la parte più antica dell'archivio oggi è già in dominio pubblico)

Aggià: Wayback Machine! Grazie!

...
Si direbbe fosse rilasciato con un CC-BY-NC-ND 2.5

a parte la tristezza infinita dell'acronimo NC dentro le licenze CC _non_libere_...

...
http://web.archive.org/web/20110205230348/https://www.lastampa.it/archivio-s...

...si direbbe di no, la licenza è INCASINATA (inutilmente), ho eliminato l'ovvio:

--8<---------------cut here---------------start------------->8---

Le singole pagine di ciascun numero (ma non il numero considerato nella sua interezza) dei quotidiani "La Stampa" e "Stampa Sera" e delle altre pubblicazioni dell'Editrice La Stampa S.p.A. presenti all'interno dell'Archivio Storico sono rilasciate in licenza Creative Commons: "Attribuzione - Non commerciale - Non opere derivate 2.5" clicca qui per conoscere i termini della licenza. [...]

La licenza Creative Commons non ha ad oggetto i singoli articoli, individualmente considerati, pubblicati sul quotidiano "La Stampa" e "Stampa Sera" e sulle altre pubblicazioni dell'Editrice La Stampa S.p.A. presenti all'interno dell'Archivio Storico, la cui riproduzione è pertanto vietata. [...]

La licenza Creative Commons non ha ad oggetto la banca dati dell'Archivio Storico: è conseguentemente vietata l'estrazione e il reimpiego della totalità o di una parte sostanziale del contenuto di tale banca dati. Restano impregiudicati i diritti sulla banca dati riconosciuti dalla legge sul diritto d'autore (Legge 22 aprile 1941 n. 633 e successive modifiche), nei casi ed entri i limiti previsti dalla legge medesima.

--8<---------------cut here---------------end--------------->8---

Quindi: le singole pagine sono CC-BY-NC-ND ma non i singoli articoli? Mumble mulble :-O

Il diritto sui generis sulla banca dati non è in CC-BY-NC-ND quindi i metadati vanno riscritti tutti da zero nel caso qualcuno volesse creare uno o più indici?

Organizziamo un concorso per decifrare i termini di licenza dei contenuti dell'archivio del quotidiano? :-D

[...]

Saluti, Giovanni.

P.S.: lo script che hai messo a disposizione e le conseguenti possibili rielaborazioni dei contenuti digitali così ottenuti dimostrano, se ce ne fosse ancora bisogno, che il problema NON è la mancanza di software adeguato o di competenze per saperlo usare: dipende TUTTO dagli *ostacoli* legali e dalla drammatica carenza di risorse da investire per fare le cose per bene.

P.P.S.: per favore non lavorate gratis per risolvere questo problema.

-- Giovanni Biscuolo _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Giovanni Biscuolo

10:43 a.m.

Buongiorno Elena, Elena Marangoni <elena.marangoni@unito.it> writes:

...

Buongiorno, sono molto d'accordo

[...] Grazie!

...

sarebbe bello se il detentore dei diritti, posto che non intende farsi carico dell'archivio, donasse tutto con una licenza CC (vera, senza tante N...)

Per favorire l'economia del riuso dei sorgenti (gli articoli), se fossi io a donare sceglierei la CC-BY-SA.

...

e rendesse possibile un vero progetto di valorizzazione, ad es. su Internet Archive

Sarebbe un sogno, mi ci butterei *a pesce* in un progetto del genere, promuovendo la valorizzazione dei contenuti attraverso diverse e multidisciplinari "catene di build" [1] che partendo dal "codice sorgente" (gli articoli) riescano a generare un discreto valore aggiunto. Sarebbe materiale preziosissimo per studiosi (dagli storici agli antropologi) e _studenti_ (dalle medie ai master universitari). Pensate se tutti gli articoli dei quotidiani e dei periodici pubblicati, dopo 14 anni dalla prima pubblicazione (per fare un numero a caso), fossero automaticamente redistribuibili in CC-BY-SA... di _default_. Che lavoro straordinario si potrebbe fare! [2] Se le risorse pubbliche fossero spese per progetti del genere (pubblici) sarebbe anche meglio :-D [...] Saluti, Giovanni [1] già "solo" permettere agli studenti di prarticare la marcatura semantica degli articoli attraverso Semantic Mediawiki sarebbe potentissimo, immaginate di poter fare query SPARQL sull'intero archivio... «Immagina, puoi.» B-) [2] e invece no, per fare un progetto scolastico di marcatura semantica dei testi tocca usare opere di secoli fa: non che siano male, eh... forse la prova del tempo tempra le conoscenze. -- Giovanni Biscuolo

Andrea Bolioli

11:04 a.m.

New subject: [nexa] Cosa succederà all'archivio digitale La Stampa?

Buongiorno a tutti/e, alcuni anni fa ho lavorato al riconoscimento di named entities e valutazione degli errori di OCR dell'Archvio storico La Stampa. Condivido un articolo che scrivemmo nel 2014: http://clic2014.fileli.unipi.it/proceedings/vol1/CLICIT2014116.pdf Sono responsabile dei progetti R&I di CELI - Language Technology, facciamo Natural Language Processing da parecchi anni. L'aspetto critico dell'Archivio La Stampa, come di altri archivi, è la gestione, più che la creazione, come sappiamo. In quegli anni suggerivo di renderlo il più aperto possibile e darlo in gestione ad un ente aperto e duraturo, ad es. l'Università. In questo momento per quanto ne so la Regione sta valutando se dare l'archivio in gestione al Polo del 900. Dal punto di vista tecnico, non so cosa vogliono fare. Ho suggerito di nuovo alla persona che guidò il progetto di affidare la gestione all'Università e di farne una cosa la più aperta possibile (codice aperto ecc) Buona giornata, Andrea Bolioli Il giorno gio 3 dic 2020 alle ore 11:43 Giovanni Biscuolo < giovanni@biscuolo.net> ha scritto:

...

Buongiorno Elena,

Elena Marangoni <elena.marangoni@unito.it> writes:

...
Buongiorno, sono molto d'accordo

[...]

Grazie!

...
sarebbe bello se il detentore dei diritti, posto che non intende farsi carico dell'archivio, donasse tutto con una licenza CC (vera, senza tante N...)

Per favorire l'economia del riuso dei sorgenti (gli articoli), se fossi io a donare sceglierei la CC-BY-SA.

...
e rendesse possibile un vero progetto di valorizzazione, ad es. su Internet Archive

Sarebbe un sogno, mi ci butterei *a pesce* in un progetto del genere, promuovendo la valorizzazione dei contenuti attraverso diverse e multidisciplinari "catene di build" [1] che partendo dal "codice sorgente" (gli articoli) riescano a generare un discreto valore aggiunto. Sarebbe materiale preziosissimo per studiosi (dagli storici agli antropologi) e _studenti_ (dalle medie ai master universitari).

Pensate se tutti gli articoli dei quotidiani e dei periodici pubblicati, dopo 14 anni dalla prima pubblicazione (per fare un numero a caso), fossero automaticamente redistribuibili in CC-BY-SA... di _default_. Che lavoro straordinario si potrebbe fare! [2]

Se le risorse pubbliche fossero spese per progetti del genere (pubblici) sarebbe anche meglio :-D

[...]

Saluti, Giovanni

[1] già "solo" permettere agli studenti di prarticare la marcatura semantica degli articoli attraverso Semantic Mediawiki sarebbe potentissimo, immaginate di poter fare query SPARQL sull'intero archivio... «Immagina, puoi.» B-)

[2] e invece no, per fare un progetto scolastico di marcatura semantica dei testi tocca usare opere di secoli fa: non che siano male, eh... forse la prova del tempo tempra le conoscenze.

-- Giovanni Biscuolo _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

-- *Andrea Bolioli* Research & Innovation Manager *M *+39 333 7405664 -- *CELI srl* via San Quintino, 31 - Torino <https://www.google.com/maps/place/Via+S.+Quintino,+31,+10121+Torino+TO/@45.0...> Torino IT – 10121 <https://www.google.com/maps/place/Via+S.+Quintino,+31,+10121+Torino+TO/@45.0...> * * *T *+39 011 5627115 *W *www.celi.it <https://www.celi.it/>

Alberto Cammozzo

4:47 p.m.

Grazie Andrea, molto interessante. Confermo l'interesse del gruppo di ricerca TIPS di UniPD per la ricerca di soluzioni per l'archivio. A chi possiamo manifestare la nostra disponibilità a collaborare? TIPS (Technoscientific Issues in the Public Sphere, <https://tipsproject.eu/tips>) al momento gestisce un corpus italiano di più di 2.5 milioni di articoli dal 2014, più altri corpora in altre lingue (francese, inglese, spagnolo, portoghese) per un totale di 7 milioni di articoli. I testi sono indicizzati e disponibili attraverso una interfaccia web (non pubblica) per la gestione di progetti di ricerca. Io mi occupo di acquisizione, pulizia, NER e analisi con RegExp. Preciso che non abbiamo esperienza di OCR. Buona serata, Alberto Cammozzo On 03/12/2020 12:04, Andrea Bolioli wrote:

...

Buongiorno a tutti/e,

alcuni anni fa ho lavorato al riconoscimento di named entities e valutazione degli errori di OCR dell'Archvio storico La Stampa. Condivido un articolo che scrivemmo nel 2014: http://clic2014.fileli.unipi.it/proceedings/vol1/CLICIT2014116.pdf <http://clic2014.fileli.unipi.it/proceedings/vol1/CLICIT2014116.pdf>

Sono responsabile dei progetti R&I di CELI - Language Technology, facciamo Natural Language Processing da parecchi anni. L'aspetto critico dell'Archivio La Stampa, come di altri archivi, è la gestione, più che la creazione, come sappiamo. In quegli anni suggerivo di renderlo il più aperto possibile e darlo in gestione ad un ente aperto e duraturo, ad es. l'Università. In questo momento per quanto ne so la Regione sta valutando se dare l'archivio in gestione al Polo del 900. Dal punto di vista tecnico, non so cosa vogliono fare. Ho suggerito di nuovo alla persona che guidò il progetto di affidare la gestione all'Università e di farne una cosa la più aperta possibile (codice aperto ecc)

Buona giornata, Andrea Bolioli

Il giorno gio 3 dic 2020 alle ore 11:43 Giovanni Biscuolo <giovanni@biscuolo.net <mailto:giovanni@biscuolo.net>> ha scritto:

Buongiorno Elena,

Elena Marangoni <elena.marangoni@unito.it <mailto:elena.marangoni@unito.it>> writes:

> Buongiorno, > sono molto d'accordo

[...]

Grazie!

> sarebbe bello se il detentore dei diritti, posto che non intende farsi > carico dell'archivio, donasse tutto con una licenza CC (vera, senza > tante N...)

Per favorire l'economia del riuso dei sorgenti (gli articoli), se fossi io a donare sceglierei la CC-BY-SA.

> e rendesse possibile un vero progetto di valorizzazione, ad es. su > Internet Archive

Sarebbe un sogno, mi ci butterei *a pesce* in un progetto del genere, promuovendo la valorizzazione dei contenuti attraverso diverse e multidisciplinari "catene di build" [1] che partendo dal "codice sorgente" (gli articoli) riescano a generare un discreto valore aggiunto. Sarebbe materiale preziosissimo per studiosi (dagli storici agli antropologi) e _studenti_ (dalle medie ai master universitari).

Pensate se tutti gli articoli dei quotidiani e dei periodici pubblicati, dopo 14 anni dalla prima pubblicazione (per fare un numero a caso), fossero automaticamente redistribuibili in CC-BY-SA... di _default_. Che lavoro straordinario si potrebbe fare! [2]

Se le risorse pubbliche fossero spese per progetti del genere (pubblici) sarebbe anche meglio :-D

[...]

Saluti, Giovanni

[1] già "solo" permettere agli studenti di prarticare la marcatura semantica degli articoli attraverso Semantic Mediawiki sarebbe potentissimo, immaginate di poter fare query SPARQL sull'intero archivio... «Immagina, puoi.» B-)

[2] e invece no, per fare un progetto scolastico di marcatura semantica dei testi tocca usare opere di secoli fa: non che siano male, eh... forse la prova del tempo tempra le conoscenze.

-- Giovanni Biscuolo _______________________________________________ nexa mailing list nexa@server-nexa.polito.it <mailto:nexa@server-nexa.polito.it> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa <https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa>

-- *Andrea Bolioli* Research & Innovation Manager *M *+39 333 7405664

*CELI srl* via San Quintino, 31 - Torino <https://www.google.com/maps/place/Via+S.+Quintino,+31,+10121+Torino+TO/@45.0...> Torino IT – 10121 <https://www.google.com/maps/place/Via+S.+Quintino,+31,+10121+Torino+TO/@45.0...> * * *T *+39 011 5627115 *W *www.celi.it <https://www.celi.it/>

_______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Masera Anna

4:35 p.m.

https://www.lastampa.it/rubriche/public-editor/2020/12/14/news/l-archivio-st... Anna Masera Public Editor, La Stampa www.lastampa.it/public-editor<http://www.lastampa.it/public-editor> www.facebook.com/lastampapublic<http://www.facebook.com/lastampapublic> Twitter @annamasera Inviato da iPhone Il giorno 4 dic 2020, alle ore 17:48, Alberto Cammozzo via nexa <nexa@server-nexa.polito.it> ha scritto: Grazie Andrea, molto interessante. Confermo l'interesse del gruppo di ricerca TIPS di UniPD per la ricerca di soluzioni per l'archivio. A chi possiamo manifestare la nostra disponibilità a collaborare? TIPS (Technoscientific Issues in the Public Sphere, <https://tipsproject.eu/tips>) al momento gestisce un corpus italiano di più di 2.5 milioni di articoli dal 2014, più altri corpora in altre lingue (francese, inglese, spagnolo, portoghese) per un totale di 7 milioni di articoli. I testi sono indicizzati e disponibili attraverso una interfaccia web (non pubblica) per la gestione di progetti di ricerca. Io mi occupo di acquisizione, pulizia, NER e analisi con RegExp. Preciso che non abbiamo esperienza di OCR. Buona serata, Alberto Cammozzo On 03/12/2020 12:04, Andrea Bolioli wrote: Buongiorno a tutti/e, alcuni anni fa ho lavorato al riconoscimento di named entities e valutazione degli errori di OCR dell'Archvio storico La Stampa. Condivido un articolo che scrivemmo nel 2014: http://clic2014.fileli.unipi.it/proceedings/vol1/CLICIT2014116.pdf <http://clic2014.fileli.unipi.it/proceedings/vol1/CLICIT2014116.pdf> Sono responsabile dei progetti R&I di CELI - Language Technology, facciamo Natural Language Processing da parecchi anni. L'aspetto critico dell'Archivio La Stampa, come di altri archivi, è la gestione, più che la creazione, come sappiamo. In quegli anni suggerivo di renderlo il più aperto possibile e darlo in gestione ad un ente aperto e duraturo, ad es. l'Università. In questo momento per quanto ne so la Regione sta valutando se dare l'archivio in gestione al Polo del 900. Dal punto di vista tecnico, non so cosa vogliono fare. Ho suggerito di nuovo alla persona che guidò il progetto di affidare la gestione all'Università e di farne una cosa la più aperta possibile (codice aperto ecc) Buona giornata, Andrea Bolioli Il giorno gio 3 dic 2020 alle ore 11:43 Giovanni Biscuolo <giovanni@biscuolo.net <mailto:giovanni@biscuolo.net>> ha scritto: Buongiorno Elena, Elena Marangoni <elena.marangoni@unito.it <mailto:elena.marangoni@unito.it>> writes: Buongiorno, sono molto d'accordo [...] Grazie! sarebbe bello se il detentore dei diritti, posto che non intende farsi carico dell'archivio, donasse tutto con una licenza CC (vera, senza tante N...) Per favorire l'economia del riuso dei sorgenti (gli articoli), se fossi io a donare sceglierei la CC-BY-SA. e rendesse possibile un vero progetto di valorizzazione, ad es. su Internet Archive Sarebbe un sogno, mi ci butterei *a pesce* in un progetto del genere, promuovendo la valorizzazione dei contenuti attraverso diverse e multidisciplinari "catene di build" [1] che partendo dal "codice sorgente" (gli articoli) riescano a generare un discreto valore aggiunto. Sarebbe materiale preziosissimo per studiosi (dagli storici agli antropologi) e _studenti_ (dalle medie ai master universitari). Pensate se tutti gli articoli dei quotidiani e dei periodici pubblicati, dopo 14 anni dalla prima pubblicazione (per fare un numero a caso), fossero automaticamente redistribuibili in CC-BY-SA... di _default_. Che lavoro straordinario si potrebbe fare! [2] Se le risorse pubbliche fossero spese per progetti del genere (pubblici) sarebbe anche meglio :-D [...] Saluti, Giovanni [1] già "solo" permettere agli studenti di prarticare la marcatura semantica degli articoli attraverso Semantic Mediawiki sarebbe potentissimo, immaginate di poter fare query SPARQL sull'intero archivio... «Immagina, puoi.» B-) [2] e invece no, per fare un progetto scolastico di marcatura semantica dei testi tocca usare opere di secoli fa: non che siano male, eh... forse la prova del tempo tempra le conoscenze. -- Giovanni Biscuolo _______________________________________________ nexa mailing list nexa@server-nexa.polito.it <mailto:nexa@server-nexa.polito.it> https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa <https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa> -- *Andrea Bolioli* Research & Innovation Manager *M *+39 333 7405664 *CELI srl* via San Quintino, 31 - Torino <https://www.google.com/maps/place/Via+S.+Quintino,+31,+10121+Torino+TO/@45.0...> Torino IT – 10121 <https://www.google.com/maps/place/Via+S.+Quintino,+31,+10121+Torino+TO/@45.0...> * * *T *+39 011 5627115 *W *www.celi.it <https://www.celi.it/> _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa _______________________________________________ nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa ________________________________ Il presente messaggio (inclusi gli allegati) contiene informazioni riservate esclusivamente al destinatario/ai destinatari indicato/i nel messaggio, ed è protetto dalla legge. La diffusione, distribuzione e/o la copia del contenuto del presente messaggio da parte di qualsiasi soggetto diverso dal destinatario è severamente vietata ai sensi dell’art. 616 c.p. e delle vigenti normative in materia di protezione dei dati personali. Se non siete i destinatari del presente messaggio, vi preghiamo di distruggerlo e di darcene immediata comunicazione inviando un messaggio di ritorno all’indirizzo e-mail del mittente. This message (including any attachments) contains confidential information intended only for the recipient(s) named above, and is protected by law. Any disclosure, distribution and/or copying of this message by any subject different from the named recipient(s) is strictly prohibited according to art. 616 c.p. and to the applicable data protection laws. If you are not the intended recipient, please delete this message and inform us immediately about the deletion by sending a message to the sender’s e-mail address. ________________________________

Fabio Malagnino

4:46 p.m.

New subject: [nexa] Cosa succederà all'archivio digitale La Stampa?

Buongiorno a tutti dopo qualche giorno di confronto Giunta regionale / Consiglio regionale / Csi Piemonte siamo arrivati al risultato di cui ha scritto Anna Masera. una buona notizia prima di Natale a presto fabio malagnino Il giorno lun 14 dic 2020 alle ore 17:35 Masera Anna < Anna.MASERA@lastampa.it> ha scritto:

...

https://www.lastampa.it/rubriche/public-editor/2020/12/14/news/l-archivio-st...

*Anna Masera*

*Public Editor, La Stampa*

*www.lastampa.it/public-editor <http://www.lastampa.it/public-editor>*

*www.facebook.com/lastampapublic <http://www.facebook.com/lastampapublic> * *Twitter @annamasera*

Andrea Bolioli

5:13 p.m.

New subject: [nexa] Cosa succederà all'archivio digitale La Stampa?

Bene :-) Andrea Bolioli Il giorno lun 14 dic 2020 alle ore 17:44 Fabio Malagnino < invisigot@gmail.com> ha scritto:

...

Buongiorno a tutti dopo qualche giorno di confronto Giunta regionale / Consiglio regionale / Csi Piemonte siamo arrivati al risultato di cui ha scritto Anna Masera. una buona notizia prima di Natale

a presto fabio malagnino

Il giorno lun 14 dic 2020 alle ore 17:35 Masera Anna < Anna.MASERA@lastampa.it> ha scritto:

...
https://www.lastampa.it/rubriche/public-editor/2020/12/14/news/l-archivio-st...

*Anna Masera*

*Public Editor, La Stampa*

*www.lastampa.it/public-editor <http://www.lastampa.it/public-editor>*

*www.facebook.com/lastampapublic <http://www.facebook.com/lastampapublic> * *Twitter @annamasera*

_______________________________________________

nexa mailing list nexa@server-nexa.polito.it https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa

Roberto Resoli

9:10 a.m.

Il 14/12/20 17:46, Fabio Malagnino ha scritto:

...

Buongiorno a tutti dopo qualche giorno di confronto Giunta regionale / Consiglio regionale / Csi Piemonte siamo arrivati al risultato di cui ha scritto Anna Masera. una buona notizia prima di Natale

a presto fabio malagnino

Il giorno lun 14 dic 2020 alle ore 17:35 Masera Anna <Anna.MASERA@lastampa.it <mailto:Anna.MASERA@lastampa.it>> ha scritto:

https://www.lastampa.it/rubriche/public-editor/2020/12/14/news/l-archivio-st...

Ottima cosa. rob

Andrea Pellegrini

February 2021

3:58 p.m.

Ciao a tutti, Un’aggiornamento sulla questione: COMUNICATO STAMPA L’ARCHIVIO STORICO DEL QUOTIDIANO LA STAMPA SARÀ DI NUOVO ON LINE DALLE ORE 12 DI LUNEDÌ 15 FEBBRAIO POGGIO: «ABBIAMO MESSO AL SICURO UN PATRIMONIO INESTIMABILE NEI TEMPI PREVISTI» Torino, 13 febbraio 2021 L’Archivio storico on line del quotidiano «La Stampa <http://www.archiviolastampa.it/>», sarà di nuovo consultabile dalle ore 12 di lunedì 15 febbraio all’indirizzo http://www.archiviolastampa.it <http://www.archiviolastampa.it/> dove sarà possibile accedere nuovamente ai contenuti temporaneamente sospesi dallo scorso 15 dicembre per alcuni lavori di manutenzione della piattaforma. «Grazie all’intervento del CSI che ha aggiornato la piattaforma per renderla nuovamente consultabile – ha sottolineato l’assessore alla Cultura, Vittoria Poggio - abbiamo messo al sicuro un patrimonio di inestimabile valore introducendo tra l’altro un criterio di indicizzazione degli articoli più aderente alle norme sulla privacy che tutelano in particolare quella riguardante il diritto all’oblio a tutela di chi non vuole più vedere riportato il proprio nome nelle cronache del passato». L’intera raccolta conta quasi 150 anni di storia, 1.761.000 pagine, oltre 5 milioni di articoli, 4,5 milioni di immagini tra fotografie e negativi, dal 1867 al 2006: con il ripristino, sarà di nuovo possibile effettuare ricerche per data o per parole contenute nel testo degli articoli e visualizzare la riproduzione delle pagine del giornale per leggerle e sfogliarle come dal vero. I lavori sono avvenuti nei tempi previsti, rendendo l’Archivio Storico nuovamente utilizzabile: in particolare, il Consorzio si è occupato di sostituire il sistema di visualizzazione dei contenuti ormai obsoleto, Flash Player, con una equivalente soluzione in software libero. Per valorizzare ulteriormente questo importante strumento, la Regione Piemonte è già al lavoro per avviare un percorso di riprogettazione complessiva in linea con i nuovi trend tecnologici e di design per la fruizione dei servizi pubblici. «Siamo orgogliosi di aver lavorato a fianco della Regione Piemonte per rendere nuovamente consultabile questo importante strumento – ha sottolineato Pietro Pacini, Direttore Generale CSI Piemonte -. Un imponente archivio digitale che raccoglie un patrimonio storico straordinario che deve essere tutelato e valorizzato attraverso moderne tecnologie di cui il CSI si avvale per realizzare i progetti per la Pubblica Amministrazione, per i cittadini e le imprese». Andrea Costa cell. 335 6380515 Ufficio di comunicazione assessore alla Cultura Vittoria Poggio Ufficio Stampa CSI Piemonte Vittoria Gernone - 346 6946901 comunicazione@csi.it <mailto:comunicazione@csi.it> Andrea Pellegrini 346 705 0039 <tel:+393467050039> Via Superga, 5 Pino Torinese (TO) Italy pelle@andreapellegrini.net <mailto:pelle@andreapellegrini.net> andreapellegrini.net <https://andreapellegrini.net/>

Massimo Canducci

December 2020

9:20 p.m.

Buonasera, non ho informazioni di prima mano, so solo che i contenuti in teoria sono in CC, ma poi dovendo realizzare un sito di consultazione completo bisogna capire con precisione cosa è disponibile e con quale licenza. Per quello dicevo che la prima cosa da fare è comprendere bene la dimensione del problema. Un saluto Max Il 01/12/20 17:29, Giovanni Biscuolo ha scritto:

...

Buonasera Massimo,

perdoni se ne approfitto per una domanda diretta:

Massimo Canducci <massimo@canducci.eu> writes:

[...]

...
Per fare questo però ci vuole la disponibilità da parte del titolare dei diritti per mettere a disposizione tutto l'archivio, Come ho avidenziato nella mia email di questa mattina in questo thread, nel footer dell'archivio http://www.archiviolastampa.it/ c'è un logo creative commens che recita "Some rights reserved" ma il link punta a una pagina inseistente:

https://www.lastampa.it/archivio-storico/#lastampa_note_legali

Siccome mi pare abbia informazioni di prima mano, con che licenza sono pubblicati i contenuti dell'archivio? (posto che la parte più antica dell'archivio oggi è già in dominio pubblico)

[...]

Grazie, Giovanni.

1869

Age (days ago)

1943

Last active (days ago)

List overview

Download

23 comments

11 participants

participants (11)

Alberto Cammozzo
Andrea Bolioli
Andrea Pellegrini
Andrea Trentini
Elena Marangoni
Fabio Malagnino
Giacomo Tesio
Giovanni Biscuolo
Masera Anna
Massimo Canducci
Roberto Resoli