Buongiorno Antonio, scusa(te) se ritorno sull'argomento a tanti giorni di distanza Antonio Iacono <antiac@gmail.com> writes: [...]
Poi un commento personale, io non so se c'è e quale potrebbe essere un formato migliore di PDF,
Tutto dipende da qual'è lo scopo della produzione del documento. Se lo scopo è *solo* quello di fornire una _presentazione_ (a video o stampata) di un documento da poter distribuire, firmato o meno, allora direi che il *mezzo* standard PDF è passabile. Direi che questa scelta è praticamente OBBLIGATA dal fatto che è storicamente scientificamente dimostrato che chi produce il documento non vuole sentir parlare nemmeno di striscio di produrre documenti strutturati (che sono indispensabili per un EVENTUALE trattamento automatico serio) con tutto lo sforzo che ne consegue: tutto quello che desidera fare è produrre una _presentazione_ graficamente soddisfacente (soggettivamente) da poter distribuire ad altre persone: l'utilizzo che terzi potrebbero fare delle informazioni contenute in tale documento non è minimamente contemplato. Per questo tipo di applicazione PDF, PostScript, DVI [1] o djvu sono equivalenti, ognuno coi suoi pregi e i suoi difetti. O sbaglio? Dofferentemente dagli altri formati citati, per produrre un PDF oggi l'autore può usare praticamente laqualunque (per poi "stampare su file" alla peggio) per generare il suo bel documento ed essere sicuro che un umano che lo riceve sarà in grado di visualizzarlo, (ahimè) stamparlo o metterlo in un bel "faldone digitale" sperando che un giorno a qualche umano siano utili le informazioni ivi contenute, magari utilizzando un bel "grep" su tutto il testo *non strutturato* :-D
tuttavia io la penso come la Free Software Foundation che definisce il PDF un formato "opaco".
A “Transparent” copy of the Document means a machine-readable copy,
[...]
that is suitable for input to text formatters or for automatic translation to a variety of formats suitable for input to text formatters.
"Automatic translation": ecco a cosa serve un formato trasparente, ad essere RIprocessato [...]
Examples of suitable formats for Transparent copies include plain ASCII with-out markup,
Beh, dal punto di vista della macchina il testo contenuto in un file ASCII (perché no Unicode? :-D ) non strutturato (no markup) è praticamente analogo al testo contenuto in un PDF… a meno che il PDF non contenga il testo e questo *è* un problema col PDF (o col djvu), bisogna essere proprio cattivi a distribuire solo immagini bitmap o vettoriali inglobate in altri contenitori.
Texinfo input format, LaTEX input format,
Uh io ce li vedo gli utenti a scrivere in uno di questi due. Anni fa ad una conferenza un professore delle superiori quasi si offese perché gli chiesi come mai non insegnassero LaTeX nella materia "trattamento testi": esistono SOLO word processors WYSIWYG
SGML or XML using a publicly available DTD,
SGML è spettacolare ma fuori dalla portata media, XML almeno è umanamente gestibile, com un minimo di impegno e strumenti adeguati (che mancano purtroppo). Se lo scopo è quello di fare in modo che le informazioni inserite nel file siano rielaborate E quindi entrino a far parte di un sistema informativo degno di questo nome allora XML *con* un adeguato DTD direi che sono praticamente IMBATTIBILI [1]… tranne il fatto che se l'autore desiderasse usare software libero per comporlo, praticamente avrebbe come unica soluzione quella di imparare a usare Emacs con nxml-mode [2] perché in anni di ricerche non ho trovato alternative a Oxigen XML editor, che è proprietario (ho cercato male?). …oppure usare forms web che lo guidino nella compilazione del XML (o che lo generino in automatico), come succede con i servizi per la compilazione delle fatture elettroniche (o con i software gestionali dotati di questa funzione). La fattura elettronica è il perfetto esempio del fatto che per gestire un sistema informativo allo stato dell'arte è praticamente impossibile non passare da XML (firmato digitalmente) con relativo DTD per l'intercambio dei dati (con fonti eterogenee). [...] Però qui non stiamo parlando di qual'è il formato migliore per contribuire alla costruzione di un sistema informativo degno di questo nome, siamo *solo* parlando di poter firmare un documento digitale nella speranza di vederlo più facilmente riconosciuto come valido da qualche funzionario pubblico o privato. Voi cosa ne pensate? Sono fuori strada? Saluti, Giovanni. [1] non è vero perché RDF serializzato in Notation3 è ancora meglio, ma comincio a delirare :-D [2] che in sé è un'ottima cosa ma la il passaggio da un word processor a un editor testuale implica un cambio di paradigma. -- Giovanni Biscuolo