On gio, 2024-02-29 at 11:53 +0100, 380° wrote:
Buongiorno,

Antonio <antonio@piumarossa.it> writes:

sì mail-archive ne trova 5392, ma in tutte le mailing-list che ha in
pancia...
M

devi mettere [nexa] nel Subject, non nel From.
In questo modo te ne trova 437, vedi qui:
https://www.mail-archive.com/search?a=1&l=all&haswords=scuola&x=0&y=0&from=&subject=[nexa]

Questa è la query corretta, considerato che per fortuna il software che
gestisce la lista aggiunge [nexa] a tutti i subject.

Comunque un giorno riuscirò a convincere il mio alter ego a trovare il
tempo di metter su una istanza di public-inbox [1] per la lista Nexa e
per quella AISA, perché sono risorse _preziosissime_ e meritano di
essere preservate per bene.

Qui posso postare un suggerimento, visto che di archiviazione a lungo termine
 mi sono occupato di recente.

https://medium.com/@calamarim/list/archivismi-la-serie-689254e647ad

"Preservare per bene" secondo me dovrebbe far prendere in considerazione 
 anche un'archiviazione di questo tipo, ad esempio su Internet Archive.

Anche soltanto caricandoci un pdf, i processi automatici lo rendono ricercabile 
 e selezionabile, anche se è fatto di pagine scansionate.

L'OCR che usano fa letteralmente paura!

Poi, se traguardiamo i secoli, c'è sempre l'Arctic World Archive"!

JM2C.   Buona giornata a tutti.   Marco



Cercando di rispettare le linee guida di marketing [2] non userò
superlativi o altre super*, ma public-inbox batte di alcuni ordini di
grandezza mail-archive, specialmente in potenza di ricerca (e /quindi/ è
lo strumento perfetto per i ricercatori)

Per capirci, con public-inbox si hanno a disposizione questi criteri di
ricerca (configurabili per istanza):

--8<---------------cut here---------------start------------->8---

    s:        match within Subject  e.g. s:"a quick brown fox"
    d:        match date-time range, git "approxidate" formats supported
              Open-ended ranges such as `d:last.week..' and
              `d:..2.days.ago' are supported
    b:        match within message body, including text attachments
    nq:       match non-quoted text within message body
    q:        match quoted text within message body
    n:        match filename of attachment(s)
    t:        match within the To header
    c:        match within the Cc header
    f:        match within the From header
    a:        match within the To, Cc, and From headers
    tc:       match within the To and Cc headers
    l:        match contents of the List-Id header
    bs:       match within the Subject and body

[...]

--8<---------------cut here---------------end--------------->8---
(da https://yhetil.org/guix-devel/_/text/help/)

É /quasi/ come avere una interfaccia web di Notmuch [3] dedicata a una
mailing list; nulla può battere un database locale Notmuch [4], ma
public-inbox è un ottimo strumento sussidiario per chi non ha voglia di
installarselo localmente.

Saluti, 380°


[1] https://public-inbox.org/README.html

[2] https://public-inbox.org/marketing.html

[3] https://notmuchmail.org/

[4] la ricerca "query:nexa scuola" su un database di più di 800K email ci
mette circa 3 secondi (la query:nexa restringe la ricerca ai messaggi
con header ListId:".*nexa.*"); il solo conteggio dei messaggi
corrispondenti meno di mezzo secondo, io ne ho 636 nel mio archivio.


P.S.: l'email è stata data per morta troppo presto... e un po' troppo
superficialmente :-D