funzione di ricerca nelle mail della lista?
vorrei recuperare i messaggi scambiati in lista in cui si parla della scuola, ma sono un po' in difficoltà con https://www.mail-archive.com/search?a=1&l=all&haswords=&x=12&y=7&from=nexa posto che gli archivi sono online, ci sono altri strumenti che si possono usare, al posto di mail-archive? Maurizio ------------------------------------------------------------------------ one of the things I really believed in is the idea of simplicity, that life should always be moving toward more simplicity rather than more complexity yvon chouinard ------------------------------------------------------------------------ Maurizio Lana Università del Piemonte Orientale Dipartimento di Studi Umanistici Piazza Roma 36 - 13100 Vercelli
puoi scaricare[*] tutti gli mbox da https://server-nexa.polito.it/pipermail/nexa/ (sono i "Gzip'd Text") e poi li leggi (meglio, li integri) col tuo client di posta (sempre che non sia outlook o un client web si intende) come normali messaggi di posta :) [*] usando wget/curl o analoghi meccanismi (in Firefox ad esempio uso http://www.downthemall.net), o anche a mano (molto più tedioso) On 28/02/2024 14:23, maurizio lana wrote:
vorrei recuperare i messaggi scambiati in lista in cui si parla della scuola, ma sono un po' in difficoltà con https://www.mail-archive.com/search?a=1&l=all&haswords=&x=12&y=7&from=nexa posto che gli archivi sono online, ci sono altri strumenti che si possono usare, al posto di mail-archive? Maurizio
-- Andrea Trentini ⠠⠵ http://atrent.it public key ID: 0xA7A91E3B Dip.to di Informatica Università degli Studi di Milano
grazie Andrea, la soluzione per scaricare i messaggi l'avevo sotto gli occhi ma non la vedevo. quanto alla ricerca che mi interessa fare, se cerco "scuola" nei messaggi attraverso mail-archive ottengo 28 esiti; se cerco nei messaggi offline, con il viewer PDF trovo 671 pagine (quindi anche più di 671 esiti) Maurizio Il 28/02/24 15:34, Andrea Trentini ha scritto:
puoi scaricare[*] tutti gli mbox dahttps://server-nexa.polito.it/pipermail/nexa/ (sono i "Gzip'd Text") e poi li leggi (meglio, li integri) col tuo client di posta (sempre che non sia outlook o un client web si intende) come normali messaggi di posta
:)
[*] usando wget/curl o analoghi meccanismi (in Firefox ad esempio usohttp://www.downthemall.net), o anche a mano (molto più tedioso)
On 28/02/2024 14:23, maurizio lana wrote:
vorrei recuperare i messaggi scambiati in lista in cui si parla della scuola, ma sono un po' in difficoltà con https://www.mail-archive.com/search?a=1&l=all&haswords=&x=12&y=7&from=nexa posto che gli archivi sono online, ci sono altri strumenti che si possono usare, al posto di mail-archive? Maurizio
------------------------------------------------------------------------ roughneck and rudeness we should be using, on the ones who practice wicked charms for the sword and the stone, bad to the bone battle's not over even when it's won youssou n'dour & nene cherry, 7 seconds ------------------------------------------------------------------------ Maurizio Lana Università del Piemonte Orientale Dipartimento di Studi Umanistici Piazza Roma 36 - 13100 Vercelli
On 28/02/2024 17:54, maurizio lana wrote:
grazie Andrea, la soluzione per scaricare i messaggi l'avevo sotto gli occhi ma non la vedevo.
;)
quanto alla ricerca che mi interessa fare, se cerco "scuola" nei messaggi attraverso mail-archive ottengo 28 esiti;
dipende da che tipo di ricerca fa mail-archive, se come probabile fa una ricerca per subject ne trovi pochi consiglio scaricarsi i gzip, integrarli in client posta (io uso ad esempio sia thunderbird che soprattutto notmuch per le ricerche) e fare query più articolate (subject, body, etc.)
se cerco nei messaggi offline, con il viewer PDF trovo 671 pagine (quindi anche più di 671 esiti)
questa non l'ho capita, cosa c'entra il viewer pdf con la mail? -- Andrea Trentini ⠠⠵ http://atrent.it public key ID: 0xA7A91E3B Dip.to di Informatica Università degli Studi di Milano
"mail-archive" è il tool di ricerca sui messagi integrato nel sito nexa, e trova 28 esiti la ricerca full text (pdf o txt è irrilevante) ne trova 670 M Il 28/02/24 18:38, Andrea Trentini ha scritto:
On 28/02/2024 17:54, maurizio lana wrote:
grazie Andrea, la soluzione per scaricare i messaggi l'avevo sotto gli occhi ma non la vedevo. ;)
quanto alla ricerca che mi interessa fare, se cerco "scuola" nei messaggi attraverso mail-archive ottengo 28 esiti; dipende da che tipo di ricerca fa mail-archive, se come probabile fa una ricerca per subject ne trovi pochi
consiglio scaricarsi i gzip, integrarli in client posta (io uso ad esempio sia thunderbird che soprattutto notmuch per le ricerche) e fare query più articolate (subject, body, etc.)
se cerco nei messaggi offline, con il viewer PDF trovo 671 pagine (quindi anche più di 671 esiti) questa non l'ho capita, cosa c'entra il viewer pdf con la mail?
------------------------------------------------------------------------ e non sapevano che celavo una continua attesa d'andarmene david maria turoldo ------------------------------------------------------------------------ Maurizio Lana Università del Piemonte Orientale Dipartimento di Studi Umanistici Piazza Roma 36 - 13100 Vercelli
On 28/02/2024 18:49, maurizio lana wrote:
"mail-archive" è il tool di ricerca sui messagi integrato nel sito nexa, e trova 28 esiti
sisi, ho visto cos'è, è che non so dirti che tipo di ricerca fa... noto ora che il default è una ricerca con From: uguale a "nexa", se lo togli ottieni *parecchio* di più ;) vedi screenshot allegato (se non lo taglia mailman) -- Andrea Trentini ⠠⠵ http://atrent.it public key ID: 0xA7A91E3B Dip.to di Informatica Università degli Studi di Milano
sì mail-archive ne trova 5392, ma in tutte le mailing-list che ha in pancia... M Il 28/02/24 19:12, Andrea Trentini ha scritto:
On 28/02/2024 18:49, maurizio lana wrote:
"mail-archive" è il tool di ricerca sui messagi integrato nel sito nexa, e trova 28 esiti sisi, ho visto cos'è, è che non so dirti che tipo di ricerca fa...
noto ora che il default è una ricerca con From: uguale a "nexa", se lo togli ottieni *parecchio* di più ;)
vedi screenshot allegato (se non lo taglia mailman)
------------------------------------------------------------------------ felicità del poco edith bruck ------------------------------------------------------------------------ Maurizio Lana Università del Piemonte Orientale Dipartimento di Studi Umanistici Piazza Roma 36 - 13100 Vercelli
sì mail-archive ne trova 5392, ma in tutte le mailing-list che ha in pancia... M
devi mettere [nexa] nel Subject, non nel From. In questo modo te ne trova 437, vedi qui: https://www.mail-archive.com/search?a=1&l=all&haswords=scuola&x=0&y=0&from=&subject=[nexa] A.
Buongiorno, Antonio <antonio@piumarossa.it> writes:
sì mail-archive ne trova 5392, ma in tutte le mailing-list che ha in pancia... M
devi mettere [nexa] nel Subject, non nel From. In questo modo te ne trova 437, vedi qui: https://www.mail-archive.com/search?a=1&l=all&haswords=scuola&x=0&y=0&from=&subject=[nexa]
Questa è la query corretta, considerato che per fortuna il software che gestisce la lista aggiunge [nexa] a tutti i subject. Comunque un giorno riuscirò a convincere il mio alter ego a trovare il tempo di metter su una istanza di public-inbox [1] per la lista Nexa e per quella AISA, perché sono risorse _preziosissime_ e meritano di essere preservate per bene. Cercando di rispettare le linee guida di marketing [2] non userò superlativi o altre super*, ma public-inbox batte di alcuni ordini di grandezza mail-archive, specialmente in potenza di ricerca (e /quindi/ è lo strumento perfetto per i ricercatori) Per capirci, con public-inbox si hanno a disposizione questi criteri di ricerca (configurabili per istanza): --8<---------------cut here---------------start------------->8--- s: match within Subject e.g. s:"a quick brown fox" d: match date-time range, git "approxidate" formats supported Open-ended ranges such as `d:last.week..' and `d:..2.days.ago' are supported b: match within message body, including text attachments nq: match non-quoted text within message body q: match quoted text within message body n: match filename of attachment(s) t: match within the To header c: match within the Cc header f: match within the From header a: match within the To, Cc, and From headers tc: match within the To and Cc headers l: match contents of the List-Id header bs: match within the Subject and body [...] --8<---------------cut here---------------end--------------->8--- (da https://yhetil.org/guix-devel/_/text/help/) É /quasi/ come avere una interfaccia web di Notmuch [3] dedicata a una mailing list; nulla può battere un database locale Notmuch [4], ma public-inbox è un ottimo strumento sussidiario per chi non ha voglia di installarselo localmente. Saluti, 380° [1] https://public-inbox.org/README.html [2] https://public-inbox.org/marketing.html [3] https://notmuchmail.org/ [4] la ricerca "query:nexa scuola" su un database di più di 800K email ci mette circa 3 secondi (la query:nexa restringe la ricerca ai messaggi con header ListId:".*nexa.*"); il solo conteggio dei messaggi corrispondenti meno di mezzo secondo, io ne ho 636 nel mio archivio. P.S.: l'email è stata data per morta troppo presto... e un po' troppo superficialmente :-D -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.
On gio, 2024-02-29 at 11:53 +0100, 380° wrote:
Buongiorno,
Antonio <antonio@piumarossa.it> writes:
sì mail-archive ne trova 5392, ma in tutte le mailing-list che ha in pancia... M
devi mettere [nexa] nel Subject, non nel From. In questo modo te ne trova 437, vedi qui: https://www.mail-archive.com/search?a=1&l=all&haswords=scuola&x=0&y=0&from=&subject=[nexa]
Questa è la query corretta, considerato che per fortuna il software che gestisce la lista aggiunge [nexa] a tutti i subject.
Comunque un giorno riuscirò a convincere il mio alter ego a trovare il tempo di metter su una istanza di public-inbox [1] per la lista Nexa e per quella AISA, perché sono risorse _preziosissime_ e meritano di essere preservate per bene.
Qui posso postare un suggerimento, visto che di archiviazione a lungo termine mi sono occupato di recente. https://medium.com/@calamarim/list/archivismi-la-serie-689254e647ad "Preservare per bene" secondo me dovrebbe far prendere in considerazione anche un'archiviazione di questo tipo, ad esempio su Internet Archive. Anche soltanto caricandoci un pdf, i processi automatici lo rendono ricercabile e selezionabile, anche se è fatto di pagine scansionate. L'OCR che usano fa letteralmente paura! Poi, se traguardiamo i secoli, c'è sempre l'Arctic World Archive"! JM2C. Buona giornata a tutti. Marco
Cercando di rispettare le linee guida di marketing [2] non userò superlativi o altre super*, ma public-inbox batte di alcuni ordini di grandezza mail-archive, specialmente in potenza di ricerca (e /quindi/ è lo strumento perfetto per i ricercatori)
Per capirci, con public-inbox si hanno a disposizione questi criteri di ricerca (configurabili per istanza):
--8<---------------cut here---------------start------------->8---
s: match within Subject e.g. s:"a quick brown fox" d: match date-time range, git "approxidate" formats supported Open-ended ranges such as `d:last.week..' and `d:..2.days.ago' are supported b: match within message body, including text attachments nq: match non-quoted text within message body q: match quoted text within message body n: match filename of attachment(s) t: match within the To header c: match within the Cc header f: match within the From header a: match within the To, Cc, and From headers tc: match within the To and Cc headers l: match contents of the List-Id header bs: match within the Subject and body
[...]
--8<---------------cut here---------------end--------------->8--- (da https://yhetil.org/guix-devel/_/text/help/)
É /quasi/ come avere una interfaccia web di Notmuch [3] dedicata a una mailing list; nulla può battere un database locale Notmuch [4], ma public-inbox è un ottimo strumento sussidiario per chi non ha voglia di installarselo localmente.
Saluti, 380°
[1] https://public-inbox.org/README.html
[2] https://public-inbox.org/marketing.html
[4] la ricerca "query:nexa scuola" su un database di più di 800K email ci mette circa 3 secondi (la query:nexa restringe la ricerca ai messaggi con header ListId:".*nexa.*"); il solo conteggio dei messaggi corrispondenti meno di mezzo secondo, io ne ho 636 nel mio archivio.
P.S.: l'email è stata data per morta troppo presto... e un po' troppo superficialmente :-D
participants (5)
-
380° -
Andrea Trentini -
Antonio -
Marco A. Calamari -
maurizio lana