PDA

Visualizza la versione completa : Chi mi aiuta a fare statistiche dei client mail?


virusbye
13-01-2005, 12:07
Recentemente ho fatto uno studio sui client mail, notando che la percentuale di Thunderbird e di Linux nel mercato è abbastanza significativa.

http://fabrizio.ciacchi.it/guide.php?pagina=mailer

Ora, poichè vorrei allargare il campione della statistica, avrei bisogno del vostro aiuto; se avete thunderbird (sia per linux che per win) o qualche altro programma di posta che salva le email in chiaro, basta aprire una console, portarsi nella directory dove è salvata la posta (in thunderbird è .thunderbird/<cartella>/Mail/<account>) e dare il comando grep per "catturare" tutte le linee che contengono (nelle email) l'identificativo del programma di posta.

Ecco un esempio



$ cd .thunderbird/<cartella>/Mail/<account>
$ grep -rh -i x-mailer: <nomefile> >> xmailer.txt
$ grep -rh -i user-agent: <nomefile> >> useragent.txt
$ tar -czf statistica.tar.gz xmailer.txt useragent.txt


Due cose molto importanti:
1) serve sia l'x-mailer, che identifica i client windows, sia lo user-agent, che identifica i client per linux (o cmq alternativi ad Outlook); con un file solo la statistica risulterebbe falsata, perchè un programma di posta usa solo uno dei due identificativi. Inoltre vi sarei grato se poteste dirmi il numero totale di email da cui quei dati sono stati estrapolati, in questo modo è possibile dire "su X mail ricevute, una tal percentuale conteneva l'identificativo, di quella percentuale A sono di client Windows e B di client Linux".
2) <nomefile> identifica il nome del file che contiene le email: l'operazione va fatta per tutti i file delle email ricevute, ma NON di quelle inviate, perchè, anche in questo caso, la statistica risulterebbe falsata, infatti verrebbero conteggiate le email da voi inviate, e quindi la percentuale dei client linux nella statistica aumenterebbe in maniera spropositata.

Sembra complicato ma in realtà bastano cinque minuti (anche meno) per raccogliere il campione ed inviarmi una email. Chiedo la vostra collaborazione perchè ritengo che lo studio sia importante, non solo per vedere la diffusione dei programmi di posta, ma anche per vedere la diffusione di Linux; ad esempio, dalle mie statistiche risulta che la diffusione di Linux supera di molto quella del Macintosh, ed è comunque più alta di quello che leggiamo da fonti anche molto autorevoli.

Mi dareste una mano? :D

la mia mail è fabrizio@ciacchi.it

altor
13-01-2005, 13:23
Ciao virus! :) :)

Sto seguendo il tuo lavoro sulle mail. Di fatto non posso aiutarti perchè non ho molto traffico di posta e uso solo l'interfaccia web.

Volevo solo dirti, se puoi, di allargare al massimo la tua richiesta a utenti "non linux". Infatti mi pare logico supporre che nel forum troverai utenti linux che probabilmente hanno a loro volta rapporti con un numero di utenti linux "superiore alla media" (a partire proprio da te, non so se mi spiego....).

In altre parole, perchè la tua ricerca abbia una sufficiente attendibilità dovresti fare in modo che il campione che prendi in esame sia il più possibile casuale e libero da distorsioni che limiterebbero il valore del risultato. Sapere quanti utenti sono linux-based e quanti windows-based potrebbe aiutarti a capire se e quanto i tuoi risultati sono "distorti" per la non casualità del campione.

Non so se ti stai già muovendo in questo senso....


Comunque è una bella iniziativa, buon proseguimento!

vortex87
13-01-2005, 18:37
Ma non era già stato postato? :stordita:

Comunque inviato, anche se non ho molte mail :fagiano:

virusbye
13-01-2005, 20:44
@altor
si sto provando anche l'utenza solo windows, solo che sto cercando un campione abbastanza affidabile; posterei la medesima cosa sul forum software, solo che dovrebbero non avere outlook (che "codifica" le email, mentre in eudora e thunderbird sono in chiaro), e poi non so, francamente, come far fare in windows la medesima cosa del comando grep di linux.

@vortex87
si, però visto che lo avevo uppato troppe volte e visto che avevo un solo campione valido, ho deciso di rifare un nuovo thread :D

Marcolino's
14-01-2005, 01:22
Posso darti un campione significativo di 10 email al giorno che arrivano ad un grande ente statale di Udine: frontpage :fagiano: escludendo ovviamente le 30/40 email di spam, virus, catene di santantonio che non prendo in esame perché il client è invariabilmente un server.

Ah no, il consiglio superiore della magistratura usa Linux Suse 9.2 e evolution :oVVoVe: ma ne arriverà una o due al mese.

Forse non è statistica significativa, ma ti allarga il giro delle conoscenze.

Per ora non posso inviarti nulla, vediamo domani dall'ufficio
(win 200 pro), a casa non uso client email, preferisco leggere dal server :dottò:

altor
14-01-2005, 11:54
Originariamente inviato da Marcolino's
Posso darti un campione significativo di 10 email al giorno che arrivano ad un grande ente statale di Udine:

Questo è un bel campione casuale!!!
:yuppi: :yuppi:


Ciao!

virusbye
14-01-2005, 18:34
UP!

Ora ne ho quattro o cinque di email con le statistiche :D

Continuate pure a mandarmele :D

Rommel
14-01-2005, 23:33
ciao,
hai provato a chiedere ai moderatori di alcuni newsgroup il permesso di poter estrapolare le statistiche da lì?
però non credo si possa fare :fagiano:

io ho pochissime mail "reali": la maggior parte dono inviate nelle registrazioni a siti vari.
comunque cercherò di unirle tutte e ti invio le statistiche (purtroppo misere) :ciauz:

virusbye
15-01-2005, 18:58
Originariamente inviato da Rommel
ciao,
hai provato a chiedere ai moderatori di alcuni newsgroup il permesso di poter estrapolare le statistiche da lì?
però non credo si possa fare :fagiano:

io ho pochissime mail "reali": la maggior parte dono inviate nelle registrazioni a siti vari.
comunque cercherò di unirle tutte e ti invio le statistiche (purtroppo misere) :ciauz:

Tranquillo, estrapolando l'x-mailer e lo user-agent si eliminano moltissime mail "non-personali" come quelle di newsletter ed altro. :D

virusbye
18-01-2005, 01:03
UP

Per ora sono a quota cinque persone in totale :D

Loading