Credo di non essere OT chiedendo i contenuti dei files di log.
Non sto chiedendo come si fa tecnicamente ad estrarre i dati da questi files ma quale significato hanno.
Ritengo che tale conoscenza sia fondamentale: è inutile vedere tutti i giorni se sono primo con una parola chiave (e magari disperarsi solo perché Google si è svegliato male) se poi dalle statistiche risulta che con quella parola in realtà nessuno è mai arrivato al mio sito.
Molti visionano i risultati di statistiche già fatte e non potrebbe essere altrimenti: non tutti hanno accesso ai files di log ed è difficile trarre conclusioni dai dati grezzi (ne so qualcosa ma ci sto provando).
Attenzione però.
- spesso i risultati di statistiche già pronte sono inesatti come anche molti di voi hanno fatto notare in questo forum
- spesso non si conosce a fondo il significato di certi risultati e se ne ignora l’utilità (vedi il mio caso dei codici di stato). Ho notato anche ad esempio che molti ignorano ancora il dato fondamentale, la distinzione cioè tra numero di files richiesti, numero di pagine, numero di visite e numero di visitatori
- spesso i risultati propinati non sono esaustivi (sapere che c’è stato il 5% di messaggi “404 Document not found” forse non serve se non si conoscono le altre informazioni relative a questa richiesta come ad esempio il file richiesto)
- spesso i risultati sono fuorvianti. Spesso a seconda di come sono presentati i dati o comunque di come sono interpretati si possono trarre delle conclusioni opposte. Vi faccio un esempio inventato: gestite un sito di biancheria intima. Andate dal titolare del sito, colui che produce la biancheria e lo informate che gli accessi avvengono in maggior parte nelle ore notturne. Il titolare penserà che forse dovrà produrre degli articoli sexy per i depravati della notte. In realtà combinando quei risultati con quelli dell’estensione del referer si scopre che provengono tutti da paesi stranieri dove per il fuso orario è pieno giorno.
E’ un esempio stupido e forse anche sbagliato (l’ora magari è quella del client e non del server), ma vi assicuro per esperienza che questo succede spesso anche in altri campi e soprattutto in notizie date alla televisione dove per mancanza di tempo o volutamente non si spiegano i dettagli di come è stata svolta la statistica e si dà per scontato come vadano interpretati i dati.
Spero qualcuno possa aiutarmi per le domande che ho già posto, altrimenti ne ho molte altre da postarvi:
- perché nello user agent compare diverse volte ‘ia_archiver’ ed il referer è vuoto?
- un visitatore può avere diversi ip?
Per ora vi risparmio le altre.
GRAZIE

Rispondi quotando