Ho trovato questo nelle statistiche..
Scooter/3.3
SurveyBot/2.3+(Whois+Source)
Harvest/HARVEST_VERSION
ia_archiver
![]()
Ho trovato questo nelle statistiche..
Scooter/3.3
SurveyBot/2.3+(Whois+Source)
Harvest/HARVEST_VERSION
ia_archiver
![]()
Scooter/3.3 --> Altavista
SurveyBot/2.3+(Whois+Source) --> www.whois.sc
Harvest/HARVEST_VERSION --> Yahoo
ia_archiver --> Alexa
Attenzione ad Harvest/HARVEST_VERSION.
Esistono spider che si identificano con quell'user-agent ma che non sono quelli di Yahoo.
Se non ricordo male, Harvest era nato come un progetto universitario, è stato reso pubblico ed è stato usato, tra le altre cose, anche da parte degli spammer per collezionare indirizzi e-mail prelevandoli dalle pagine web.
In sintesi: non è detto che sia Yahoo, e le ultime volte che l'ho visto sul mio sito non era Yahoo.
E' ARRIVATO! Usi trucchi che i motori potrebbero ritenere spam? Scoprilo con lo Spam Detector v1.1
Guida approfondita alla visibilità dei siti sui motori: www.motoricerca.info
Originariamente inviato da Low
Attenzione ad Harvest/HARVEST_VERSION.
Esistono spider che si identificano con quell'user-agent ma che non sono quelli di Yahoo.
Se non ricordo male, Harvest era nato come un progetto universitario, è stato reso pubblico ed è stato usato, tra le altre cose, anche da parte degli spammer per collezionare indirizzi e-mail prelevandoli dalle pagine web.
In sintesi: non è detto che sia Yahoo, e le ultime volte che l'ho visto sul mio sito non era Yahoo.
Grazie per l'info luigib
Low e quindi come difendersi?
dalle mie stat:
Mozilla/5.0
Mozilla/3.01 (compatible)
Mozilla/4.7
Mozilla/4.5
Scooter/3.3_SF
FAST-RealWebCrawler/3.8 (crawler@fast.no; http://fast.no/supp
oltre a Googlebot, ma quello lo conosco :adhone:
Partendo dal presupposto che se qualcuno vuole scandagliare il tuo sito in cerca di indirizzi e-mail può comunque farlo senza dichiarare alcuna stringa di user-agent, il mezzo più sicuro in assoluto è quello di individuare l'IP (o l'host) dello "scocciatore" e configurare il server (per Apache basta configurare il file .htaccess) perché non serva pagine a chi proviene da quell'IP/host.Low e quindi come difendersi?
Ovviamente il metodo vale solo se lo scocciatore ha un IP/host dedicato e non lo cambia mai.
L'alternativa alla configurazione del server è quella di usare un linguaggio server-side come PHP o ASP, che sono ugualmente in grado di determinare l'IP del richiedente e comportarsi di conseguenza.
E' ARRIVATO! Usi trucchi che i motori potrebbero ritenere spam? Scoprilo con lo Spam Detector v1.1
Guida approfondita alla visibilità dei siti sui motori: www.motoricerca.info