msn bot: ma è mai possibile?

**cyberbooks** · 23-12-2004, 16:40

E un bel cartello con scritto "torno subito"?

Per non andare OT: dico una fesseria, o Google ha qualcosa tipo 25.000 server?
In questo caso, ad una media di 1 pagina al secondo, per indicizzare 5 miliardi di pagine ci impiegherebbe 2-3 giorni.

**xnavigator** · 23-12-2004, 20:29

Originariamente inviato da cyberbooks
E un bel cartello con scritto "torno subito"?

Per non andare OT: dico una fesseria, o Google ha qualcosa tipo 25.000 server?
In questo caso, ad una media di 1 pagina al secondo, per indicizzare 5 miliardi di pagine ci impiegherebbe 2-3 giorni.

no ne ha acquistato di meno, ma fa girare su ognuno più bot, ovviamente..

il software non occupa niente, pochissime risorse

(e poi considera che lui ne ha 8, rifai il calcolo

)

**carmineabomb** · 23-12-2004, 21:22

P.S: non c'è un modo per dire agli spider di passare più tardi?

Alcuni spider leggono questo metatag
<META NAME="revisit-after" CONTENT="30 days">
così lo spider dovrebbe passare ogni 30 giorni

**Enrico OLIVETTI** · 24-12-2004, 09:06

Mesi fa ho avuto anch'io lo stesso problema con MSN boot.

Bloccare lo spider mi sembrava una grande str...zata, perché vuol dire precludersi comunque una possibilità di sviluppo del sito.

Analizzando il log, mi sono accorto che il boot di MS è molto più stupido di googlebot, e va facilmente in loop. A me per esempio si succhiava tutti i dati di dmoz che ho incorporato nel sito tramite un CGI.

Mi è bastato escludere, con robots.txt, la directory /cgi-bin e dal quel momento la situazione è tornata nella normalità.

Quindi consiglio di leggere per bene i logs del server e vedere dove lo spider si "impalla", quindi escludere solo quella directory.

**cyberbooks** · 24-12-2004, 12:14

Guardando i log (anche se non con molta attenzione), ho notato solo che MSN cercava di accedere a pagine inesistenti.
Tu cosa intendi per "impallarsi"? Mi consigli di escludere directory poco importanti e succhiano parecchie risorse del server?

**Enrico OLIVETTI** · 24-12-2004, 13:53

Io ho parlato del caso mio, dove succedeva che seguendo un link, lo spider di MSN si leggeva tutte quante le pagine di ODP succhiando risorse a tutto spiano.

Io leggendo i percorsi ho capito questo dai miei logs. Così ho escluso la directory cgi-bin con il robots.

I motivi per cui msn va in loop possono essere infiniti. Io ho suggerito di controllare questo per avere qualche indizio in base al quale vedere come si comporta MSn sul tuo sito.

Segui sul log dove passa e ripassa, magari trovi la correzione al problema.

**weppos** · 24-12-2004, 14:37

Originariamente inviato da Enrico OLIVETTI
Io ho parlato del caso mio, dove succedeva che seguendo un link, lo spider di MSN si leggeva tutte quante le pagine di ODP succhiando risorse a tutto spiano.

Io leggendo i percorsi ho capito questo dai miei logs. Così ho escluso la directory cgi-bin con il robots.

I motivi per cui msn va in loop possono essere infiniti. Io ho suggerito di controllare questo per avere qualche indizio in base al quale vedere come si comporta MSn sul tuo sito.

Segui sul log dove passa e ripassa, magari trovi la correzione al problema.

Osservazione interessante.
Sto riscontrando una situazione simile su un forum dove per eccellenza è pieno di link dinamici e collegamenti rindondanti.

**giorgiotave** · 24-12-2004, 15:34

Originariamente inviato da carmineabomb
Alcuni spider leggono questo metatag
<META NAME="revisit-after" CONTENT="30 days">
così lo spider dovrebbe passare ogni 30 giorni

tutti lo leggono nessuno lo interpreta

quel meta non serve a niente!

Discussione: msn bot: ma è mai possibile?

Strumenti discussione

Ricerca discussione

Visualizza

Mia esperienza personale

Msn

Re: Msn

Permessi di invio