PDA

Visualizza la versione completa : sitemap generare


Tuning
19-06-2007, 09:37
Ciao ragazzi,
sto generando una sitemap del mio sito, ho 2 domande:

1- il crawler non apre i link estrerni? La mia paura per adsense di google
2- quanto tempo in media impiega? E' partito ieri sera alle 17.00 e ancora sta camminando, arrivato a 115.000 righe. Sono in media con i tempi oppure sono le mie risorse un p lentine?

ciao

Tuning
19-06-2007, 15:41
Nessuno?

rigby76
19-06-2007, 15:45
Non ha ancora finito? :oVVoVe:

Non so, ma quante pagine ha il tuo sito? Comunque il tempo mi sembra un po' lungo...

Tuning
19-06-2007, 16:01
Non ho ancora capito come funziona, ma questa mattina indicava 115.000 ogni tanto torna indietro.
Ora mi dice 101.000 in aumento

il programma GSiteCrawler v1.20

rigby76
19-06-2007, 16:06
avrai comunque un'idea di quante pagine abbia il sito di cui vuoi fare la sitemap, al di l di quello che ti dice il crawler

Tuning
19-06-2007, 16:14
Non ho mai fatto il conto :confused:

rigby76
19-06-2007, 16:19
su dai, come ordine di grandezza... se ne ha 100 o 100.000 lo saprai no?

Tuning
19-06-2007, 16:20
Facendo un rapido calcolo potrebbero essere 35.000, ma allora perch il crawler me ne trova il triplo minimo?
e perch il numero scende per poi risalire?

rigby76
19-06-2007, 17:27
Per prima cosa ti conviene verificare che non si generino indirizzi ripetuti per la stessa pagina: non so se il sito indicizzato gi in qualche motore e se ti prende le pagine correttamente. Questo potrebbe essere dovuto a errori nell'implementazione dell'url rewrite, oppure alla presenza di parametri ridondanti nella querystring.

Poi potresti evitare di inserire nella sitemap per esempio le immagini o altri tipi di file non interessanti; vedi inoltre se il software prevedere un timeout fra il fetch di una pagina e il successivo, magari rallenta per quello.

Tuning
19-06-2007, 18:15
In quest'oretta ho provato SiteMapBuilder.net che ha trovato 180.000 link da processare e ne ha processati 5.000 circa fin quando non ho fermato il programma che mi stava prendendo il 100% delle risorse del PC.
Comuque controllando non mi pare che ci siano url ripetuti, la cosa che noto che ci sono centinaia di url per il Forum (anche di questi nessuno ripetuto) e il forum nel mio sito la cosa minore.
Fatto sta che indicava 180.000 url trovati e non mi tornano i conti :bh:

Loading