PDA

Visualizza la versione completa : Escludere delle pagine dai motori di ricerca


diegoctn
03-01-2007, 15:59
Ragazzi vorrei escludere delle pagine dall'indicizzazione dei motori di ricerca, come posso fare? Ricordo qualcosa come robot=no.........qualche consiglio? Grazie mille

the_wanderer
03-01-2007, 17:07
Usando il robots puoi decidere in prima istanza se escludere solo qualcuno oppure tutti gli spider. Nel caso in cui volessi impedire l'accesso solo ad alcuni spider usa

User-agent: nome bot

ad esempio
User-agent: googlebot

Se vuoi escludere la pagina a pių di un bot li devi dichiarare separatamente.

Poi devi indicare tutte le pagine che non vuoi siano indicizzate, lo fai in questo modo(puoi nascondere anche delle cartelle)

Disallow: /primofile.html
Disallow: /cartella1/

Se non vuoi che una determinata pagina sia indicizzata da qualsiasi motore di ricerca allora puoi usare questa sintassi

User-agent: *
Disallow: /file.html

Delle raccomandazioni:
Accertati che il file robots.txt sia chiamato cosė e che sia nella directory principale del sito.
Meglio non usarlo per nascondere doorway con tecniche spammose

the_wanderer
03-01-2007, 17:41
Al limite puoi usare questo meta

<META NAME="ROBOTS" CONTENT="NOARCHIVE">, forse tu ti riferivi a questo.
:ciauz:

devil105
03-01-2007, 18:07
Originariamente inviato da the_wanderer
Al limite puoi usare questo meta

<META NAME="ROBOTS" CONTENT="NOARCHIVE">, forse tu ti riferivi a questo.
:ciauz:

La trovo la soluzione pių adeguata in quanto ti garantisce la non indicizzazione della pagina anche se linkata da siti esterni.

Di solito il robot.txt personalmente lo uso per evitare l'indicizzazione di cartelle sensibili o cartelle ad esempio contenenti pannelli di amministrazione ecc ecc insomma per contenuti e pagine non direttamente accessibili dal sito.



:ciauz:

diegoctn
03-01-2007, 19:04
Si, infatti. Grazie mille a tutti e due. Ciao

Loading