ciao a tutti
Sono nuovo del settore web promotion
chi di voi mi sa dire quali sono i comandi per lo spider da inserire nelle pagine?
![]()
ciao a tutti
Sono nuovo del settore web promotion
chi di voi mi sa dire quali sono i comandi per lo spider da inserire nelle pagine?
![]()
Quali comandi? :master:
![]()
nel codice HTML ...per caso non c'è la possibilità di dire allo spider quante volte venire a visitare il sito etc...?
sto vedendo alcuni siti questa "testata" mi sembra interessante
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-html401-19991224/loose.dtd">
<HTML><HEAD><TITLE>INTEGRA SPORT - Sito Versione HTML</TITLE>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META content="Integra Sport"
name=description>
<META content=integratori, name=keywords>
<META content="Melapì rimini" name=author>
<META content="MSHTML 6.00.2800.1400" name=GENERATOR>
Tu intendi i META TAG per gli spider??
<META name="robots" CONTENT="nofollow/index/noindex/follow/all">
Le opzioni del campo CONTENT possono essere:
* nofollow = non proseguire nell'indicizzazione
* index = indicizza questa pagina
* noindex = non indicizzare questa pagina
* follow = prosegui ad indicizzare le altre pagine
* all = indicizza tutte le pagine
oppure il robot.txt...
http://www.robotstxt.org/
![]()
Non prendere la vita troppo sul serio:
tanto, per quanto tu possa faticare,
alla fine non ne uscirai vivo
(Kin Hubbard)
ELPASO
mi illumini per quel che riguarda il ROBOT ?![]()
cosa è
[edit shiftzero: sostituita parola. Era proprio necessario?]
Ma il robot.txt è un file di testo memorizzato nella directory di primo livello di un sito al fine di impedire che i robot (spider dei motori di ricerca) accedano a certe pagine o sub-directories del sito.
Solo i robot conformi alle regole del "Robots Exclusion Standard" leggeranno e seguiranno i comandi contenuti nel file.
I robot leggeranno il file ad ogni visita, in questo modo le pagine, o intere aree di un sito, possono essere rese pubbliche o private in ogni momento semplicemente cambiando il contenuto del file robot.txt prima di sottometterle nuovamente all'attenzione dei motori di ricerca.
ES. PER evitare che tutti i robot visitino la directory /prova:
User-agent: *
Disallow: /prova
Per dire a tutti i robot di visitare tutto il sito
User-agent: *
Disallow:
Per impedire a googlebot di visitare tutto il sito
User-agent: googlebot
Disallow: /
![]()
Non prendere la vita troppo sul serio:
tanto, per quanto tu possa faticare,
alla fine non ne uscirai vivo
(Kin Hubbard)
mI SA CHE DEVO LEGGERMI DIVERSE COSETTE :master:
Ti consiglio:
www.motoricerca.info/
http://www.giorgiotave.it/guida_posi...a/sommario.php
e leggi i vari topic di questo forum...... ci sono discussioni interessantissime...
Anche io sto imparando da qui..
![]()
![]()
Non prendere la vita troppo sul serio:
tanto, per quanto tu possa faticare,
alla fine non ne uscirai vivo
(Kin Hubbard)