Visualizzazione dei risultati da 1 a 5 su 5
  1. #1
    Utente di HTML.it
    Registrato dal
    Dec 2002
    Messaggi
    215

    Chi lo sa -> (robots.txt)

    Per escludere, con certezza, dall'indicizzazione un file presente nella directory principale (httpdocs) dove c'è pure la index.htm quale delle due istruzioni qui sotto è corretta?

    1) User-agent: *
    Disallow: file_da_escludere.htm

    2) User-agent: *
    Disallow: /file_da_escludere.htm

    Grazie

  2. #2

  3. #3
    Utente di HTML.it L'avatar di assia
    Registrato dal
    May 2002
    Messaggi
    1,181

    Re: Chi lo sa -> (robots.txt)

    Originariamente inviato da fandangood
    Per escludere, con certezza,
    Attenzione, il robots.txt non esclude al 100% i motori, ma solo gli spider che sono stati istruiti a seguire quello standard.
    Qualsiasi file che sia pubblico agli utenti (non in directory protette) potrebbe anche essere "preso" da qualche motore.

  4. #4
    Utente di HTML.it
    Registrato dal
    Dec 2002
    Messaggi
    215
    Quindi consigli il meta tag "noindex" per essere proprio sicuro?

  5. #5
    Se uno spider decide di ignorare una richiesta di un webmaster, la ignora indipendentemente da come la richiesta è stata effettuata.

    Può essere un robots.txt o un meta tag o una preghiera in aramaico: se non vuole soddisfare la tua richiesta non la soddisfa e basta.

    La certezza assoluta non la si può ottenere chiedendo ma impedendo. Giocando con le impostazione del web server e basandosi sulla stringa di user-agent, è possibile impedire ad uno spider di ricevere la pagina.
    E' ARRIVATO! Usi trucchi che i motori potrebbero ritenere spam? Scoprilo con lo Spam Detector v1.1
    Guida approfondita alla visibilità dei siti sui motori: www.motoricerca.info

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.