Visualizzazione dei risultati da 1 a 5 su 5

Discussione: Dmoz.org Robots.txt

  1. #1

    Dmoz.org Robots.txt

    Per caso ho scoperto sta cosa
    in http://www.dmoz.org/robots.txt

    User-agent: *
    Disallow: /
    Disallow: /cgi-bin/
    Disallow: /editors/



    Cosa succede?

  2. #2
    che a tutti i crawler è richiesto di non indicizzare il contenuto delle cartelle /cgi-bin/ e /editors/ (quest'ultima, è comunqueprotetta in htpaccess). Quale è il problema ?
    Ettore R. Peyrot
    Marketing Manager - Ability Services
    Info su ODP | QR Mobile Marketing

  3. #3
    Scusami Ettore
    ma questo

    User-agent: *
    Disallow: /

    non significa che vengono disabiliti tutti i file e le directory?

    fonti
    http://www.searchengineworld.com/rob...s_tutorial.htm
    http://www.robotstxt.org/wc/norobots.html#code

  4. #4
    :quote:

  5. #5
    Basandosi sullo standard per l'esclusione dei robots, significa che disabilita tutto.

    Gli spider che non seguono strettamente lo standard (tipo Googlebot), potrebbero continuare ad indicizzare le pagine.
    E' ARRIVATO! Usi trucchi che i motori potrebbero ritenere spam? Scoprilo con lo Spam Detector v1.1
    Guida approfondita alla visibilità dei siti sui motori: www.motoricerca.info

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.