Visualizzazione dei risultati da 1 a 4 su 4
  1. #1
    Utente di HTML.it
    Registrato dal
    Oct 2005
    Messaggi
    15

    Escludere n files con robot.txt

    Salve,

    avendo su una dir. 1000 files, di cui 150 di essi iniziano
    con "listino", cosa bisogna scrivere dentro robot.txt per escluderli dagli spider? Qualcosa tipo "Disallow: listino_*.php"?

    Es:
    /listino_aaaa.php
    /listino_bbbb.php
    /listino_cccc.php
    /listino_dddd.php
    /listino_eeee.php

    ....etc...etc...

    Lo chiedo, poiche mi trovo con dei "doppioni" di files sul sito di cui alcuni sono già "rankati" (i files "listino_*.php) ed altri (quelli che vorrei adottare in futuro "categoria_*.php") non ancora.

    Cancellando di sana pianta i vecchi "listino_*.php" comporterebbe la perdita del traffico che essi stessi stanno generando sul mio sito, finche i nuovi files "categoria_*.php" non saranno "rankati", prendendo ufficialmente il posto dei vecchi files.

    Come accennato sopra pensavo che le soluzioni potrebbero essere 2:

    -modificare il file robot.txt (inserendo qualcosa tipo "Disallow: listino_*.php"

    -modificare i metatag di ciascun file che voglio escludere con qualcosa tipo "<meta content="noindex, follow" name="robots">"

    -eventualmente tutte e due le soluzioni sopra indicate contemporaneamente

    Al solito, rigrazio anticipatamente chi mi vorrà aiutare.

  2. #2
    Utente di HTML.it L'avatar di fra_975
    Registrato dal
    Jun 2003
    Messaggi
    390
    è tutto scritto:
    http://www.google.it/intl/it/webmast...#exclude_pages

    Per rimuovere tutte le pagine contenute in una particolare directory (ad esempio, lemurs), utilizzate il seguente file robots.txt:

    User-agent: Googlebot
    Disallow: /lemurs

    Per rimuovere tutti i file di un tipo specifico (ad esempio, .gif), utilizzate il seguente file robots.txt:

    User-agent: Googlebot
    Disallow: /*.gif$
    09ottobre2005 ciao Anna

  3. #3
    Utente di HTML.it
    Registrato dal
    Oct 2005
    Messaggi
    15
    Ok, ho visto la pagina..

    ma per escludere solamente files che iniziano con qualcosa del tipo: listino_ssss.php ovvero listino_*.php

    sapete qual'è la dicitura esatta?

    (Premesso che tutti questi files sono mischiati ad altri .php)

  4. #4
    Utilizzi i caratteri jolly come in ogni altra occasione: $ sostituisce un carattere, * sostituisce più caratteri...

    User-agent: Googlebot
    Disallow: /listino_*.php

    Ma non so quanto questo farà sparire dal db di Google quelle pagine e in quanto tempo...

    mettere un Permanent Redirect da listino_*.php a categoria_*.php forse sarebbe la soluzione ideale.

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.