Visualizzazione dei risultati da 1 a 4 su 4
  1. #1

    Rewriterule e Strani accessi di Googlebot

    Buongiorno a tutti!
    nel sito Manutentori Polesani ho installato TraceWatch e, controllando l'accesso dei Bot, ho notato che GoogleBot mi indicizza le seguenti pagine: archivio-articoli-79.html, archivio-articoli-80.html e così via (siamo arrivati a 121). Devo dire che il sito é fatto in PHP e per rendere gli URL SE Friendly ho usato il collaudato metodo delle RewriteRules.

    La RewriteRule che ho in questo caso é:
    [code]RewriteRule ^archivio-articoli-([0-9]{1,4}).html$ index.php?mod=xxx&pagina=$1 [L]

    Io "so" che Google indicizza i contenuti a seconda dei link che trova nelle pagine che visita... e vi assicuro che in nessuna pagina viene messo un link come quelli segnalati sopra. Come posso fare per fare in modo che Googlebot la smetta di indicizzare pagine inesistenti? Grazie mille e spero di aver postato nel forum giusto.
    "it's a dark night!"
    Il sito internet del mio EX studio:
    http://www.tribal-art.it/
    Il sito internet dei Manutentori di Caldaie:
    http://www.manutentori-caldaia-polesani.it/

  2. #2
    Moderatore di Server Apache L'avatar di marketto
    Registrato dal
    Sep 2001
    Messaggi
    5,858
    ti sposto
    think simple think ringo

  3. #3
    Utente di HTML.it L'avatar di Serp
    Registrato dal
    Jan 2006
    Messaggi
    46
    Il comportamento del Googlebot che hai appena descritto è ben noto. L'ho anche personalmente riscontrato in alcune tipologie ben definite di nomenclatura di pagine (HTML, Pdf, txt), e di immagini

    Nel tuo caso, per risolvere il problema potresti per esempio modificare l'algo di generazione delle pagine in maniera da inserire nella sezione HEAD del codice HTML questo frammento di codice: <meta name="robots" content="noindex,nofollow" />.

    Potresti anche far restituire al tuo server il codice 404 nell'intestazione HTTP.

    Se il tuo problema è localizzato solo ad una o più directory, potresti allora intervenire selettivamente impostando adeguatamente il robots.txt

    Ti sconsiglio di ricorrere alle redirezioni

    Ciao

  4. #4
    Grazie per il consiglio. Ho comunque risolto, era un problema di codice PHP. Infatti se si andava su pagine formate come ho descritto più sopra il mio script formava i link alle pagine successive (inesistenti). In questo modo Google trovava infinite pagine con praticamente nessun contenuto (mai 404). Grazie mille ancora! (spero solo che Google non consideri questo qualche tentativo di migliorare il posizionamento con trucchetti...)
    "it's a dark night!"
    Il sito internet del mio EX studio:
    http://www.tribal-art.it/
    Il sito internet dei Manutentori di Caldaie:
    http://www.manutentori-caldaia-polesani.it/

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2026 vBulletin Solutions, Inc. All rights reserved.