Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 13
  1. #1

    Forzare la rimozione veloce di pagine dal sito

    Qual'è il metodo più efficace? Le pagine continuano a esistere, ma sono escluse dal robots.txt

  2. #2

  3. #3
    Utente di HTML.it
    Registrato dal
    Jan 2001
    Messaggi
    1,742
    Cerchiamo di capire quale tipo di rimozione devo fare per il mio problema.
    il mio sito era strutturato con parecchie pagine dinamiche quindi link dinamici che poi li ho trasformati con il mod_rewrite in link statici.
    A google su ogni pagina dinamica l'ho anche avvisato con un redirect permanent di considerare la pagina statica ma a quando vedo non le ha digerite tutte.. infatti facendo una ricerca con site: ho notato che google ha ancora nel suo indice 182 pagine con link dinamico e le corrispondenti statiche vengono quindi viste come copioni.

    Adesso avevo pensato tramite il robot di segnalare la cosa ma leggendo qui http://services.google.com:8882/urlconsole/controller ho visto che ci sono altri metodo, come la rimozione di un collegamento obsoleto http://www.google.com/webmasters/remove.html#outdated però con una nota ben precisa:
    Nota: se ritenete che la vostra richiesta sia urgente e non potete aspettare la scansione successiva del vostro sito, utilizzate il nostro sistema automatico di rimozione URL. Accetteremo la vostra richiesta di rimozione solo se la pagina restituisce un vero errore 404 tramite le intestazioni http. Verificate che venga restituito un vero errore 404 anche se scegliete di visualizzare per i visitatori un corpo della pagina HTML più semplice. Non è di aiuto restituire una pagina "File non trovato" se le intestazioni http restituiscono comunque un codice di stato 200 o normale.
    quindi non penso sia il metodo giusto..
    quindi mi domando come devo fare?

  4. #4
    apparte che il secondo link reindirizza al primo.. perchè pensi non sia il metodo giusto?


    se hai pagine dinamiche controlli l'id per esempio e se non è quello giusto gli passi l'header 404

  5. #5
    Io ho più o meno lo stesso problema di kiapparo.
    url dinamici riscritti in statici col mod_rewrite e pagine attualmente presenti su GG nelle due versioni.
    Tuttavia ho notato che GG nelle serp privilegia in genere quelli statici non facendo comparire quelli dinamici nelle stesse queries (si trovano solo con site.
    Ho disabilitato la pagina dinamica nel robots.txt e ho messo un permanent redirect ad ogni singolo url dinamico (sono solo una ventina) così:

    codice:
    redirect 301 /page.php?id=1 http://www.sito.ext/1/key.html
    Per ora nessun problema col filtro antiduplicazione (anzi le pagine riscritte vanno molto meglio delle precedenti), tuttavia il redirect non funziona :master: .
    Se digito (o clicco su GG) un vecchio indirizzo dinamico, mi compare l'url dinamico nella barra...

    Io penso di aspettare pazientemente che GG obbedisca al robots.txt e smetta di indexare gli url dinamici. A meno che non cominci a penalizzarmi, nel qual caso dovrò inventare qualcosa....
    Psicoterapia
    CiaoLapo Onlus
    Esaminate ogni cosa, tenete ciò che è buono

  6. #6
    Utente di HTML.it
    Registrato dal
    Jan 2001
    Messaggi
    1,742
    [supersaibal]Originariamente inviato da xnavigator
    apparte che il secondo link reindirizza al primo.. perchè pensi non sia il metodo giusto?


    se hai pagine dinamiche controlli l'id per esempio e se non è quello giusto gli passi l'header 404 [/supersaibal]
    la pagina dinamica viene coperto dal mod rewrite quindi non posso passargli l'header 404 ad ogni id corrisponde una pagina esistente..

  7. #7
    [supersaibal]Originariamente inviato da kiapparo
    la pagina dinamica viene coperto dal mod rewrite quindi non posso passargli l'header 404 ad ogni id corrisponde una pagina esistente.. [/supersaibal]

    non ho capito cosa vuoi dire. replico a senso: stesso nelle rule metti il 404

  8. #8
    Utente di HTML.it
    Registrato dal
    Jan 2001
    Messaggi
    1,742
    ciao
    allora ti faccio un esempio:
    --www.cellulartopic.com/show_scheda.php?scheda_id=714(non lo linko non si può mai sapere:P)
    cmq se nel tuo browser metti questo indirizzo noterai che la pagina ti porta tramite un redirect a:
    http://www.cellulartopic.com/cellula...orola_V3x.html

    che è la stessa pagina
    adesso io ho applicato un permanent redirect per dire a google che deve considerare solo quell'url.
    ma non a tutte le pagine è andata bene..
    quindi mi chiedevo come faccio ad eliminare quelle 182 pagine che sono ancora indicizzate con l'url dinamico?

  9. #9
    forse ho capito. è una domanda più da php però.



    nella pagina show_scheda.php all'inizio ti fai un controllo su l'array globale $_SERVER['REQUEST_URI']

    se viene passato /show_scheda.php?scheda_id=714 allora fai uscire il 404

    if ( $_SERVERecc=='show_scheda.php ecc' )
    header("404 ecc");

  10. #10
    Utente di HTML.it
    Registrato dal
    Jan 2001
    Messaggi
    1,742
    [supersaibal]Originariamente inviato da xnavigator
    forse ho capito. è una domanda più da php però.



    nella pagina show_scheda.php all'inizio ti fai un controllo su l'array globale $_SERVER['REQUEST_URI']

    se viene passato /show_scheda.php?scheda_id=714 allora fai uscire il 404

    if ( $_SERVERecc=='show_scheda.php ecc' )
    header("404 ecc"); [/supersaibal]
    quindi elimino il controllo che se il bot passava su show_scheda.php?scheda_id=714 doveva tener a mente del redirect 301 per il nuovo link è metto direttamente un 404?
    le pagine poi in html non è che vengono eliminate anche loro?


    ah AGGIUNGO:
    http://www.google.it/search?sourceid...5Fscheda%2Ephp

    ci sono cache vecchie un botto, le più recentei sono datate il 10 agosto fino ad arrivare ad aprile/maggio?(non so ma le prime non hanno nemmeno la data del bot )

    Grazie

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.