Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 16
  1. #1

    Pagine dinamiche: disponibilità effettiva del testo contenuto al loro interno

    Help: quanto tempo deve passare prima che un documento indicizzato da Google (indicizzazione verificabile con il comando "site:www.nomedominio.it") sia effettivamente reso disponibile nel database al quale accedono gli utenti del motore di ricerca?

    Da alcuni mesi ho verificato che Google ha indicizzato un'ottantina di
    pagine del mio sito, ma ad eccezione del testo contenuto nella home, gli altri documenti è come se non esistessero quando un utente effettua una ricerca con Google. Alcune info:

    1) Il sito è realizzato in php e le pagine vengono create in modo dinamico richiamando le varie componenti; i documenti che mi interessa indicizzare sono quelli delle sezioni principali (chi siamo, cosa facciamo, ecc.), accessibili direttamente dalla home e da tutte le altre pagine, ma soprattuto l'archivio della rassegna stampa, che consta ormai di 500 articoli. L'intenzione è quella di creare un sito orientato effettivamente ai contenuti, aggiornati ogni due/tre giorni, evitando di utilizzare uno degli espedienti da mettere in pratica per "aggirare" il problema pagine-dinamiche,
    facendo in modo che lo spider le individui come pagine-statiche (con estensione html).

    2) Ogni pagina generata dinamicamente ha un proprio title e proprie key.

    3) Gli articoli della rassegna stampa risiedono sul database e vengono richiamati dal php attraverso una strutura del tipo
    http://www.nomedominio.it/index.php?codice=100
    (oppure... "codice=101" e via di seguito). Gli articoli sono a disposizione di tutti e non solo degli utenti registrati. Google ha indicizzato alcuni documenti (sia direttamente attraverso lo spider, sia perché ho provato a registrare un paio di indirizzi "diretti"), ma a meno che il titolo dell'articolo non fosse contenuto nella home-page che Google ha nella cache, ad una ricerca effettuata con il mdr non viene individuato alcun risultato.

    4) Sul database risiede solo il titolo dell'articolo e le key, in modo tale che dopo ogni inserimento sia il server a determinare l'ordine cronologico di visualizzazione per i navigatori. Il testo degli articoli non risiede sul database, ma è digitato manualmente in un file con estensione php, che rappresenta una delle componenti richiamate durante la creazione delle singole pagine (vedi punto 1 precedente).

    5) Purtroppo, Google non sta operando come vorrei, e dopo aver
    indicizzato alcune pagine del sito, il testo contenuto in queste non
    è reso disponibile per gli utenti del mdr. Tornando alla domanda iniziale, mi chiedevo se tutto dipendeva da problemi di "lavorazione" interna, oppure se si trattava di problemi di natura logica e tecnica, per cui il problema risiede nella struttura sopra esposta.

    6) L'amarezza è maggiore perchè Arianna sembra invece aver capito al volo la strutura del sito ed ha agito nel giro di qualche settimana esattamente come mi sarei aspettato! Peccato che il bacino di utenti raggiungibili da Arianna non sia neanche lontanamente paragonable a quello raggiungibile da Google...

    Thanks.

  2. #2
    Non esiste un tempo stabilito ma sulla base del tuo post direi che a questo punto sono già state inserite o scartate.

    La seconda ipotesi non è considerabile, a meno che non si tratti di spam, quindi è possibile che le tue pagine ci siano ma siano in una posizione tale che tu non le abbia trovate.

  3. #3
    Le pagine ci sono (almeno 80 su 500), individuabili con la stringa di ricerca "site:www.nomedominio.it", ma il fatto è che il testo disponibile per l'utente che effettua la ricerca è solo ed esclusivamente quello presente nel file index.php, nel quale (seguendo i suggerimenti dei forum) ho inserito i titoli linkabili degli articoli di maggior interesse.

    Mi spiego meglio: index.php è generato richiamando i file testata.php, dx.php, sx.php, zoccolo.php e corpocentrale.php; questo ultimo file è ovviamente quello che occupa la porzione di schermo più rilevante ed è quello dove vengono visualizzati i testi degli articoli. Nella colonna di destra (file "dx.php") ho inserito un elenco con i titoli di molti articoli, cliccando sui quali appare nella colonna centrale in testo. Se un articolo si intitola "Novità sul sito HTML" ed il contenuto è composto da decine e decine di righe, un utente di Google sarà informato della presenza sul web di questo articolo se e solo digiterà come stringa di ricerca il testo "Novità sul sito HTML", dato che è presente il link in index.php. Se invece digiterà qualsiasi altra parola e/o frase contenuta all'interno del testo dell'articolo, il risultato della ricerca sarà nullo, vale a dire la url dell'articolo (del tipo http://www.nomedominio.it/index.php?codice=103) non apparirà tra i risultati della ricerca dell'utente, anche se il comando "site:www.nomedominio.it" fa apparire la url tra le pagine "indicizzate" da Google.

    Arianna invece si comporta come mi sarei aspettato, vale a dire un utente può digitare qualsiasi parola e/o frase contenuta all'interno dell'articolo sopra indicato e la url http://www.nomedominio.it/index.php?codice=103 apparirà tra i risultati offerti dal mdr.

    Spero di essere stato chiaro. In ogni caso, sono disposto anche a postare la url del sito, in modo tale che tu possa eventualmente fare un paio di controlli (se non fosse possibile postare la url sul forum, se sarai così cortese da mandarmi una e-mail, te la invierò per posta elettronica). Grazie ancora.

  4. #4
    Utente di HTML.it
    Registrato dal
    Jul 1999
    Messaggi
    457
    Le variabili sono effettivamente tante: interne al sito ma anche esterne.
    A cominciare dal codice html generato dal server: hai verificato che sia corretto, pulito e leggero? Nei menu i link alle pagine di dettaglio (id=1 etc.) sono normali href? Hai un elenco statico che linchi le singole pagine dinamiche: in molti casi e' utile avere una mappa del sito (o della sezione) che svolge la duplice funzione nei confronti sia degli utenti che i mdr.
    Hai un numero congruo di link esterni al tuo sito? Aumentare la popolarità srve anche nei confronti dei mdr.
    Il PR di GG anche se di difficile "lettura" rimane un fattore determinante: hai registrato il sito nelle directory classiche dmoz e yahoo?
    Da quanto tempo e' in linea il sito?
    Buon proseguimento.

  5. #5
    A cominciare dal codice html generato dal server: hai verificato che sia corretto, pulito e leggero?
    Stante il mio stato attuale di conoscenze, direi che è tutto O.K.
    Nei menu i link alle pagine di dettaglio (id=1 etc.) sono normali href?
    Si.
    Hai un elenco statico che linchi le singole pagine dinamiche: in molti casi e' utile avere una mappa del sito (o della sezione) che svolge la duplice funzione nei confronti sia degli utenti che i mdr.
    No. La giustificazione è questa: prima o poi inseriremo una mappa per aiutare i visitatori a navigare nel sito, ma a livello di semplice usabilità, in quanto gli articoli che sono disponibili per la lettura sono ormai più di 500 e la generazione di un elenco non potrebbe che essere gestita dal server in automatico. Ed una soluzione di questo tipo è già presente sul sito, dato che il link alla nostra "Rassegna stampa" non fa altro che ordinare cronologicamente gli articoli (presentando i titoli linkabili con un href), trenta per ogni pagina (posso inserire oggi un articolo datato 2002; nella "Rassegna stampa" l'articolo non è in cima alla lista, ma viene ordinato cronologicamente). Questa soluzione sembra non piacere a Google, nel senso che la pagina della "Rassegna stampa" è nella cache del mdr, ma non i 500 e passa titoli (solo quelli presenti nella colonna di destra della index.php, come spiegato nel messaggio di apertura della discussione).
    Hai un numero congruo di link esterni al tuo sito?
    Il comando "link:www..." fornisce tre siti come risultato. Il comando "url:www..." ne fornisce solo uno.
    hai registrato il sito nelle directory classiche dmoz e yahoo?
    Il sito è in "fase di pubblicazione" da cinque mesi.
    Da quanto tempo e' in linea il sito?
    Da un anno.
    Buon proseguimento.
    Anche a te e grazie per le risposte.

  6. #6
    Utente di HTML.it
    Registrato dal
    Jul 1999
    Messaggi
    457
    Originariamente inviato da Marco1965
    Il comando "link:www..." fornisce tre siti come risultato. Il comando "url:www..." ne fornisce solo uno.
    Devi aumentre il numero di link alle pagine d'elenco ;-)
    In via prioritaria devi trovare link esterni al tuo sito, un po' di pubbliche relazioni e' la soluzione.
    Secondariamente e in via sperimentale potresti provare ad aumentare i lnik interni verso i soliti elenchi, questo da fare in prima battuta con quelle pagine GIA' nei db di GG.

    ps: la mappa e' strategica, e' da fare sempre :-)

  7. #7
    Scusa, ma non ho capito quali sono i "soliti elenchi". Se ti riferisci alla colonna contenete l'elenco dei principali articoli, è presente in tutte le pagine del sito.

    Quanto alla mappa, ha senso creare una mappa espandibile, vale a dire una mappa dove è presente il link alla "Rassegna stampa", con la possibilità di espandere il contenuto e visualizzare i titoli di TUTTI gli articoli in rassegna (ripeto: più di 500...)??? Da qualche parte ho letto che sul web sono malvisti i documenti eccessivamente lunghi e che è bene suddividerli in più parti; ma lo stesso autore sosteneva che se un documento è lungo e rappresenta una sorta di "trattato" difficilmente suddivisibile, deve essere lasciato integro (non vorrei aprire una polemica, ma molti esperti del web con cui parlo regolarmente odiano i testi lunghi, sostenendo che sul web occorre dare dei semplici flash, senza entrare nel merito delle questioni; ma c'è un piccolo particolare: il sito di cui sto parlando ha carattere prettamente tecnico ed è orientato al contenuto, non a rappresentare una vetrina promozionale; e molti articoli disponibili non sono presenti in altri siti, o lo sono solo sui siti a pagamento; quindi, non si tratta di un problema di "vetrina" o di posizionamento sui mdr, ma di rendere fruibili documenti che altrimenti non lo sarebbero). Anche se nel caso della mappa espandibile non si tratta di un articolo o di un documento di approfondimento tecnico, mi sembra che presentare un unico elenco con 500 titoli sia un po' eccessivo (e quando diventeranno 1000?)...

    Mi interesserebbe il tuo parere.

  8. #8
    Utente di HTML.it
    Registrato dal
    Jul 1999
    Messaggi
    457
    Originariamente inviato da Marco1965
    Scusa, ma non ho capito quali sono i "soliti elenchi". Se ti riferisci alla colonna contenete l'elenco dei principali articoli, è presente in tutte le pagine del sito.
    Sì mi riferivo a quel tipo di elenchi che a ben guardare potrebbero essere loro stessi mappa di sezione. In questo caso potresti forzare GG aumentando / modificando il numero e la posizione dei link che puntano agli elenchi
    Mi interesserebbe il tuo parere.
    Senza vedere il sito si puo' solo ipotizzare, secondo me con pochi link in ingresso e senza essere in dmoz è abbastanza normale che GG non scenda nell'indicizzazione. Quello che si potrebbe provare è di modificare "radicalmente" il numero di documenti che lincano gli elenchi che aprono i dettagli. L'ipotesi che faccio è che per qualche ragione GG non veda le tue pagine, se così fosse cambiando la struttura complessiva dei link "forse" si potrebbe svegliare forzandolo a indicizzare i dettagli.
    Al momento non ho altre ipotesi.

  9. #9
    Sì mi riferivo a quel tipo di elenchi che a ben guardare potrebbero essere loro stessi mappa di sezione. In questo caso potresti forzare GG aumentando / modificando il numero e la posizione dei link che puntano agli elenchi
    O.K.
    ...secondo me con pochi link in ingresso e senza essere in dmoz è abbastanza normale che GG non scenda nell'indicizzazione.
    Non mi resta che sperare che Dmoz acceleri i tempi, concentrandomi nel frattempo sulle "pubbliche relazioni".
    Quello che si potrebbe provare è di modificare "radicalmente" il numero di documenti che lincano gli elenchi che aprono i dettagli. L'ipotesi che faccio è che per qualche ragione GG non veda le tue pagine, se così fosse cambiando la struttura complessiva dei link "forse" si potrebbe svegliare forzandolo a indicizzare i dettagli. Al momento non ho altre ipotesi.
    Molto, molto gentile!

  10. #10
    Utente di HTML.it L'avatar di beke
    Registrato dal
    Mar 2003
    Messaggi
    1,248
    L'ipotesi che faccio è che per qualche ragione GG non veda le tue pagine, se così fosse cambiando la struttura complessiva dei link "forse" si potrebbe svegliare forzandolo a indicizzare i dettagli. Al momento non ho altre ipotesi.
    BO ha detto una cosa, a mio avviso, molto saggia, la struttura dei link in un sito contribuisce molto a far comprendere al bot quali siano le cose importanti.

    Tieni conto che la propensione del bot a scandagliare il sito, le sue sezioni e le sue pagine viene influenzata fortemente dalla presenza di link esterni o interni a dette entità.

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.