PDA

Visualizza la versione completa : Aggiornamento descrizioni e pagine delle serp di google


E.L.
14-10-2004, 15:17
Tempo fa avevo postato un messaggio in cui proponevo l'esistenza di più copie cache della stessa pagina.
Sembra di no.
Quello però che a volte non capisco (e che mi ha fatto propendere per quell'ipotesi) è che spesso la descrizione che compare nelle serp di G. non è sempre allineata con la copia cache della pagina corrispondente.

Mi spiego, come sappiamo la descrizione (snippet) varia sulla base della parola chiave cercata. Ora io, sempre più spesso nell'ultimo periodo, trovo descrizioni molto più vecchie (anche di un mese) rispetto alla copia cache. Come me accorgo? Beh è semplice nella descrizione compaiono termini che non sono più contenuti nella pagina sia vista in presa diretta che tramite copia cache.

Come avviene il processo di digestione di google delle nuove pagine?
Io ho questa ipotesi (perdonate se non sono motlo rigoroso, ma voglio cercare di essere più chiaro che preciso). Google associa varie descrizioni a ciascuna key presente nella pagina. La pagina viene modificata e così le descrizioni. Ma non tutte le descrizioni! Ve ne saranno alcune non modificate giacchè la key corrispondente nella pagina non esiste più. Che ne fa google di queste descrizioni? Le conserva per un lungo tempo, forse anche un mese o più, non so se per fornire un aiuto all'utente indicandogli quello com'era la pagina o per quali altri motivi, ma mi sembra che sia così.

Pensateci...

Low
14-10-2004, 15:53
Sembra di no.


Invece sì. Ha un bel po' di cache diverse, e non solo per questioni di backup. Nel file system di Google la ridondanza è un concetto basilare.

Mesi fa molti utenti storsero il naso quando lessero che GMail non permetteva all'utente di cancellare definitivamente le proprie email dagli archivi di Google. La ragione non era di business, ma strettamente tecnica. Il FS di Google funziona in modo tale che qualche "pezzo" di documento può rimanere "da qualche parte" all'interno del sistema (che è gigantesco).

http://www.cs.rochester.edu/sosp2003/papers/p125-ghemawat.pdf

E.L.
14-10-2004, 15:59
Originariamente inviato da Low
Invece sì. Ha un bel po' di cache diverse, e non solo per questioni di backup. Nel file system di Google la ridondanza è un concetto basilare.

Mesi fa molti utenti storsero il naso quando lessero che GMail non permetteva all'utente di cancellare definitivamente le proprie email dagli archivi di Google. La ragione non era di business, ma strettamente tecnica. Il FS di Google funziona in modo tale che qualche "pezzo" di documento può rimanere "da qualche parte" all'interno del sistema (che è gigantesco).

http://www.cs.rochester.edu/sosp2003/papers/p125-ghemawat.pdf

Grazie Low per la conferma. Nell'altro post nessuno mi dava credito.
In fondo un po' di ragione ce l'avevo a dire quello che ho detto.
Questo però non spiega il fatto che spesso la cache non sia allineata con lo snippet, spero che l'interpretazione che ho dato della cosa sia esatta.

Loading