Sto provando a fare un programma in PHP che associ ad una lista di stringhe di ricerca la posizione ottenuta da un dato sito su google.
So che questo lavoro lo fanno già altri programmi, ma ho notato che i risultati non sono sempre attendibili.
Se devo cercare la stringa :
stringa da cercare,
il mio programma esegue il comando:
se nella stringa $s non trova il collegamento al sito cercato prosegue nelle pagine successive fino ad una "profondità" massima fissata.Codice PHP:$nome = "http://www.google.com/search?hl=it&q=stringa+da+cercare&btnG=Cerca+con+Google&lr=";
$s = file_get_contents($nome) or $err = true;
Il programma funziona, ma i risultati ottenuti sono lievemente diversi da quelli che si ottengono eseguendo la stessa ricerca dal Browser (Explorer o Firefox). Ciò è dovuto al fatto che la stringa $s contiene un HTML diverso da quello della pagina aperta dal Browser; la differenza consiste nel fatto che l'ordine dei risultati è diverso.
Questo comportamento potrebbe essere dovuto al fatto che google controlla l'intestazione dei pacchetti che gli arrivano rispondendo in maniera diversa al variare del Browser? In questo caso penalizzando gli accessi che non vengono effettuati in maniera automatica?
Avevo pensato di utilizzare un proxy che consenta di modificare al volo le intestazioni dei pacchetti, ma la soluzione mi pare scomoda. C'è un metodo più semplice per simulare un accesso da parte di un Browser?
Grazie!![]()

Rispondi quotando