Partendo da questo topic :
http://forum.html.it/forum/showthrea...ht=descrizione
dove l'utente lamentava che per il suo sito (ho provato con quello che ha in firma e le cose combaciano ) praticamente ha delle pagine che non hanno ne titolo e ne descrizione
Fin qui nulla di nuovo.
Ora incuriosito da sta cosa ho provato a far query sul datacenter dalla toolbar di google per avere risultati in xml
ed il risultato è questo :
1) http://www.google.com/search?client=...edalbasso.com/
2) http://www.google.com/search?client=....com/&start=80
Al primo link leggo i primi url/link del sito e vedo che xml che ho da parsare è tutto con una struttura identica dove ogni <R N="1"> non presenta nessuna irregolarita
Mentre nel secondo link che ho postato vedo che ci sono delle scritte aggiunte in tutte le pagine che non vengono descritte ed intitolate e compare la dicitura:
<R N="11" MIME="application/octet-stream" L="1">
Ho notato che tutte le pagine che non vengono descritte hanno questa dicitura :
application/octet-stream
Qualcuno sa dare maggiore interpretazione a questa mia mezza scoperta ?