Partendo da questo topic :

http://forum.html.it/forum/showthrea...ht=descrizione


dove l'utente lamentava che per il suo sito (ho provato con quello che ha in firma e le cose combaciano ) praticamente ha delle pagine che non hanno ne titolo e ne descrizione

Fin qui nulla di nuovo.

Ora incuriosito da sta cosa ho provato a far query sul datacenter dalla toolbar di google per avere risultati in xml

ed il risultato è questo :

1) http://www.google.com/search?client=...edalbasso.com/


2) http://www.google.com/search?client=....com/&start=80


Al primo link leggo i primi url/link del sito e vedo che xml che ho da parsare è tutto con una struttura identica dove ogni <R N="1"> non presenta nessuna irregolarita
Mentre nel secondo link che ho postato vedo che ci sono delle scritte aggiunte in tutte le pagine che non vengono descritte ed intitolate e compare la dicitura:

<R N="11" MIME="application/octet-stream" L="1">

Ho notato che tutte le pagine che non vengono descritte hanno questa dicitura :

application/octet-stream

Qualcuno sa dare maggiore interpretazione a questa mia mezza scoperta ?