Buongiorno a tutti, vi sottopongo il seguente problema:
Vorrei effettuare il parsing di una pagina html (partendo dall'url della pagina stessa in cui è incluso il web user control che effettua l'operazione) per poi calcolarne la keyword density al fine di popolare una tag cloud (sto utilizzando questo semplice controllo http://www.codeproject.com/useritems/cloud.asp che renderizza un array di elementi contenente le keywords con tag e peso, cioè numero di ricorrenze nella pagina).
Al momento effettuo queste operazioni:
HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://www.jabawack.it");
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
StreamReader resStreamReader = new StreamReader(response.GetResponseStream());
string pagina = resStreamReader.ReadToEnd();
Il problema è che facendo in questo modo ottengo l'html puro della pagina, invece vorrei avere "l'encoding", per intenderci quello che il browser visualizza, ripulito da tutti i markup e tag html, javascript, .net e compagnia bella.
Vi viene in mente un modo x effettuare quest'operazione?
Dev'essere semplice ma non trovo qualche funzione che effettui quest'operazione-
Grazie, saluti

Rispondi quotando
