Usare JDOM o simile per parsare pagina html

**nrocco** · 31-07-2007, 16:39

ciao a tutti,
stò realizzando un piccolo motore di ricerca che si appoggia a wikipedia per restituire i risultati... vorrei parsare la pagina html restituita in modo simile a come si fa x i documenti xml con Jdom...esiste qualcosa del genere?

Il codice che uso ora è questo:

codice:

String testo_ricerca =  this.getRequest().getParameter("search");
URL paginaWebURL = new URL("http://it.wikipedia.org/w/index.php?title=Special%3ASearch&search="+testo_ricerca+"&fulltext=Ricerca");
                                StringBuffer buffer = new StringBuffer();
                                BufferedReader in = new BufferedReader(new InputStreamReader(paginaWebURL.openStream()));
                                String inputLine;
                                while ((inputLine = in.readLine()) != null){
                                    buffer.append(inputLine);
[...]

Grazie.

**nrocco** · 19-09-2007, 19:25

Ciao,
non esiste niente che faccia qlc del genere?
Ad esempio, se volessi accedere all'attributo title di questa riga di una pag html:

dòlkjsòldkfj kdjf lkdj fdjf djskl ZZZ</p>

Cè niente che mi permette di navigare la pag?
Tipo: string a = inputLine.getAttribute("title")

Fantascienza?

Discussione: Usare JDOM o simile per parsare pagina html

Strumenti discussione

Ricerca discussione

Visualizza

Usare JDOM o simile per parsare pagina html

Permessi di invio