Visualizzazione dei risultati da 1 a 2 su 2
  1. #1

    Usare JDOM o simile per parsare pagina html

    ciao a tutti,
    stò realizzando un piccolo motore di ricerca che si appoggia a wikipedia per restituire i risultati... vorrei parsare la pagina html restituita in modo simile a come si fa x i documenti xml con Jdom...esiste qualcosa del genere?

    Il codice che uso ora è questo:
    codice:
    String testo_ricerca =  this.getRequest().getParameter("search");
    URL paginaWebURL = new URL("http://it.wikipedia.org/w/index.php?title=Special%3ASearch&search="+testo_ricerca+"&fulltext=Ricerca");
                                    StringBuffer buffer = new StringBuffer();
                                    BufferedReader in = new BufferedReader(new InputStreamReader(paginaWebURL.openStream()));
                                    String inputLine;
                                    while ((inputLine = in.readLine()) != null){
                                        buffer.append(inputLine);
    [...]
    Grazie.

  2. #2
    Ciao,
    non esiste niente che faccia qlc del genere?
    Ad esempio, se volessi accedere all'attributo title di questa riga di una pag html:


    dòlkjsòldkfj kdjf lkdj fdjf djskl ZZZ</p>

    Cè niente che mi permette di navigare la pag?
    Tipo: string a = inputLine.getAttribute("title")

    Fantascienza?

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.