Visualizzazione dei risultati da 1 a 3 su 3
  1. #1
    Utente di HTML.it
    Registrato dal
    Nov 2007
    Messaggi
    24

    [JAVA] Parser html con xml bean, ma non va coi caratteri speciali

    Salve a tutti,
    avendo bisogno di un parser html (voglio recuperare informazioni contenute in alcune pagine web) e avendo avuto a che fare con xmlbeans di apache ho provato a mettere insieme le cose.
    Ho preso uno schema di xHtml (a proposito ne ho trovati tre diversi) e ho creato tramite xmlbeans le classi corrispondenti. Quando vado a fare il parsing della pagina xò non riconosce i caratteri speciali tipo gli spazi (in html si usa &nbsp per indicare lo spazio) e solleva un eccezzione quando li incontra.
    come posso risolvere? e che ne dite del mio metodo per parsare l'html?
    grazie a tutti!!

  2. #2
    Utente di HTML.it
    Registrato dal
    Nov 2007
    Messaggi
    24
    qual'è il problema nessuno conosce xml beans? e pure in quel caso nessuno si avventura a dare una possibile soluzione diversa?

  3. #3
    Ho utilizzato xmlbeans anche se utilizzo prevalentemente JAXB e comunque esso sono parser XML il quale segue rigide regole strutturali e grammaticali a differenza dell'HTML per cui non è oppurtuno utilizzarli per parserizzare appunto l'HTML. Comunque vi sono varie librerie adatte allo scopo. Io non ho mai avuto la necessità di utilizzarle ma prova a dare un'occhiata a questi HTML Parser
    "Mai discutere con un idiota. Ti trascina al suo livello e ti batte con l'esperienza." (Oscar Wilde)

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.