Salve a tutti,
avendo bisogno di un parser html (voglio recuperare informazioni contenute in alcune pagine web) e avendo avuto a che fare con xmlbeans di apache ho provato a mettere insieme le cose.
Ho preso uno schema di xHtml (a proposito ne ho trovati tre diversi) e ho creato tramite xmlbeans le classi corrispondenti.Quando vado a fare il parsing della pagina xò non riconosce i caratteri speciali tipo gli spazi (in html si usa   per indicare lo spazio) e solleva un eccezzione quando li incontra.
![]()
come posso risolvere? e che ne dite del mio metodo per parsare l'html?
grazie a tutti!!![]()

Quando vado a fare il parsing della pagina xò non riconosce i caratteri speciali tipo gli spazi (in html si usa   per indicare lo spazio) e solleva un eccezzione quando li incontra.
Rispondi quotando