Salve,
sto usando JSoup per estrarre del testo da una pagina html. Funziona tutto molto bene ma c'è una cosa che mi sta dando qualche grattacapo.
Faccio un esempio.
Nella pagina ad un certo punto ho del testo in questo formato:
(i primi due spazi sono & nbsp; )codice:<div class="name"> Mario Rossi</p>
Io lo recupero con
Il problema è che la stringa risultante non è "Mario Rossi" ma " Mario Rossi", come se non facesse il trim(). Aprendo il risultato con Notepad++ ho notato che non viene converito in " " ma in un altro carattere, a quanto pare non riconosciuto come "whitespace" da trim().codice:Elements rows = Jsoup.parse(html).select("tr"); //... rows iteration... Element e = row.select("div[class=name]"); String name = e.text().trim();
Qualche idea? Guardando tra la documentazione di Jsoup non mi pare di aver trovato qualcosa di utile...

Rispondi quotando