Salve,
sto usando JSoup per estrarre del testo da una pagina html. Funziona tutto molto bene ma c'è una cosa che mi sta dando qualche grattacapo.

Faccio un esempio.
Nella pagina ad un certo punto ho del testo in questo formato:

codice:
<div class="name"> Mario Rossi</p>
(i primi due spazi sono & nbsp; )

Io lo recupero con

codice:
Elements rows = Jsoup.parse(html).select("tr");

    //... rows iteration...
    Element e = row.select("div[class=name]");
    String name = e.text().trim();
Il problema è che la stringa risultante non è "Mario Rossi" ma " Mario Rossi", come se non facesse il trim(). Aprendo il risultato con Notepad++ ho notato che non viene converito in " " ma in un altro carattere, a quanto pare non riconosciuto come "whitespace" da trim().

Qualche idea? Guardando tra la documentazione di Jsoup non mi pare di aver trovato qualcosa di utile...