praticamente quello che mi servirebbe è convertire i vari caratteri
non inclusi nell'insieme che hai detto ('%&£$"'èéàò ecc.) con i caratteri unicode html
in poche parole con quelli elencati da questo sito:
http://www.webenalysis.com/special-characters.asp
esiste qualcosa in java che lo faccia in automatico oppure devo creare un metodo che faccia tanti replaseAll()?