usa sempre UTF-8 altrimenti considera le entities html