Ciao!
Per ora ho risolto una parte del problema, ho salvato il "nodo" che interessa a me in un secondo file html e ora dovrei processare nodo per nodo, sottonodo per sottonodo, cioè trattare il file .html come un xml... solo che ora ho un altro problema...sto usando jdom per farlo, ma dato il codice
questo mi dacodice:Document documento = null; SAXBuilder saxBuilder = new SAXBuilder(); try{ documento = saxBuilder.build(new File(path)); } catch (JDOMException ex) { System.err.println(ex); } catch (IOException ex) { System.err.println(ex); }
com.sun.org.apache.xerces.internal.impl.io.Malform edByteSequenceException: Invalid byte 2 of 3-byte UTF-8 sequence.
In pratica se ho ben capito cerca di leggere il file con il charset utf ma a me è iso.
Esiste un sistema per ignorare il charset o settarmelo manualmente?