PDA

Visualizza la versione completa : [JAVA] Problema nella validazione XML


liquirizia234
01-03-2006, 10:44
Salve,

sto cercando di validare dei file Xml.
Ma ottengo una eccezione:
org.xml.sax.SAXParseException: Invalid byte 2 of 2-byte UTF-8 sequence.

Che vuol dire ?

La cosa strana che se apro il file per verificarne il contenuto, lo salvo e provo a validarlo con lo stesso meccanismo. Non ottengo pi l'eccezione precedente.

Grazie
Laura :ciauz:

LeleFT
01-03-2006, 10:48
Credo che l'XML non sia in UTF-8.
Prova a cambiare la codifica in Latin1 (ho avuto anch'io un problema simile tempo fa...)


Ciao. :ciauz:

floyd
01-03-2006, 10:49
potrebbe essere un carattere non ascii
apri il doc xml con un editor che usa il formato binario e guarda cosa contiene (come ultraedit)

liquirizia234
01-03-2006, 10:55
L'encoding nel file XML in UTF-8. E sono obbligata a tenerla cos.

Ho aperto con ultraedit il file xml ma essendo di oltre 60 MB faccio fatica a trovare la preenza di caratteri strani.

Ma perch dopo averla aperto con UltraEdit il file e salvato senza toccare nulla, la validazione funziona?

Grazie
Laura

LeleFT
01-03-2006, 10:57
Evidentemente il salvataggio ha sostituito il carattere non valido.


Ciao. :ciauz:

floyd
01-03-2006, 10:57
:bh: se usi degli editor particolari capita che mettano dei caratteri strani prima del tag <xml>
io creo gli xml con notepad

liquirizia234
01-03-2006, 10:58
Grazie mille ragazzi, ma che mi consigliate di fare?

Laura

LeleFT
01-03-2006, 11:00
Originariamente inviato da floyd
:bh: se usi degli editor particolari capita che mettano dei caratteri strani prima del tag <xml>
io creo gli xml con notepad
Allora non sono l'unico... :)


Ciao. :ciauz:

liquirizia234
01-03-2006, 11:03
Gli xml li creo a livello di codice java... non uso alcun editor.

Quando prima parlavo di ultraedit era perch in seguito all'eccezione avevo provato a visualizzarne il contenuto.
Tutto qui :)

LeleFT
01-03-2006, 11:05
Allora dovresti controllare alcuni caratteri. Ad esempio, devi trasformare tutti gli accentati nei rispettivi codici XML:

--> & egrave; (senza lo spazio)
--> & eacute; (senza lo spazio)

ecc.


Ciao. :ciauz:

Loading