Originariamente inviato da daniele_dll
io ho usato 2 byte per definire quei caratteri

水 -> & # x 6C 34 ;

6C e 43 e la coppia di byte utilizzati per rappresentare il simbolo ... ovviamente sono rappresentati in codici esadecimali
Non devi confondere il codice unicode che usi per identificarlo con la rappresentazione effettiva in utf-8.

Quel codice che tu hai scritto viene rappresentato su 3 byte in utf-8, perché nel primo byte sono presenti le informazioni sulla lunghezza del carattere.