Non devi confondere il codice unicode che usi per identificarlo con la rappresentazione effettiva in utf-8.Originariamente inviato da daniele_dll
io ho usato 2 byte per definire quei caratteri
水 -> & # x 6C 34 ;
6C e 43 e la coppia di byte utilizzati per rappresentare il simbolo ... ovviamente sono rappresentati in codici esadecimali
Quel codice che tu hai scritto viene rappresentato su 3 byte in utf-8, perché nel primo byte sono presenti le informazioni sulla lunghezza del carattere.