Ciao a tutti
Mi chiedevo come si potrebbe rappresentare un testo in UTF8 in C
Mi spiego...
Facendo:
ogni lettera è grande 1 byte. Ecco mi chiedevo come fosse possibile rappresentare un testo in utf8 dove ogni letterà può occupare da 1 byte a 4 byte.codice:char *s = "prova";
Un char * è una sequenza di byte quindi ci si può mettere di tutto, l'unico problema ovviamente è che funzioni come strlen() non funzionerebbero...inoltre confronti tipo s[0]==s[1] non andrebbero neanche.
Come si potrebbe risolvere?
Conviene creare un nuovo tipo con grandezza fissa di 4 byte e poi scorrere tutto il testo utf8 suddividendo lettera per lettera e piazzarlo dentro alla variabile di questo nuovo tipo?
Grazie