Salve a tutti,
una migrazione di server mi ha fatto venire gli ennesimi dubbi su character encoding e default charset.
Premetto che è una cosa che non mi è mai entrata in testa, ma voglio capire una volta per tutte come funziona e come deve essere.
Mi sembra di aver capito che si stia andando verso un adozione completa di UTF-8.
UTF-8 se non ho capito male è una codifica di caratteri che comprende quasi tutti i simboli esistenti nel nostro linguaggio, mentre gli altri set coprivano solo un certo tipo di caratteri, che potevano essere o occidentali, o orientali, russo e così via.
detto così è molto semplificato, però vi chiedo, è corretto?
Quello che non ho capito è:
nel momento in cui in una semplice pagina HTML codificata in utf-8 e che quindi presenta il seguente metatag:
ci si inseriscono caratteri come ad esempioCodice PHP:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
"à è ì ò ù"
è corretto che appaiano dei punti interrogativi?
"� � � � �"
e che quindi per evitare il tutto si debbano scrivere le corrispettive entità html?
"&agrave; &egrave; &igrave; &ograve; &ugrave;"