Salve a tutti,

una migrazione di server mi ha fatto venire gli ennesimi dubbi su character encoding e default charset.

Premetto che è una cosa che non mi è mai entrata in testa, ma voglio capire una volta per tutte come funziona e come deve essere.

Mi sembra di aver capito che si stia andando verso un adozione completa di UTF-8.

UTF-8 se non ho capito male è una codifica di caratteri che comprende quasi tutti i simboli esistenti nel nostro linguaggio, mentre gli altri set coprivano solo un certo tipo di caratteri, che potevano essere o occidentali, o orientali, russo e così via.

detto così è molto semplificato, però vi chiedo, è corretto?

Quello che non ho capito è:

nel momento in cui in una semplice pagina HTML codificata in utf-8 e che quindi presenta il seguente metatag:

Codice PHP:
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" /> 
ci si inseriscono caratteri come ad esempio

"à è ì ò ù"

è corretto che appaiano dei punti interrogativi?

"� � � � �"

e che quindi per evitare il tutto si debbano scrivere le corrispettive entità html?

"&amp;agrave; &amp;egrave; &amp;igrave; &amp;ograve; &amp;ugrave;"