utilizzo il latin1_swedish_ci ma avevo già provato l'utf8 general e mi dava problemi simili, purtroppo essendo flussi xml di diversa natura l'uno annulla l'altro problema e viceversa.

per questo motivo pensavo di fare uno script riparatore che impostando delle coppie di caratteri mi andasse a cercare e sostituire quelle non corrette