Ciao a tutti,

Ho sviluppato un programma Java che prende dei file doc in una cartella, legge le varie righe (il documento è diviso in sezioni) e carica tale righe come meta tag per la ricerca.

Tale documento va inserito nel sistema DMS Knowledge Tree che usa UTF-8

Caricando il word si ha però problemi con accenti o caratteri particolari (chiocciole e cancelletti)

Pensavo ad una soluzione con questi caratteri in un array dicendo poi al programma di convertirli nel corretto codice per utf-8.

Esistono delle best-practice per questo problema o porzioni di codice già testate?

Grazie