salve.

ho necessità di importare dati da txt su database.
ho creato un tool apposito che mi legge i dati dal txt, li memorizza in delle variabile, esegue un mysql_real_escape() e applica una codifica utf8.

il problema è questo :

se il testo lo prendo da un doc, e poi lo copio dentro a un txt, e faccio l'import, alle volte mi fà delle codifiche strane.

esempio :

se creo un file di testo txt (con notepad per esempio), ci scrivo
"Current 93 – The Great In The Small part I [Durto]" e lo importo, me lo scrive tranquillamente.

se quel "Current 93 – The Great In The Small part I [Durto]" è in un doc file, lo copio in txt, e poi lo importo, nel database scrive "Current 93 – The Great In The Small part II [Durto]".

è come se il "trattino" nel .doc lo codifica in maniera diversa.

e quindi la mia domanda è :
c'è un modo per resettare delle codifiche precedenti in modo da avere uno standart da dove partire a convertire in utf? (perchè evidentente applica una codifica utf8 a una precedente codifica doc, anche se nel txt lo vedo senza problemi).

forse è un problema senza risposta, o forse esiste chiedo a voi!

cordiali saluti

p.s. altra cosa che mi son sempre chiesto : nel mio database salvo tutto con codifica latin1 e collation latin1_german1_ici.

se io impostassi tutte le tabelle in utf8 e collation ut8_general_ici, potrei fare a meno di convertire le stringhe prima di inserirle nel database (perchè a quel punto ci penserebbe da solo)? o devo farlo comunque? e che altri vantaggi/svantaggi avrei nel cambiare lo standart nel database?