salve.
ho necessità di importare dati da txt su database.
ho creato un tool apposito che mi legge i dati dal txt, li memorizza in delle variabile, esegue un mysql_real_escape() e applica una codifica utf8.
il problema è questo :
se il testo lo prendo da un doc, e poi lo copio dentro a un txt, e faccio l'import, alle volte mi fà delle codifiche strane.
esempio :
se creo un file di testo txt (con notepad per esempio), ci scrivo
"Current 93 – The Great In The Small part I [Durto]" e lo importo, me lo scrive tranquillamente.
se quel "Current 93 – The Great In The Small part I [Durto]" è in un doc file, lo copio in txt, e poi lo importo, nel database scrive "Current 93 – The Great In The Small part II [Durto]".
è come se il "trattino" nel .doc lo codifica in maniera diversa.
e quindi la mia domanda è :
c'è un modo per resettare delle codifiche precedenti in modo da avere uno standart da dove partire a convertire in utf? (perchè evidentente applica una codifica utf8 a una precedente codifica doc, anche se nel txt lo vedo senza problemi).
forse è un problema senza risposta, o forse esistechiedo a voi!
cordiali saluti
p.s. altra cosa che mi son sempre chiesto : nel mio database salvo tutto con codifica latin1 e collation latin1_german1_ici.
se io impostassi tutte le tabelle in utf8 e collation ut8_general_ici, potrei fare a meno di convertire le stringhe prima di inserirle nel database (perchè a quel punto ci penserebbe da solo)? o devo farlo comunque? e che altri vantaggi/svantaggi avrei nel cambiare lo standart nel database?