'giorno!![]()
ho un problemino con l'importazione del testo in un sb mysql.
il testo è contenuto in un file .html il problema sta nel fatto che molte volte il testo è stato copiato e incollato da word (tengo a precisare che non l'ho fatto io, qundi non datemi la colpa) e sbattuto nella pagina senza tener conto delle schifezze che word si porta appresso.
ora, l'importazione nel db l'ho fatta, ma quando vado a visualizzare il testo vedo tutti i caratteri "strani" che quel simpaticone di word si è portato appresso, quindi vedo una cosa del genere:
"Tempo della Carne - Il Carnevale ovvero Levare la carneIl 17 gennaio inizia il far festa con il vecchio maiale dell'anno passato ed 蠩l Carnevale, cio蠩l levare la carne e banchettare. Cos젬'inizio del Carnevale eredita appieno la natura bifronte di Giano e del suo mese..."
ecco quei caratteri strani che vedete sono quelli importati da word, io volevo chiedere esiste uno script che mi "ripulisca" da questi fastidi? o magari un'espressione regolare che riconosca questi caratteri e li converta nei relativi char html.
io ho provato a fare un qualcosa del tipo htmlentities in inserimento e html_entity_decode in output, ma non risolvo niente.
voi conoscete qualche alterntiva? e/o scappatoia?
grazie mille!![]()