Ciao,
ho un sistema che prende il testo da alcuni siti e poi esegue un parsing con varie espressioni regolari.
I file sono due, un index.html (in cui l'utente inserisce l'url del sito e alcune keyword da ricercare) e un process.php in cui viene appunto estratto il contenuto ed eseguito il parsing.
Il problema è la codifica dei caratteri.
Avevo settato sia l'index.html sia il process.php in UTF-8 e, con siti unicode, tutto funzionava.
Se però vado a prendere in input un sito con ad esempio charset ISO 8859-1/occidentale, le keyword non vengono trovate.
Come posso risolvere?