probabilmente la pagina html è utf8 e quindi quelli sono documenti in utf8

prova utf8_decode sul testo ^^