http://www.php.net/tidy

oppure

http://www.php.net/manual/en/domdocu...adhtmlfile.php

La tidy è sicuramente meglio, ma non è detto che il tuo hoster la fornisca (ovviamente se stai facendo un software per una intranet il problema non lo hai) mentre la dom è sicuro perché vorrebbe dire non fornire nemmeno l'xml