puoi utilizzare le Tidy, se il tuo hoster le supporta, o alternativamente usi le regexp come ti è stato già consigliato.

L'ultima alternativa è scriverti un piccolo engine forward-only per parsare l'html ma non è propriamente la cosa più semplice da fare