Io ti consiglio di usare le regular expression (gli oggetti Pattern e Matcher), con cui parsi le pagine moolto + velocemente (senza metterti a parsare tutti i child tag con DOM), ovviamente se il loro codice rispetta una certa forma.