Tip: le regex sono una pessima idea per fare parsing dell'HTML, dato che questo ha una grammatica più complessa di quelle esprimibili via regex (il problema fondamentale è la nidificazione dei tag); ti consiglio invece di impiegare un parser di "tag soup" (come viene definito l'HTML non valido che costituisce il 90% del web ) come questo, che effettua un parsing "rilassato" dell'HTML fornito e ti restituisce una struttura DOM che puoi interrogare in maniera semplice.