salve a tutti, dovrei estrapolare dei dati da mettere in un db da alcune pagine html, ho scelto perl su consiglio di un mio amico ma non so dove mettere le mani, quindi se ci sono metodi anche in Java sono ben accetti.

La pagina principale è un elenco con relativi collegamenti, esempio:
......
primo elemento</font>[/b]</td>
</tr>
<tr valign='Top'><td><font size='2' color='#ff0000' face='Verdana'>
secondo elemento</font>[/b]</td>
</tr>
.......

io devo prendere solo "primo elemento" , "secondo elemento",....

poi di "primo elemento" e anche degli altri devo andare al collegamento href, che sarà un altra pagina html dove vi è una tabella con gli attributi dell'elemento.

"primo elemento" prima pagina html
"attributi primo elemento" seconda pagina html

è possibile quindi avere alla fine un elenco ordinato di elementi con i lori rispettivi attributi?