Ciao a tutti, come da titolo dovrei effettuare il parsing di una pagina web attraverso la libreria htmlcleaner.
Il problema è che non riesco a catturare la sola porzione di pagina che mi interessa.
Dovrei catturare tutti i tag "[b]" che sono le stringhe assegnate a dei link all'interno di un certo div
In particolare la struttura html è la seguente :
codice:
<div id="main"  ............
    <ul>[*]
             [b]PAROLA[b]
        [*]
             [b]PAROLA2[b]
        
         ......
         ......
         ......[/list]
</div>
Come detto a me interessa soltanto la parola compresa tra [b] senza il link e,ad aggravare la mia posizione, il numero di link è variabile e non so mai quanti effetivamente ce ne sono all'interno della pagina