salve a tutti per un'azienda devo realizzare una specie di spider che girerà in una intranet
i dati che dovrò recuperare da ciascuna pagina sono sempre gli stessi e stavo cercando un modo per identificare con precisione delle "label" in modo tale da poterle identificare tramite regExp .
Il primo problemino è il seguente recuperato il codice di una pagina dovrei iterare tra tutti i links che hanno come testo la voce "Dettagli magazzino"
quindi ipotizzando che il link sia cosi composto
Dettagli magazzino
quale sarebbe la migliore regExp per identificare appunto la stringa DETTAGLI MAGAZZINO e poi recuperare il contenuto di href e quindi seguire il link ?!
spero di essere stato chiaro![]()