Ciao ragazzi, chiedo aiuto ai guru delle regex! Mi serve un'espressione regolare per estrapolare 4 valori dai div di una pagina html, quello che mi serve lo segno in rosso.
La pagina è composta in questo modo:
<codice inutile>
<div class='gallery' id='123456'>
<a href=''www.sito.it/gallery/contenutovariabile.html" title='Titolo gallery'>
<div class='classe1'>
<div class='classe2'>
<img class='classe3' src='www.sito.it/thumb/immaginevariabile.jpg" title="Titolo Immagine"/></div>
<span>
<div class='icona_numero_di_foto'></div>24</span></div>
<u>Titolo short<span>categoria</u></a>
<div class='qualità'><div class='fr'>100%</div>Visualizazioni: 1,250</div></div>
<codice inutile>
Tramite un ciclo preg_match/preg_match_all devo ottenere in una array le 4 porzioni dei html, ovvero: link della gallery, titolo, src della thumbnail e numero di foto presenti nella gallery.
La radice www.sito.it/gallery/ e www.sito.it/thumb/ ovviamente non cambia, forse può esere di aiuto!
Questi div (gallery) si ripetono 20 volte per ogni pagina quindi il ciclo deve ripetersi per catturare tutto.
Ovviamente prima e dopo è presente molto codice che non mi interessa.
Qualcuno può darmi una mano?

Rispondi quotando