Dovrei estrarre gli elementi ripetuti da una pagina html salvata e creare quindi un'array contenente una serie di articoli.....
Nella pagina sorgente si possono trovare molti blocchi con identica struttura HTML (ma ovviamente con descrizioni differenti), come quello a seguire.
Ho provato con il seguente metodo trovando come inizio blocco (<div class=\"filetto_rosso_parco\">) e come fine blocco (<div class=\"mod_lista\">) - che dovrebbe corrispondere all'inizio del blocco articolo successivo. Purtroppo non funziona
===================================
$html = file_get_contents(pagina_da_caricare);
$regexp = "/\s<div class=\"filetto_rosso_parco\">(.*)<div class=\"mod_lista\">/siU";
preg_match_all("$regexp", $html, $matches, PREG_SET_ORDER);
====================================
<div class="mod_lista">
<div class="filetto_rosso_parco"></div>
<h3>AUDI A3 2.0 TDI "QUATTRO" TETTO,CERCHI,SENSORI,GARANZIA!</h3>
[img]......[/img]
<p class="info">Visualizza scheda completa</p>
<p class="info"><span>Colore:</span> Bianco pastello</p>
<p class="info"><span>Interni:</span> Beige Tessuto</p>
<p class="info"><span>Alimentazione:</span> Diesel</p>
<p class="info"><span>Immatricolazione:</span> 05/2007</p>
<p class="info"><span>Km:</span> 64000</p>
<p class="info"><span class="bianco">Prezzo: 19.900,00 Euro</span></p>
<p class="txt_info"><span>Equipaggiamento:</span>
Servosterzo, Immobilizzatore elettronico, ESP, Controllo trazione, Climatizzatore, Chiusura centralizzata, Cerchi in lega, Autoradio, Alzacristalli elettrici, Airbag Passeggero, Airbag laterali, Airbag, ABS</p>
</div>
Grazie a tutti per la collaborazione